본문 바로가기
서버,보안

웹로그 분석 프로그램 설치하기

by 세이박스 2009. 6. 9.
반응형
1. 웹로그 분석??
2. Accesswatch 설치
3. accesswatch.cfg 환경설정
4. 접속 통계 분석 작업
5. 접속 통계 분석 작업
6. 분석 결과 확인



1. 웹로그 분석??    Top

웹사이트접속통계를 하여 알 수 있는 정보들을 구체적으로 분석하여 보면 다음과 같다.
● 어디에서 방문했는가? ( IP Address 또는 Domain)
● 언제 방문했는가? (방문한 시간)
● 어떤방법으로 방문을 했는가? (GET 또는 POST)
● 어떤 브라우즈로 사용했는가? (Netscape 또는 익스플로러)
● 어떤 페이지를 보고 갔는가? 


2. 설치    Top

설치는 다운 받은 압축파일을 풀어주는것으로 끝이 난다.
다운로드 : http://www.accesswatch.com/download/src/103049/accesswatch-23.tar.gz
파일을 주로 /usr/local/에 설치한다. (압축을 풀면 aw 라는 디렉토리가 생긴다.)
절대경로는 /home/sspark/public_html/aw 가 된다.

파일 속성은
● aw-parser : 로그분석을 위한 파싱작업을 위한 스크립트
● aw-report : 파싱된 내용을 html문서로 만들어 config파일에서 지정된 디렉토리에 저장해 주는 스크립트.
(예 $reportBase = "/home/sspark/public_html/aw/report")
● cfg : 환경설정 파일을 저장하고 있는 디렉토리
● report : 분석결과를 저장하기 위한 디렉토리(/home/sspark/public_html/aw/report) 이다. 


3. accesswatch.cfg 파일 설정하기    Top

환경설정파일은 accesswatch.cfg라는 파일이며 이파일을 vi등의 에디터로 설정을 해줘야합니다.
이 파일이 존재하는 위치는 /home/sspark/public_html/aw/cfg/accesswatch.cfg가 됩니다.

# AccessWatch 사용자 환경설정정보 파일 ###
# 이들 옵션에 대한 것들은 아래사이트를 참조한다.
#
#
# 온라인 상(http://www.accesswatch.com/license/)에서 license등록을 할 수있으며
# AccessWatch를 사용하는 클라이언트 또는 도메인네임 각각을 등록해야 한다.
#
##########################################################
##### 사이트 정보 기록 #####
##########################################################

$accessLog = "/home/sspark/logs/access_log";
# 로그파일의 위치 정확히 파일이름(access_log)까지 정확히 지정해 주어야한다.
# 일반적으로는 /usr/local/lib/httpd/logs/access_log 또는
# /usr/local/apache/logs/access_log 이며
# 만약 모른다면 서버 관리자나에게 문의하거나 또는
# 다음의 명령어(find)로 확인을 할 수 있다.
# "$find / -name access_log -print"
#
$DNSlookups = 0;
# access_log에 hostname(도메인) 대신에 IP address가 기록되었다면 '1'로 셋팅한다.

$defaultPage = "index.html";
# 디렉토리만 지정했을때 찾게될 기본 문서를 지정한다.

$includeURL = ".*";
$compressdata = 1;
$compresscommand = "gzip -9fc";
$catcompresscommand = "gunzip -c";
$compresssuffix = "gz";
# gzip/gunzip이 시스템에 설치되어 있지 않다면 $compressdata = 0 로 설정한다.
# gzip이 path로 잡혀있지 않다면 절대경로로 명령을 지정해야 한다.
# 예를 든다면 eg "/usr/local/bin/gzip"

$excludeURL = ".gif|.jpg|.jpeg|.xbm";
# 분석하는 도중 count하지 않을 파일타입을 지정한다.
# 예를 들어 페이지 안에 있는 이미지파일(*.gif, *.jpg등)은
# 카운터에서 빼려고 할때 지정하는 옵션이다.

$reportBase = "/home/sspark/public_html/aw/report";
# 분석결과가 저장될 위치, 결과를 웹으로 보고자 할 때 이 디렉토리까지 지정해서 보게된다.

$siteName = "sitename(manualand)";
# "사이트 이름"으로 분석결과를 웹으로 보여줄 때 맨 왼쪽상단에 사이트이름을 보여주게 된다.

$siteBaseURL = "http://www.manualand.co.kr";
# 사이트의 기본 URL

$orgname = "orgname(MANUAL LAND)";
# "기관이름(회사이름)"으로 결과페이지에서 기관이름으로 사용하게 된다.

$orgdomain = "orgdomain(manualand.co.kr)";
# "기관 도메인"

$excludeHosts = "";
# access_log파일중 access된 것에서 제외할 호스트들을 나열한다.

##### 프로그램 옵션 #####

$maxPagesToList = -1; # sets the maximum number of entries in
$maxDomainsToList = -1; # the corresponding tables. Set to -1 to
$maxHostsToList = 15; # show all entries (may be *big*!), or
$maxRefsToList = 10; # 0 to hide the table completely.
$maxAgentsToList = 15;

# 분석결과에서 볼 수 있는 각 항목들의 최대 수치를 지정한다.
# 제한없이 모두 수용하려면 "-1"로 셋팅하고
# 해당 항목을 제외(숨김)하려면 "0"으로 셋팅한다.

$customFooter = <
# 여기에는 각 페이지마다 보여줄 꼬릿말을 지정한다.

EOM
1;
###############################################################################
########### End - AccessWatch Custom Configuration #####################
############################################################################### 


5. 접속 통계 분석 작업    Top

수정 예:
- 홈페이지디렉토리 : /home/sspark/public_html/
- accesswatch의 홈디렉토리 : /home/sspark/public_html/aw/
- 접속로그파일의 저장위치 : /home/sspark/logs/access_log
- 분석결과가 저장될 디렉토리 : /home/sspark/public_html/aw/report/

aw-parser와 aw-report파일을 열어서 perl의 경로가 맞는지 확인한다.
대부분 perl의 경로는 /usr/bin/perl 또는 /usr/local/bin/perl로 되어 있으며
# whereis perl
또는
# find / -name perl -print
라 해서 찾아본다.
그런 후
# ./aw-parser.pl
# ./aw-report.pl
해서 작업한다.
결과는 다음과 같다.

이 작업을 할 때에 발생하는 대부분의 경우는 로그파일 즉, access_log파일의 위치를 정확하게 지정하지 못해서 발생한다.
작업 후에,
URL : http://www.manualand.co.kr/aw/report/ 또는
URL : http://www.manualand.co.kr/aw/report/index.html로 확인. 


6. 분석 결과 확인    Top

● Summary : 통계의 전체적인 요약
● Pages : 각 페이지별 엑세스 건수와 통계
● Domains : 도메인을 통해 국가별 방문정보
● Hosts : 어디로부터 많이 들어왔나에 대한 건수와 통계
● Hourly : 시간대별 접속건수를 막대그래프로 보여준다.
● Days : 일별 접속건수를 막대그래프로 보여준다.

① Summary


ⓐ 총 hit 건수
ⓑ 총 access 건수
ⓒ 각 방문자들이 본 평균 페이지 수
ⓓ 각 방문자들에게 다운로드 된 평균용량
ⓔ 전체 방문건수의 유일방문건수에 호스트들의 평균방문건수
ⓕ orgname에서 지정한 곳으로 부터의 방문건수
ⓖ 외부네트워크로부터의 방문건수

② Pages


ⓐ 분석기간동안의 총 방문 호스트 수
ⓑ 각 호스트들이 본 평균 페이지 수
ⓒ 각 호스트들로 다운된 평균용량
ⓓ 각 페이지 위치에 대한 접속건수와 백분비

③ Domains


1단계에 해당하는 도메인(com, org, net, kr, jp등)별로 통계건수

④ Hosts

⑤ Hourly


ⓐ 시간대별 접속건수에 대한 막대그래프 정보
ⓑ 시간당 평균 Hit 수
ⓒ 시간당 최대 Hit 수
ⓓ 일평균 Hit 수

⑥ Days


ⓐ 일별 접속건수에 대한 막대그래프 정보와 수치정보
ⓑ 일평균 Hit 수
ⓒ 일별 최고 Hit 수
ⓓ 일별 최저 Hit 수

[출처] 세이박스 - http://www.saybox.co.kr/bbs/board.php?bo_table=board01&wr_id=27


첨부파일은 세이박스에서 다운 받으세요! ^^


반응형

'서버,보안' 카테고리의 다른 글

리눅스에서 한글 깨짐 문제 해결  (0) 2009.06.09
리눅스에서 데이타별 자동 백업하기  (0) 2009.06.09
리눅스 에서 하드 추가  (0) 2009.06.09
리눅스 fstab 리드온리 문제 해결  (0) 2009.06.09
리눅스 명령어  (0) 2009.06.09
mail 서버 구축하기  (0) 2009.06.09
리눅스 rpm 사용법  (0) 2009.06.09
IP Address 변경 및 확인  (0) 2009.06.09