Apacheアクセスログと私(どんな情報を見てみたいか)

Apacheのアクセスログのうち,どの行を省くか.3つ考え方がある.

  1. 足し算
    必要な行を残していく..htmlや.shtmlなど,拡張子で区別するか?その場合,「/」で終わっている行も残すかどうかが問題だ.あと,.cgiも問題だろうな.
  2. 引き算
    いらない行を消す.とりあえず,.gif,.jpg,.css,,jsを消しといて,区別する拡張子を様子を見ながら増やしたらよいだろうか.この方が,見落としを洗い出せていいかもしれない.
  3. もっと複雑に
    同じIPのものをひとくくりにする.その上で,refererが同じものを洗い出す.残す行を決めるときは,.html・.shtml(必ず残す)>他のファイルという優先順位にする.

だいたいこんな感じだろうか.3をやるのが,一番正確なのだろうが,労力が報いられるほど他の方法と結果が違いそうにない.2を選ぶのが無難か.

あとは何が分かればいいか.

他になにかあるかなぁ.

日時: 2004年9月28日 | PC/Web > Ruby |

コメントを投稿

(空欄でもかまいません)

(メールアドレスは管理人に通知されますが,Web上には表示されません)

Powered by Movable Type