ログの切り出し
ウェブのアクセスログを毎週Webalizerで解析しています。もう2年くらいやっていることなんですが、とあるディレクトリ以下のアクセスログがなぜか昨年の8月と9月だけ抜けているとのこと。むぅ、多分人為的なチョンボです。
ということで昨年の8月9月のログだけを抜き出して再集計。そこで正規表現ですよ。いままでの知識だとこんな風に書いていたとおもう。
$ grep '[0-3][0-9]/[AS][ue][gp]/2006:' access_log > access_log.aug_sep
とかなんとか。egrepだとこんな表現。
$ egrep '[0-3]\d/(Aug|Sep)/2006:' access_log > access_log.aut_sep
どっちが早いんだろう。