ログを日付でソート
Webアクセスのログをrsyslog経由で一台のサーバにまとめていますが、ちょっとした時間のズレだかなんだかでログが時間順にならないことがあります。気にしないってのも魅力的な解決策なんですが、せっかくなのでどうにか使用ってことで2009年8月20日のエントリで書いたような力技でソートしていました。これ何やってるかというと、
- ログを一日づつ切り出す。
- pythonで日付部分をunixdateへ変換。
- 変換したunixdateをキーにしてソートしてconcat。
- unixdateをCLF的な日付表現に戻す。
ってな感じ。
ちょっと面倒。なのでsortでできないかgoogle先生に聞いたところ http://kame-t.hatenablog.jp/entry/20120117/1326776963 という先達を発見。なるほど、カラムを指定して優先度をつけながらsortすればいいのか。ありがたく使わせていただきます。
スクリプトの行数が半分くらいになりました。