2007/02/04(日) NMZ.slogの整理

 Namazuの検索キーワードを保存するNMZ.slogは放っておくと、ファイルサイズが増えるばかりなので、時々チェックした方がいい。久しぶりに見てみたら、IPアドレス60.28.17.75からの検索がここ数日で5500回ほどあった。クローラーに違いない。ダウンロードした後、拙作の秀丸マクロ(不要行削除マクロ)を使って削除した。これ、時間が少しかかるので、disabledrawの処理を付け加え、描画をしないで削除するようにしたら、少し速くなった。このほか、検索回数が100回を超えているIPアドレスはクローラーと思って間違いない。なぜ、こんなにクローラーが多いかというと、最近の検索キーワード(nlview.cgi)のリンクをたどっているため。このCGIは表に出さない方がいい。サーバーに余計な負荷がかかるだけ。

 Namazuと言えば、再検索CGI(subsearch.cgi)が対応しない検索エンジンが多くなっていた。仕様が変わったためだろう。少し書き換えればすむことなので、そのうち。ま、GoogleとYahoo!には対応しているのでいいでしょう。で、このsubsearch.cgi、Namazuで検索してキーワードが見つからなかった場合に、XOOPSで構築しているサイトにキーワードを渡したいと思い、改造してみた。XOOPSの検索もgetなので対応できるのだった。

 というわけで、修正した。こんな感じ