デスクトップ検索

昨年の終わりに「デスクトップ検索」という言葉があちらこちらのニュースサイトをにぎわせていたが、最近はこの言葉もめっきり聞かなくなった。それでも、デスクトップ検索に対するニーズがなくなっているわけではないと思う。自分のマシンのデータを検索するというのは、Windowsであれば、エクスプローラの「検索」機能として提供されている。この検索機能はバックグランドでインデクスを作成・更新する機能が含まれており、これをONにしておくと高速に検索してくれる。私もこの検索機能はよく利用しているのだが、(1)検索に時間がかかる (2)メールの内容などは検索の対象とならない (3)ちゃんと条件を指定して明らかにヒットするファイルがあるはずなのにヒットしないことがある などということがあって、あまり重宝していない。ジャストシステムは、ConceptSearchを発売するようだが、単なる検索だけに使うのであれば、ちょっと値段が高い気がする。その他にオープンソース検索エンジンNamazuは、Webサーバ上のコンテンツのインデクスを作成し、高速にWebサーバ内の検索を行うものであるが、インターネットに公開されたサイトであれば、Googleなどがロボットによってインデクスを作成してくれるので、特にNamazuの必要性は感じない。企業のイントラネットなど、外部に情報がもれてはマズい分野でかなりのシェアを占めているのではないかと見られる。デスクトップ検索というポイントでNamazuを見ると、結構強力な仕様であることがわかる。第一にMS-WORDやpdfの内部まで検索の対象になるので、「見逃し」が少ない。また、検索結果は、一般的なWebの検索エンジンと同じ形式でWebページとして表示されるので、非常にとっつきやすい。欠点としては、インデクスの作成をバックグラウンドでは行わないので、夜中などにPCを立ち上げてインデクスを更新しなければならないことだ。当然インデクスが更新されるまでのタイムラグで検索の結果に含まれない情報というのも存在しうるし、私の過去の経験と照らし合わせると、Mamazuはインデクスの作成が遅いので、たとえばPCのHDD全体を検索範囲とすると、実用的な時間ではインデクスを作成してくれないだろう。試したわけではないが。
いま注目しているのは、Google Desktop Searchである。昨年11月に発表となって以来、まだBeta版で、日本語版も存在しないが、ベータ版でも日本語も大体うまく表示されるようだし、なによりもパソコン内のファイルの中でもWebページのキャッシュを認識し、過去に表示したページも検索の対象にしてくれる。また、WORDやPowerPointの内容も(日本語も含めて)検索、表示してくれる。表示結果はGoogleのWebページの検索結果と同じで、非常に見慣れた形式なので、最初から違和感無く使うことが出来る。(メールのタイトルのMIMEデータはうまくデコードしてくれない)インデクスはCPU利用率が低い特に自動的に作成してくれる。インデクス作成プロセスの実行優先度はあまり高くないようで、しばらくPCを放置しても5000程度のファイルしかインデクスを作成してくれなかった(私のPCのファイル数は200万を超えている)。これをインストールすると、既存のGoogleの画面にも「Desktop」リンクが登場し、デスクトップとWebの検索が一回のキーワード入力で可能となる。つかってみてなかなか目からうろこのソフトだと思う。無料のGoogle Desktop Searchでここまで出来ると、ConceptSearchはどうなんだろうと非常に気になってしまう。こちらのほうの発売日は3月4日とのことだ。体験版のダウンロードができるようだ。