Home > 技術書 > 書評: Apache Solr入門 ―オープンソース全文検索エンジン

書評: Apache Solr入門 ―オープンソース全文検索エンジン このエントリーをはてなブックマークに追加 このエントリーを含むはてなブックマーク

こんにちは、Kuboです。

本書は昨年ホワイトハウスのWebサイトの検索部分に使われて話題になったApache Solrの入門書/解説書です。

今回Twitter上で、技術評論社ソフトウェア・デザインを担当されているの池本さん(@XR230)が書評する人を募集されていて、Solrは実案件で使っていたこともあり手を挙げさせていただきました。
っていうか、遅くなってすみません!

Apache Solr入門 ―オープンソース全文検索エンジン
関口 宏司 三部 靖夫 武田 光平 中野 猛 大谷 純
技術評論社
売り上げランキング: 5099
おすすめ度の平均: 5.0

5 検索エンジンに興味のある全ての知識レベルの方にお勧め

Apache Solrとは

OSSの全文検索サーバです。
いわゆる「エンタープライズサーチ」というようなカテゴリに入るソフトウェアです。
詳細は本書にゆずりますが、Solrは以下のような特徴を持っています。

  • OSS
  • Apache Luceneを全文検索ライブラリとして採用
  • HTTP/XMLを始めとし、言語に依存しない様々なインタフェースをもつ
  • 豊富な検索機能(ファセット検索、もしかして、サジェスト、など)。拡張もできる。
  • マルチコア、分散検索、レプリケーションなど、大規模システムに対応

Apache Solr入門について

本書は日本語で書かれた初めてのApache Solr本です。
Sorlのまとまった日本語ドキュメントというのは、本書の登場まではSoftware Design 2007年 12月号の『全文検索システム「Solr」徹底活用ガイド』くらいしかありませんでした。
(当時はSolrは1.2、現在は1.4です)

また本書の著者はApache Lucene 入門で知られる関口さんや、上記のソフトウェアデザインの記事を書かれたリクルートの中野さん他著名な方なので安心です。

本書のいいところ

細かいところまで日本語でしっかり説明されている

基本的にはここに尽きると思います。
本書はSolrの利用で必要になる殆どの情報(solrconfig.xml, schema.xml, stats情報, 各種検索、各種クライアント、その他多くの項目)について、しっかりとした説明を用意しています。
よって単に「インストールして使ってみました」という意味の「入門」本ではなく、概要を知るための情報もリファレンスとしての情報も、どちらも載っている「全てのSolr利用者のための」本です。

例えば2章の「スキーマの設定」ではfieldTypeの各属性の説明がありますが、
sortMissingFirstやsortMissingLastの意味などがしっかりと説明してあります。
実はこのあたりの情報は一応公式?ドキュメントであるSolr Wikiにも詳しくは載っていませんし、
載っていても英語の得意な人以外は微妙なニュアンスは分かりにくいものです。

そういう意味ではPostgreSQLやMySQLなどのRDBMSと違い日本語の公式ドキュメントが無い以上、どうしてもはっきりとしない部分が独習では残ってしまいます。
もちろんそういう点を一つ一つ確認していけるのはOSSの利点だと思いますが、それにはかなりの時間がかかります。

エンジニアは新しめの技術を取り入れるとき、往々にして「莫大な時間を費やして一つ一つを精査する」か「精度は諦めて、スピード優先でとりあえず使ってみるか」を選択することになりがちです。
本書があれば、精度とスピードのどちらも手にいれることができます。
私自身、1~2年前に本書があればどれだけ良かったかwというのが正直な気持ちです。

本書の物足りないところがあるとすれば。。

個人的には以下の内容があればとても嬉しいと思いました。

  • サーチ性能、インデクシング性能の指標、事例
  • エンタープライズでの利用におけるシステムイメージ
  • マルチコア、分散検索、レプリケーションの突っ込んだ話

要するに、ある程度の規模の実案件に投入する際に必要になるところの「イメージ」ですね。
ただこれらは本書『Apache Solr入門』の範囲を超える部分であり、
またそもそも基準が難しい部分であったり、要件によって変わってくる部分であったりしますので、
あくまで高望みですね。

現在上記のことを知りたければ、Solr勉強会の資料などからある程度つかめます。
そしてあとは自分で確認してみましょう。

まとめ

本書はSolrを使う全ての人にオススメできる良書だと思います。
本書がある場合とない場合で、Solrの習得にかかる時間も、その精度も、大きく変わってくるでしょう。
特に実務で使う方は必須ですね。
(本書に限らずですが)その効果を考えると、価格(\3,780)などは非常に安いものだと思います。

Apache Solr入門 ―オープンソース全文検索エンジン
関口 宏司 三部 靖夫 武田 光平 中野 猛 大谷 純
技術評論社
売り上げランキング: 5099
おすすめ度の平均: 5.0

5 検索エンジンに興味のある全ての知識レベルの方にお勧め

Solr使うなら必須。

そう言えば

洋書ですが、以下の書籍が結構前に出ていますね。
内容は見てないので分かりませんが。

Solr 1.4 Enterprise Search Server
David Smiley Eric Pugh
Packt Publishing
売り上げランキング: 23094
おすすめ度の平均: 5.0

5 おすすめ

リンク

エンタープライズサーチ 技術と導入
清兼 義弘 関口 宏司 田澤 孝之 松野 良蔵
アスキー・メディアワークス
売り上げランキング: 616573
おすすめ度の平均: 5.0

5 エンタープライズサーチのすべてをカバーする充実の内容

未読ですが、関口さんも書いてるし、これ良いのかも。

Apache Lucene 入門 ~Java・オープンソース・全文検索システムの構築
関口 宏司
技術評論社
売り上げランキング: 315704
おすすめ度の平均: 4.0

5 検索エンジンの基礎が学べます
4 日本語構文解析の説明がわかりやすい
4 この本には大変お世話になってます
5 全文検索の理解が深まりました。
1 著者さんへ…サンプルファイル、5章は改訂した方が良いのでは?

こちらも必須といいたいがもしや絶版?

Comments:0

Comment Form
Remember personal info

コメントリンクを nofollow free に設定することも出来ます。

Trackbacks:0

Trackback URL for this entry
http://www.sakuttoly.com/blog/2010/03/book_apache_solr.html/trackback
Listed below are links to weblogs that reference
書評: Apache Solr入門 ―オープンソース全文検索エンジン from サクっとly.com

Home > 技術書 > 書評: Apache Solr入門 ―オープンソース全文検索エンジン

ページ
アーカイブ
商品を検索
kubomaのオススメ書籍
メタ情報

Return to page top