ホーム > タグ > solr
solr
書評: Apache Solr入門 ―オープンソース全文検索エンジン

- 2010-03-07 (日)
- 技術書
こんにちは、Kuboです。
本書は昨年ホワイトハウスのWebサイトの検索部分に使われて話題になったApache Solrの入門書/解説書です。
今回Twitter上で、技術評論社でソフトウェア・デザインを担当されているの池本さん(@XR230)が書評する人を募集されていて、Solrは実案件で使っていたこともあり手を挙げさせていただきました。
っていうか、遅くなってすみません!
技術評論社
売り上げランキング: 5099

検索エンジンに興味のある全ての知識レベルの方にお勧め
Apache Solrとは
OSSの全文検索サーバです。
いわゆる「エンタープライズサーチ」というようなカテゴリに入るソフトウェアです。
詳細は本書にゆずりますが、Solrは以下のような特徴を持っています。
- OSS
- Apache Luceneを全文検索ライブラリとして採用
- HTTP/XMLを始めとし、言語に依存しない様々なインタフェースをもつ
- 豊富な検索機能(ファセット検索、もしかして、サジェスト、など)。拡張もできる。
- マルチコア、分散検索、レプリケーションなど、大規模システムに対応
Apache Solr入門について
本書は日本語で書かれた初めてのApache Solr本です。
Sorlのまとまった日本語ドキュメントというのは、本書の登場まではSoftware Design 2007年 12月号の『全文検索システム「Solr」徹底活用ガイド』くらいしかありませんでした。
(当時はSolrは1.2、現在は1.4です)
また本書の著者はApache Lucene 入門で知られる関口さんや、上記のソフトウェアデザインの記事を書かれたリクルートの中野さん他著名な方なので安心です。
本書のいいところ
細かいところまで日本語でしっかり説明されている
基本的にはここに尽きると思います。
本書はSolrの利用で必要になる殆どの情報(solrconfig.xml, schema.xml, stats情報, 各種検索、各種クライアント、その他多くの項目)について、しっかりとした説明を用意しています。
よって単に「インストールして使ってみました」という意味の「入門」本ではなく、概要を知るための情報もリファレンスとしての情報も、どちらも載っている「全てのSolr利用者のための」本です。
例えば2章の「スキーマの設定」ではfieldTypeの各属性の説明がありますが、
sortMissingFirstやsortMissingLastの意味などがしっかりと説明してあります。
実はこのあたりの情報は一応公式?ドキュメントであるSolr Wikiにも詳しくは載っていませんし、
載っていても英語の得意な人以外は微妙なニュアンスは分かりにくいものです。
そういう意味ではPostgreSQLやMySQLなどのRDBMSと違い日本語の公式ドキュメントが無い以上、どうしてもはっきりとしない部分が独習では残ってしまいます。
もちろんそういう点を一つ一つ確認していけるのはOSSの利点だと思いますが、それにはかなりの時間がかかります。
エンジニアは新しめの技術を取り入れるとき、往々にして「莫大な時間を費やして一つ一つを精査する」か「精度は諦めて、スピード優先でとりあえず使ってみるか」を選択することになりがちです。
本書があれば、精度とスピードのどちらも手にいれることができます。
私自身、1~2年前に本書があればどれだけ良かったかwというのが正直な気持ちです。
本書の物足りないところがあるとすれば。。
個人的には以下の内容があればとても嬉しいと思いました。
- サーチ性能、インデクシング性能の指標、事例
- エンタープライズでの利用におけるシステムイメージ
- マルチコア、分散検索、レプリケーションの突っ込んだ話
要するに、ある程度の規模の実案件に投入する際に必要になるところの「イメージ」ですね。
ただこれらは本書『Apache Solr入門』の範囲を超える部分であり、
またそもそも基準が難しい部分であったり、要件によって変わってくる部分であったりしますので、
あくまで高望みですね。
現在上記のことを知りたければ、Solr勉強会の資料などからある程度つかめます。
そしてあとは自分で確認してみましょう。
まとめ
本書はSolrを使う全ての人にオススメできる良書だと思います。
本書がある場合とない場合で、Solrの習得にかかる時間も、その精度も、大きく変わってくるでしょう。
特に実務で使う方は必須ですね。
(本書に限らずですが)その効果を考えると、価格(\3,780)などは非常に安いものだと思います。
技術評論社
売り上げランキング: 5099

検索エンジンに興味のある全ての知識レベルの方にお勧め
Solr使うなら必須。
そう言えば
洋書ですが、以下の書籍が結構前に出ていますね。
内容は見てないので分かりませんが。
Packt Publishing
売り上げランキング: 23094

おすすめ
リンク
アスキー・メディアワークス
売り上げランキング: 616573

エンタープライズサーチのすべてをカバーする充実の内容
未読ですが、関口さんも書いてるし、これ良いのかも。
技術評論社
売り上げランキング: 315704

検索エンジンの基礎が学べます
日本語構文解析の説明がわかりやすい
この本には大変お世話になってます
全文検索の理解が深まりました。
著者さんへ…サンプルファイル、5章は改訂した方が良いのでは?
こちらも必須といいたいがもしや絶版?
- Comments: 0
- Trackbacks: 0
Home > Tags > solr



