返回列表 回复 发帖

【推荐好书】 开发自己的搜索引擎--Lucene 2.0+Heritrix

由于目前市面上从技术层面介绍搜索引擎的书并不多,即使有,也大多停留在理论阶段,而非搜索引擎的开发过程。因此,可以说本书是国内第一本详细介绍搜索引擎开发过程的图书。
(1)采用最新的Lucene 2.0。以前大家用的1.4.3版本,而最新的Lucene 2.0重写了很多API,内部的实现方法也有了很大优化。本书的代码都是在2.0版本下调试通过的,这样可以帮助读者了解Lucene的更多新功能。
(2)配有一个完整的搜索引擎案例。这个案例有很强的实用价值,只需稍加修改,就能应用于实际项目,市场价值在30000元以上!
(3)着重解决开发人员头痛的问题。本书的目的是指导项目实践,因此没有罗列各个API的用法,而是对常见的开发问题进行深入探讨,比如本书的第7章,是专门为解决“Word,Excel和PDF文件如何解析”这个问题而设置的。
(4)内容新颖,前卫实用。本书介绍了Compass、Heritrix、DWR和HTMLParser等内容。在搜索引擎开发的过程中,这些均为相当重要且实用的技术,笔者经过自身实践将它们展现给读者,希望能让读者在学习Lucene的同时开拓视野。


试读网址:
http://www.china-pub.com/computers/common/info.asp?id=34370
http://www.dearbook.com.cn/book/170463
恩,推荐大家看,是好东西。我的毕业设计就是基于lucene的。后来打工,做搜索引擎,老板不允许用java,因为我要是走了没有人能维护。后来发现python下也有跟java api一样的包。把java版本学好,然后python, perl, .....环境下都有基本一样的包。
lucene还不错
返回列表