Lucene培训教程(一)

2025-05-28 02:11:59

Lucene是apache软件基金会发布的一个开放源代码的全文检索引擎工具包,由资深全文检索专家Doug Cutting所撰写,它是一个全文检索引擎的架构。

Lucene培训教程(一)

工具/原料

互联网

笔记本电脑或台式机

有java编程基础(本教程使用java)

eclipse/myeclipse/IDEA,或者其他编程工具

lucene简介

1、lucene是什么?lucene是apache软件基金会发布的一个开放源代码的全文检索引擎工具包,由资深全文喾丰洲搜检索专家Doug Cutting所撰写,它是一个全文检索引擎的架构,提供了完整的创建索引和查询索引,以及部分文本分析的引擎,lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎,lucene在全文检索领域是一个经典的祖先,现在很多检索引擎都是在其基础上创建的,思想是相通的。lucene是根据关健字来搜索的文本搜索工具,只能在某个网站内部搜索文本内容,不能跨网站搜索。

Lucene培训教程(一)

2、lucene用在什么地方?lucece不能用在互联网搜索(即像百度那样),只能用在网站内部的文本搜索,但原理是相通的。

Lucene培训教程(一)
Lucene培训教程(一)

3、lucene中有什么?lu罕铞泱殳cene中存的就是一系列的二进制压缩文件和一些控制文件,它们位于计算机的硬盘上,这些内容统称为索引库,索引库有以下两部分组成:(1)原始记录 存入到索引库中的原始文本,例如:这是一个测试(2)词汇表 供搜索用的表,它是分词器根据一定的规则,将原始记录拆分后保存在表中。如 北京 大学

Lucene培训教程(一)

4、用lucene而不用sql的原因?(对比lucene和oracle)>SQL佯镧诱嚣只能针对数据库表搜索,不能直接针对硬盘上的文本搜索>SQL没有枷讹般身相关度排名>SQL搜索结果没有关健字高亮显示>SQL需要数据库的支持,数据库本身需要内存开销较大>SQL搜索有时较慢,尤其是数据库不在本地时,超慢但是以上的功能,都可以用lucene。

Lucene培训教程(一)

lucene代码初体验

1、创建索引库。

Lucene培训教程(一)

2、查询索引库。

Lucene培训教程(一)
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
相关推荐
  • 阅读量:91
  • 阅读量:83
  • 阅读量:85
  • 阅读量:35
  • 阅读量:91
  • 猜你喜欢