-
Yahoo BOSS (Build your Own Search Service) 是 PHP 的 Yahoo 搜索客户端API,可通过它获取来自网页的搜索结果、新闻和图片等,并进行缓存。
编程语言:php
-
zettair 是全文检索界鼎鼎大名的大牛:Justin Zobel,以他的研究成果为基础的全文检索实验系统。
Zobel可能是业界第一个系统提出倒排索引差分压缩算法的人,倒排列表的压缩大大提高了检索和加载的性能,同时空间膨胀率也缩小到相当优秀的水平。后期的许多全文检索系统都基本采用了此压缩算法。
zettair,代码简洁精炼,算法高效。是学习倒排索引经典算法的非常好的实例。
编程语言:c
-
Zilverline is what you could call a 'Reverse Search Engine': Zilverline is a search engine that offers web access to your personal or intranet content.
Zilverline is a 'Lucene Desktop' comparable to Google Desktop, but based on Lucene.
编程语言:java perl
-
Zend_Search_Lucene 是一个完全由 PHP 5 编写的通用文本搜索引擎。由于其将索引保存在文件系统中而不需要数据库支持,因此它几乎可以为任何由 PHP 驱动的网站增加搜索能力。Zend_Search_Lucene 支持下列特性:具有排名功能的搜索——最符合要求的结果出现在最前面
许多强大的查询类型:短语查询、通配符查询、近似查询、范围查询等
搜索特定的字段,如标题、作者、内容,等等 Zend_Search_Lucene 来源于 Apache Lucene。
编程语言:php
-
Zoie 是一个基于Apache Lucene构建的实时搜索和索引系统。
编程语言:java
-
XQEngine 是一个基于XML文档的全文本搜索引擎,前端使用的是 XQuery 查询语言。
编程语言:java
-
Xapian是一个用C++编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C++世界并没有相应的工具,而Xapian则填补了这个缺憾。 Xapian的api和检索原理和lucene在很多方面都很相似,但是也有一些地方存在不同,具体请看Xapian自己的文档:http://www.xapian.org/docs/ Xapian除了提供原生的C++编程接口之外,还提供了Perl,PHP,Python和Ruby编程接口和相应的类库,所以你可以直接从自己喜欢的脚本编程语言当中使用Xapian进行全文检索了。
编程语言:c
-
这是一个基于 WAP 的搜索引擎,采用 Perl 语言开发,通过这个脚本你可以给你的WAP网站增加搜索功能。
编程语言:perl
-
Web Search Aggregator 可以让你在统一的一个页面中集成多个搜索引擎的搜索结果。
编程语言:javascript
-
Whoosh 是一个纯python实现的全文搜索组件。Whoosh不但功能完善,还非常的快。
Whoosh的作者是MattChaput,由Side Effects Software公司开发。项目的最初用于Houdini(Side Effects Software公司开发的3D动画软件)的在线帮助系统。Side Effects Software公司将该项目开源。
主要特性: * 敏捷的API(Pythonic API)。 * 纯python实现,无二进制包。程序不会莫名其妙的崩溃。 * 按字段进行索引。 * 索引和搜索都非常的快 -- 是目前最快的纯python全文搜索引擎。 * 良好的构架,评分模块/分词模块/存储模块等各个模块都是可插拔的。 * 功能强大的查询语言(通过pyparsing实现功能)。 * 纯python实现的拼写检查(目前唯一的纯python拼写检查实现)为啥选择Whoosh * 纯python实现,省了编译二进制包的繁琐过程。 * python代码比java更容易读懂,而且用起来也更方便。(翻者注:这个容易引发口水) * 在很多时候易用性比单纯的最求速度更重要。Whoosh从其他的开源搜索引擎中获取了大量的灵感。 基础构建参考Lucene,使用KinoSearch的索引算法,部分评分算法来自Terrier,英文的词语态变化来自Minion.
编程语言:python