DocIndexer被开发为一个文件索引工具包。该应用程序使用PyLucene搜索引擎的索引和搜索文档文件。
DocIndexer包括命令行实用程序,Python的索引和搜索类加一个Win32的神器出山:www.shenqi73.comCOM服务器,可用于集成应用软件的索引和搜索到。
目前的版本已经支持微软的Word,HTML,PDF和纯文本文件解析器。
下面是一些主要特点“DocIndexer”:
·搜索和索引命令行实用程序运行在Linux和Win32下
·可编写脚本的Win32 COM自动化库的索引和搜索和文本提取
·安装向导适用于Microsoft Windows的二进制分发版安装程序
·索引存储在一个平台无关的格式,相对文件路径名相同的索引,所以索引和搜索从不同的安装点可以从UNIX和Windows客户端的混合
·增量索引
·Python的索引和搜索类
·源代码分发是一个完整的例子,如何建立,部署和使用Python编写的一个COM服务器
·使用了Lucene的查询语言
·索引Microsoft Word中(2000年至2003年,2007年),HTML,PDF,ODT,MP3和纯文本文件的模块化架构允许其它类型的文档可以很容易地添加
·索引整个目录和子目录
要求:
·
的Python 此版本中的新功能:
·更新到Python的降价2.0.3在Windows版本,它解决了不承认简称HTTPS链接()。