搜索引擎的语言学家
DDC的一致性访问和开放源码的搜索引擎,已开发,以满足对语言的研究人员专门设计的。
DDC-一致性,基本上是创建一个索引和搜索工具收集的语料库语言学家。
这里是“DDC-协调一致”的
神器出山:www.shenqi73.com一些主要特点:
路的句子或文档搜索
路统计查询,而不是近似
路额外的属性,如布尔操作符(AND,OR,NOT),左,右截断和距离搜索运营商的传统的搜索引擎,DDC-一致性还可以搜索单词的各种形式。例如一个“孩子”的搜索,会发现所有
文件,包含词形如儿童,儿童等,此功能目前适用于英语,德语和俄语。
路DDC-一致性可以从XML文档中的元数据索引
路的话可以进行索引与搜索的注释,特别是单词的各种形式,引理,语音标签的一部分,语义范畴
路间隔搜索(针对性和对称例如,NEAR和FOLLOWED_BY)
路搜索短语
路相关性排序操作的文件
是快速路DDC-一致性。一个100万字语料的索引,需时约1.5小时。首十大金曲简单的查询在0.2秒左右。
路DDC的一致性,因为它的分布式集群架构,可以处理庞大的语料库。已知最大的语料约1亿美元的令牌,但我们还没有达到极限。
路有客户端
软件,使用Perl,PHP,Python中,C / C + +提供(开发的东西),而且还准备使用的命令行客户端和一个简单的CGI脚本