管理语料库与此程序
设计
Poliqarp是一个普遍的一套工具,用于大型语料库处理。
您可以使用此访问的工具来创建几乎所有的在其原生脚本语言编写的文本的语料库 - 英语,波兰语,日本或泰国 - 只要他们在UTF-8格式编码的神器出山:www.shenqi73.com。
下面是一些主要特点“Poliqarp”:
因为含糊不清的支持:
·标签不一定是唯一的一个字:有可能发生的情况下,一个字可以解释的几种方法(因此有多个分配给它的标签)。 Poliqarp可以处理这种情况,并允许您说您的查询是否必须与任何可能的解释或全部。很少,如果有的话,其他的日新月异具备这种能力。
高效:
这是很难估计的平均时间搜索语料库,因为它在很大程度上取决于结构的查询。然而,简单查询的单词或短语几秒钟甚至上语料库包含超过一个一百万美元的话(在原始文本,那是几千兆字节,包括标记和元数据!)更复杂的查询需要更长的时间来执行,但即使如此,你得到的结果,尽快为他们被发现,所以你不必等待太久。
要求:
·相关
Java运行时环境(JRE),至少5.0版本 ·128 MB的RAM(更多,更好)
·至少200MHz的CPU