公爵1.0_Duke 1.0下载地址

点这里下载 → 下载地址
相关Tags:

公爵1.0_Duke 1.0软件简介

快速重复数据删除引擎

杜克大学将为用户提供快速,灵活的重复数据删除(实体的决议或记录联动)引擎,用Java编写的Lucene之上。目前,它在11分钟内可以处理100万条记录在一个单独的线程在一个标准的笔记本电脑

杜克可以用来寻找重复记录在一个单一的神器出山:www.shenqi73.com表/数据源,或者它可以被用来找到其中最有可能代表相同的真实世界的实体的不同的表中的记录/来源。

注意:杜克大学也可以运行在苹果机和Linux平台。

要求:

·的Java

此版本中的新功能:

性能改进:
·加入对多线程的支持
·使用NIOFSDirectory以外的所有平台上的Windows
·新的内存后端,速度比Lucene的(实验)

变化比较:
·地理坐标比较。
·Q-克比较。
·莱文斯坦实施速度更快
·加权莱文斯坦重量估计现在知道位置的字符串(问题81)

到清洁的变更:
·新增PhoneNumberCleaner
·扩展和广义正则表达式清洁
·删除子清洁概念,支持多种清洁剂

其它改进:
·查找道具实现的用户控制
·升级到Lucene 4.0
·的增值MatchListener.startProcessing()回调
删除了一些MatchListener的回调方法(不是线程安全的)
·InMemoryLinkDatabase现在已经完成并经过测试的
·LinkDatabaseMatchListener bug修复
·更好的验证配置
·JDBCEquivalenceClassDatabase增加
·RDBMSLinkDatabase的性能改进

命令行客户端的变更:
·数据调试模式
·修正了REU ...

随便看看

软件简略信息
  • 软件大小:3.81 MB
  • 下载次数:99
  • 更新时间:2013-03-09 12:27:00
  • 不能下载请报告错误,谢谢
本类热门软件