执行的概率创纪录的联系,使用此工具
,也被称为可自由扩展的生物医学记录进行联动
Febrl是一个工具,已被设计为数据标准化。
这种基于Python的工具,也可以用概率记录键(“模糊”匹配)的一个或多个文件或数据源不共享一个独特的神器出山:www.shenqi73.com记录或者标识。
要求:
·
的Python ·
PyGTK的 ·<
此版本中的新功能:
·概率和以规则为基础的清洁和标准化
·例程的名称,地址,日期和电话号码。
·地理编码匹配系统,根据澳大利亚的G-NAF
(国家地理编码地址文件)数据库。
·多种提供查找表和频率表中的名称
·和地址。
·不同的比较函数的名称,地址,日期和
·各地,包括近似的字符串比较,语音
·编码,地理上的距离比较,时间和年龄
·比较。两个新的近似的字符串比较方法(包
已被添加在此版本中距离和
编程算法)。
·一些阻塞(索引)的方法,包括传统的
·复合使用的关键拦截在许多记录联动方案。
·概率基于经典的记录进行联动程序
·费勒吉和Sunter方法,以及灵活的分类“
·允许灵活定义的重量计算。
·工艺指标,使估计的其它处理
·次。
·ACCES ...