一个HTML解析器API,以帮助您的工作。
TinyParser是一个非常简单的HTML解析器API,根据国家变迁理论的矩阵,只读取你想要的文字。
这是速度快(2 MB / s的html文件),小(只有14个教学班),内存(基于流的)友好,有点难以学习。
神器出山:www.shenqi73.com要求:
·
的Java 此版本中的新功能:
·更改程序包名称net.sf.tinyparser
为方便起见,添加了一个
工具类net.sf.tinyparser.Util。
·性能增强,现在的解析速度是20MB / s的英特尔奔腾D 2.8G()
·删除了一些过时的项目。
·更新和单元测试的例子。