Acrux先进的HTML Parser是一个设计的HTML解析和操作的。NET库。
Acrux的高级HTML Parser是一个畸形的HTML解析和处理现实世界中图书馆。它支持XPath查询和XSLT转换,以执行对加载的神器出山:www.shenqi73.com文档。无论你想要做的网络扫描,网络刮,Web数据挖掘,或改变网页的内容,在内容管理系统 - 先进的HTML Parser是你所需要的。
新鲜和干净的代码 - 而不是一个Java翻译。高级的HTML解析器书面从头开始在C#中的最佳实践Microsoft.NET。这是不是一个混乱的另一种语言的翻译。源代码已经通过了所有的设计,性能,安全性和使用FxCop规则。
blue">“Acrux高级的HTML解析器,”这里是一些主要特点:
?非常快
任何正常大小的文件被解析为一个分裂的第二。一个小时,你可以分析一个或以上的共50GB的。
线程安全的。
我们的代码是线程安全的保证。您可以放心地使用它在复杂的多线程服务和应用程序知道它永远不会导致一个死锁或性能下降。
基于System.Xml命名空间。
先进的HTML解析器类继承的System.Xml命名空间,允许解析文件和被操纵的节点作为一个标准的XmlDocument。
完整的XPath支持,包括XPath 2.0。
此外,以标准的XPath功能,可在MSXML和System.Xml,Acrux的先进的HTML解析器,实现了从XPath 2.0版本的大部分功能
?作品没有很好的形成与现实世界的HTML
您可以解析任何HTML,不管它是多么的凌乱和不正确的。一个完美的工具。NET应用程序抓取网页。
解析ASP.NET服务器代码。
Acrux的高级HTML解析器可以识别并解析服务器ASP.NET代码。这使得它非常适合做聪明的事情,例如存储在SharePoint 2003和2007页的ASPX页面。
没有麻烦的发展。
该产品配备的例子很多,最常执行的操作。