Copyright © 2020-2023 www.SOT9.com. All Rights Reserved .
合作联系: QQ: 3217490875
WP2TXT是一种小型,易于使用的应用专门设计的,以帮助您从维基百科转储文件(XML /用bzip2编程的编码)剥离所有的MediaWiki标记和其他元数据中提取纯文本数据。
原本打算寻找一个简单的神器出山:www.shenqi73.com方法来获得开源多语种语料库的研究人员是有用的,但用于其他目的可能是很方便的。
上一个软件:Sylli 0.9.8