Copyright © 2020-2023 www.SOT9.com. All Rights Reserved .
合作联系: QQ: 3217490875
JFreq是一个纯文本文件,并把它们变成一个字频率矩阵的工具。
JFreq试图要快,并没有采取太多的内存。这可能是更好的在两个,但它是相当有用的。
可以直接添加文件夹,或由负载的神器出山:www.shenqi73.com纯文本文件。如果提供了文件夹,JFreq不仅看起来向下一个级别到他们的文件和,假设一切它认为是一个纯文本文件。这是有帮助的,以确保这是真的。
在计数过程中,JFreq可以选择:
·小写一切
·删除货币符号
·删除数字
·删除停止的话,你所提供的列表
·12个欧洲语言之一,适用于Stemmer氏
·你提供一本字典的内容分析与执行
JFreq输出是一个文件夹包含您的新词(或类别)的频率矩阵中选择不同的格式,可以用gzip编程您的磁盘以节省空间。格式如下:
·LDA-C:Blei的稀疏矩阵格式的用于安装主题模型,但一般比较有用的单词频率数据。
·MTX:矩阵市场的稀疏矩阵数值分析中使用的格式,在“坐标整数的格式。
·CSV:每个人的第一选择输出格式。不适合大规模的字频数据,但合理的小文件集的内容分析
上一个软件:字符串兑换1.4_String Convertor 1.4
下一个软件:YKConverter 0.4.0.0