我一直在阅读有关文本分类的文章,并发现了几种可用于分类的Java工具,但我仍然想知道:文本分类是否与句子分类相同!
有没有专注于句子分类的工具?
解决方法:
“文本分类”和“句子分类”之间没有正式的区别.毕竟,句子是一种文本.但一般来说,当人们谈论文本分类时,恕我直言,他们意味着更大的文本单位,如文章,评论或演讲.将政治家的演讲分为民主人士或共和党人比分类推文要容易得多.如果每个实例都有大量文本,则不需要为每个训练实例提供所有可以提供给您的信息,并且可以获得非常好的性能.
基本上,如果你在句子语料库中抛出现成的weka分类器,你可能无法获得所需的性能数字.您可能需要使用POS标签,解析树,单词排序,ngrams等来扩充句子中的数据.还可以获得任何相关的元数据,例如创建时间,创建位置,句子作者的属性等.显然,所有这些都取决于你究竟想要分类的是什么……为你准备的功能需要对手头的问题有直觉意义.
标签:java,nlp,weka,gate 来源: https://codeday.me/bug/20191006/1860078.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。