ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

论文--大规模情感词典的构建及其在情感分类中的应用

2022-02-26 21:01:33  阅读:187  来源: 互联网

标签:-- 微博 词语 情感 语料 词典 表情


论文主要基于海量的微博数据,使用简单的文本统计算法,构建了一个十万词语的大规模情感词典。(论文地址:http://jcip.cipsc.org.cn/CN/abstract/abstract2374.shtml#)

情感词典的构建流程如下:

  1. 表情符种子获取,利用提前构建好的情感词语种子,在一个较小规模的微博语料上,为所有的表情符进行情感归类及重要的排序,从而为每类情感选择一些相关性较高的,具有代表性的表情符。
  2. 情感词语、词组情感分值计算,利用获得的表情符种子,在一个较大规模的微博语料上为所有候选情感词语计算情感分值。假设一个句子中表情符的情感倾向和微博文本本身是一样的,如果微博包含一个褒义的表情符,则认为微博是褒义的,反之是贬义的。如果同时具有褒义表情符和贬义表情符就进行舍弃,然后从微博语料中抽取候选情感词,通过PMI算法,使用具有情感倾向的表情符种子为候选情感词计算情感分值并抽取出具有情感倾向的词语。

通过此方法构建的情感词典的性能要优于清华、北大、大连理工及知网提供的情感词典。

标签:--,微博,词语,情感,语料,词典,表情
来源: https://www.cnblogs.com/zhang12345/p/15940466.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有