机器学习下网络平台文本的中文情感分析
-
摘要: 介绍了基于机器学习自然语言处理下的关键技术,对文本进行分词、分句、词性标注等预处理,分析了情感词、指示性动词、关联词等,列出了网络里的感情色彩字符,并经过实验验证了在嵌入关联词和新兴网络语言权重因子后,文本的主客观分类效率显著提升。在实现主观语句较为精准的分类基础上,又对单句进行情感分析,强调否定词及程度副词对单句的影响;通过单句在文本中的作用与贡献不同,对主观语句的情感赋予不同的权重,再引入自定义合成算法,判断出整篇文本的情感倾向。实验结果证明,相较于情感倾向值累加求均值而言,依靠语句权重条件下合成算出的情感倾向准确率更高。