网络产品评论的情感倾向研究

VIP免费
3.0 刘畅 2024-11-07 4 4 888.54KB 55 页 15积分
侵权投诉
随着 web2.0 的迅速发展,电子商务也呈现出井喷式的发展状态。网络购物正
在被来越多的人接受和喜欢。研究表明,购买过商品的用户很喜欢在网络上发表
产品评论和使用心得。而相关商品的潜在消费者在做出购买决定之前,也乐于在
互联网上查看产品评论,因为通过这些评论,潜在消费者可以更好的了解产品信
息和其他用户对此产品的情感倾向。因此,情感倾向分析作为一种非结构化信息
挖掘的一个新兴领域,不仅对个人还是商家都具有重要意义。
目前,针对产品的情感倾向研究,主要由以下三个步骤组成:一、获得相关
产品的网络评论,区分其中哪些是评论是主观性评论,哪些是客观性评论;二、
从产品的主观性评论中,识别产品的属性;三、判断产品属性的极性值,识别用
户对某项属性的情感倾向。
本文首先对产品倾向研究的国内外研究背景进行了叙述。针对这一领域,相
比国外而言,中文对产品情感倾向研究目前还属于起步阶段,研究成果和参考文
献都比较少。其次,本文的研究领域为针对手机产品的在线网络评论,对在 Amazon
网站上抽取的在线手机产品评论进行了预处理工作,包括词性的标注,情感词表
的构成和扩建,以及情感词修饰极性的处理方法等。在产品属性识别阶段,本文
使用 PMI 方法对属性词语进行识别,并结合热门网站上对产品评价指标的设计,
建立了针对手机产品的评价指标体系。最后,本文使用条件随机场的方法对手机
产品评论的情感倾向进行判断。以往都把情感倾向分析看作是一个文类问题进行
研究,但是本文则是把情感分析则看成是一个序列标注的问题。采用从粗到细的
方式,在充分考虑情感词、否定词、程度副词等上下文信息的基础上,对句子的
褒贬性,以及褒贬强度都进行了判断。实验证明,本方法有效,具有一定的研究
价值。
关键词: 属性集 评价指标 情感倾向 互信息 条件随机场
ABSTRACT
With the rapid development of web2.0, electronic commerce is also showing a
blowout development .The network shopping is being accepted and used by more and
more people. Study shows the already buyers like to post reviews and experiences of
products. Potential consumers also enjoy viewing the product reviews on the Internet
before making a purchase decisions, that because they can well understand the product
information and other users’ sentiment tendency distribution through the reviews.
Therefor the product reviews sentiment tendency analysis as an emerging domain in the
unstructured information mine, it is significant not only for the individual but also the
seller and the producer.
At present, Sentiment analysis of internet product reviews mainly consist three
steps. First, obtains the related product network reviews, judges which review is the
subjective comment, what is objectivity reviews; Second, from the subjective product
comments, identifies product attributes which the users concerns. Third, determine the
polarity value of these related products attributes, and identify the regarding attribute
emotional tendencies.
In the thesis, firstly we introduce the domestic and foreign research background for
the text sentiment tendency analysis. In this domain, compare to foreign, Chinese
products emotional tendencies research is still at an initial stage, we have few research
results and references. And then, this article aims the online reviews at the phone
domain, we conduct experiment of three types mobile phones in Amazon e-commerce
website. We preprocess the online product reviews including part of speech,
composition and expansion of the sentiment word vocabulary and judgment the
sentiment word polar and etc. About the attributes identification, we use the PMI
identify the attributes word. Combined with the evaluation on the popular site, we
conduct an evaluation index system for the mobile phone products. Finally, we use
Conditional Random Field method to distinguish the emotional tendencies of the mobile
phone product reviews. Past, sentiment tendency analysis was regarded as text
categorization issue, but this article regarded it as a sequence labeling question. Step by
step, taking full account of the context information’s influence, for instances, emotional
words, negative words, the degree adverb and so on, we not only judge the sentence
appraisal but also the appraisal intensity. Experiments show that the method is effective,
and have a certain research value.
Key words: Attribute identification evaluation index system
Sentiment tendencyPMIConditional Random Fi
ABSTRACT
第一章 绪论 ......................................................... 1
1.1 研究的背景及意义 ............................................. 1
1.1.1 研究的背景 .............................................. 1
1.1.2 研究的意义 .............................................. 2
1.2 国内外研究现状 ............................................... 3
1.2.1 产品评论要素提取 ....................................... 3
1.2.2 情感倾向分析 ............................................ 6
1.3 本文的研究内容 ............................................... 9
1.4 本文的组织结构 .............................................. 10
第二章 理论基础 .................................................... 11
2.1 条件随机场理论基础 .......................................... 11
2.2 序列标注问题 ................................................ 11
2.3 条件随机场的无向图结构 ...................................... 12
2.4 条件随机场的势函数表示 ...................................... 14
2.5 参数估计 .................................................... 15
2.6 概率计算 .................................................... 17
2.7 条件随机场模型的优势 ........................................ 17
第三章 产品评论获取及评论数据预处理 ................................ 19
3.1 产品评论数据源获取 ......................................... 19
3.2 产品评论的抽取 .............................................. 20
3.3 评论词词性标住 .............................................. 21
3.4 情感词表的构建及扩展 ........................................ 22
3.4.1 情感词汇表种子词集合的建立 ............................ 22
3.4.2 情感词汇表种子词集合的扩展 ............................ 22
3.5 情感词汇倾向分析 ............................................ 24
3.5.1 情感词汇的极性标注 .................................... 24
3.5.2 否定句处理 ............................................ 24
3.5.3 程度副词的影响 ........................................ 25
3.5.4 修饰极性的计算方法 .................................... 26
第四章 产品属性提取及评价指标集合建立 .............................. 28
4.1 候选产品属性集合的构建 ...................................... 28
4.1.1 候选产品的属性来源及特点 ............................... 28
4.1.2 手机产品属性提取 ...................................... 29
4.3 产品评价指标集合的建立 ...................................... 31
4.1.1 产品评价指标集合的概念及意义 .......................... 31
4.2.2 手机产品指标集合的建立 ................................ 32
第五章 基于条件随机场的产品情感倾向分析 ............................ 35
5.1 标注方法 .................................................... 35
5.2 特征选取 .................................................... 36
5.3 特征模板 .................................................... 37
5.4 实验 ........................................................ 37
5.4.1 CRFs 工具的选取 ........................................ 37
5.4.2 实验评测标准 .......................................... 39
5.4.3 实验结果及分析 ........................................ 39
第六章 总结与展望 .................................................. 43
6.1 总结 ........................................................ 43
6.2 下一步工作展望 .............................................. 43
参考文献 ........................................................... 45
在读期间公开发表的论文和承担科研项目及取得成果 ..................... 51
.............................................................. 52
第一章 绪论
1
第一章 绪论
1.1 研究的背景及意义
1.1.1 究的背景
Web2.0 的兴起为用户提供了更多的网络参与机会,使得越来越多的用户加入
到网络的交互作用之中。用户不仅仅是网络内容的浏览者,更是网络内容的创造
者。据中国互联网信息中心 CNNIC 最新发表的《第 30 次中国互联网络发展状况
统计报告》,我国网民规模截至 2012 6月底,达 5.38 亿人,突破了 5亿关口,
2012 年上半年增加 2450 万人;互联网普及率攀升至 39.9%,较 2009 年底提高
1.6 个百分点。互联网的普及,不仅极大地促进了经济模式的转变,也改变了人们
传统的生活方式。这其中,网络购物给消费者购物提供了极大的便利。然而和实
体购物相比,很多电子商务网站没有导购员给消费者提供商品咨询服务,再加上
互联网信息容量过于膨胀,使得消费者经常会迷失。意见挖掘从这些散落在网页
中的评论里获取有用信息,不仅能够帮助消费者从海量的文本中快速获得有效的
信息,节省人力成本,也可以为企业提供一种新的电子商务产品推荐思路。
2012年的一份数据报告显示,由于互联网商务化程度迅速提高,全国网络
购物用户将达到3亿,45.7%的网民在最近一年内进行过网上购物,18.5%的网民
经常访问购物网站,网上购物远远超过了其他类网络应用。用户在购物网站上不
仅能浏览产品的详细介绍,还可以在网站的论坛里发表自己对产品的评论。网上
最大的调查公Zoomerang 2007年的一项调查表,受访者之, 44%人在
坛中发表过产品评论,而两年前仅为23%[1]。。 根据艾瑞2009年中国网民购买决
策研究报告》的结果,64.4%消费者认为商品评论是其获得商品信息最主要的方式。
艾瑞咨询整理的20108 Channel Advisor 的调研数据显示,网上消费者产品
评论促进了46%的美国网民进行购物。数据显示,被调查的美国网购消费者中,92%
的消费者阅读了产品的评论。其中46%的表示产品评论信息促进了其购买行为;
43%的则表示因为产品评论信息,推迟了商品购买。DoubleClick Inc.行了
针对美国服装业、计算机硬件设备业、运动健身产品行业及旅游业网络客户的研
[2],发现这些行业,近一半以上的用户做出购买决定前,会在互联网上搜索有关
产品介绍及商品评论等信息。Deloitte公司2007年的一项调查表明,在受访者之中,
摘要:

摘要随着web2.0的迅速发展,电子商务也呈现出井喷式的发展状态。网络购物正在被来越多的人接受和喜欢。研究表明,购买过商品的用户很喜欢在网络上发表产品评论和使用心得。而相关商品的潜在消费者在做出购买决定之前,也乐于在互联网上查看产品评论,因为通过这些评论,潜在消费者可以更好的了解产品信息和其他用户对此产品的情感倾向。因此,情感倾向分析作为一种非结构化信息挖掘的一个新兴领域,不仅对个人还是商家都具有重要意义。目前,针对产品的情感倾向研究,主要由以下三个步骤组成:一、获得相关产品的网络评论,区分其中哪些是评论是主观性评论,哪些是客观性评论;二、从产品的主观性评论中,识别产品的属性;三、判断产品属性...

展开>> 收起<<
网络产品评论的情感倾向研究.pdf

共55页,预览6页

还剩页未读, 继续阅读

作者:刘畅 分类:高等教育资料 价格:15积分 属性:55 页 大小:888.54KB 格式:PDF 时间:2024-11-07

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 55
客服
关注