基于数据挖掘的客户流失分析研究
VIP免费
第一章 绪论
1
第一章 绪论
§1. 1 论文背景
随着各种现代生产管理手段和技术的发展,企业之间产品的差异越来越难以
区分,产品趋同的趋势越来越明显,市场竞争日趋激烈,通过产品差异来细分市
场从而创造企业的竞争优势也就变得越来越困难。与此同时,随着市场态势从卖
方市场向买方市场的转变,客户的消费行为越来越成熟,期望也越来越高。在这
一背景下,企业的经营理念也必将经历从“以产品为中心”、“以市场为导向”到
“以客户为中心”。拥有客户就意味着企业拥有了在市场中继续生存的理由,而拥
有并想办法保留住客户是企业获得可持续发展的动力源泉。这要求企业在广泛关
注所有的竞争环境的同时,必须加大投入到关注客户这一因素的力度。
客户生命周期可分为三个阶段:获得客户、提高现有客户的价值、保留忠实
客户。现阶段企业对获取客户做了大量的工作,而对客户保持和提高现有客户的
价值方面做得不够好。一方面企业投入大量时间、人力、财力去发展新客户,另
一方面却因客户保持工作的不完善导致现有客户不满意而发生流失。客户保持对
公司的利润底线有着惊人的影响,远远超过公司规模、市场份额、单位成本和其
它许多通常认为与竞争优势有关的因素的影响[1],一个小的客户保持率的提高都
能导致利润可观约改善。对美国 9 个行业的调查数据表明,客户保持率增加 5%,
行业平均利润增加幅度在 25%-85%之间[2],客户保持已成为公司成功最至关重要
的目标。客户保持对公司利润的影响之所以如此之大,是因为保持现有客户比获
取新客户的成本低得多,一般可节约 4-6 倍,另外长期客户趋向于购买公司更多
的产品、对价格更不敏感[3],更为重要的是,被保持的忠诚客户主动为公司传递
好的“口碑”、推荐新的客户、对竞争品牌和广告更少关注、有成为合作伙伴的
潜力。因此,拥有长期忠诚客户的公司比拥有低单位成本、高市场份额但客户流
失率高的对手更有竞争优势[4]。了解客户,提高客户满意度,减少客户流失是当
今企业迫切需要解决的问题。
为了解决客户流失问题,企业就需要尽可能地了解客户,了解其需要及行为,
但这种了解不可能通过与客户接触直接获得。事实上,现代企业在长期的销售服
务中一般都保留了海量的客户数据,其中隐藏着客户的消费规律,对企业有着重
要的作用;但由于过去缺乏有力的技术手段,如何快速、有效地从企业的大规模
数据库中发现有用信息一直是困扰企业管理者的难题,这也使得对客户关系的管
基于数据挖掘的客户流失分析研究
2
理缺乏坚实的数据分析支持处于较初级的阶段。当前许多客户关系管理软件注重
的是如何简化和管理客户信息,它们通过建立一个客户信息数据库为企业与客户
的交互提供信息,使企业与客户保持持久的关系;随着客户信息量的增加,客户
与公司的关系变得越来越复杂,这类软件已难以满足用户的需要。如何摆脱企业
的“数据爆炸而知识贫乏”的困境,如何透过无序的、表层的信息挖掘出内在的
知识和规律,一种新的数据处理技术——数据挖掘,可以较好地解决这一问题。
数据挖掘是从大量的、不完全的、有噪声、模糊的、随机的实际数据中提取
隐藏在其中的、人们所不知道的但又是潜在有用的信息和知识的过程。把数据挖
掘应用于企业的客户流失管理中,通过企业所收集到的客户基本信息加上从业务
系统中抽取的客户相关的行为信息可以预测哪些客户最有可能流失,他们一般在
什么时候流失,流失客户的特征是怎样的,以及客户流失的原因是什么?通过建
立相应的数据挖掘模型,找到流失客户的特征; 然后利用这个模型随时监控客户
流失,在那些具有相似特征的客户还未流失之前,采取有针对性的措施以减少客户
的流失,从而大大降低客户的流失率。
基于数学计算的数据挖掘技术可以彻底改变以往企业在成功获得客户以后无
法管理和客户的关系,无法监控客户的流失,无法实现客户关怀的状况,把基于
科学决策的客户关系管理全面引入到企业的市场/销售中来。
§1. 2 论文主要工作
§1.2.1 论文目标
本文在前人工作的基础上,对利用数据挖掘进行客户流失分析进行了研究探
讨。不同于一般的研究性论文[5,6],是从模型的建立和评估评价:建立模型、比
较模型、然后选出一个最优模型角度进行分析。本文更偏重于模型开发过程的细
节,从企业的一个具体的数据挖掘应用项目角度,对客户流失进行分析研究。所
做的创新性工作如下:
①.提出数据挖掘过程的参考模型,对数据挖掘过程系统化、规范化、工程化。
在有关数据挖掘应用的论文中,一般都会介绍实施数据挖掘的一般过程。这
个“一般过程”是实施数据挖掘的总体框架。尽管有这个总体框架的指引,但企
业要实施数据挖掘项目时往往还是感到无从下手。因此,很有必要系统、规范的
指出每个过程所要做的工作及其结果表示。现有的一些数据挖掘过程标准,如 SPSS
提出的 5A 强调支持数据挖掘过程的工具应具有的功能和能力;SAS 提出的
SEMMA(Sample-Explore-Modify-Model-Assess)强调结合其工具的应用方法;数
第一章 绪论
3
据挖掘特别兴趣小组提出的 CRISP-DM 从方法学的角度强调实施数据挖掘项目的
方法和步骤。这些方法过程对企业实施数据挖掘有一定的指导意义,但它们更侧
重从工具角度而不是数据挖掘项目本身去考虑数据挖掘的每一个过程;对每一个
过程需要做什么,怎么做却介绍不多。参照这些方法,根据企业实施数据挖掘应
用项目的特点,提出了一个数据挖掘过程的参考模型,该模型包括七个步骤。参
照此参考模型企业实施数据挖掘项目时就会有章可循。
②.从商业角度对预测模型进行评估。
在对数据挖掘预测模型的评价中,大多是从技术角度,也即模型的准确率和
提升率方面进行考虑[7-9]。数据挖掘是面向应用的,客户流失分析的目的是为了
客户挽留,但在进行客户挽留时,有可能模型的准确度很高,而在实际应用中发
现,利用该模型实施客户挽留是很不合算的;而且从技术的角度的评价标准无法
解决对多少可能流失的客户进行客户挽留才合算问题。因此,仅仅有准确度是不
够的,还必须从商业角度,从实施客户挽留的投资回报率角度对模型进行评估,
从而选出合适的模型,对客户进行挽留。
③.对预测为流失的客户进行细分。
在数据挖掘的具体应用:客户流失分析专题中,特别是电信业的客户流失分
析中研究成果很多[10-13],这些研究成果一般是利用数据挖掘技术对客户数据进
行分析,预测哪些客户可能会流失,从而对他们采取客户挽留行动。这种方法易
于实施,但还不够深入。仅仅知道哪些客户可能会流失还不够,事实上每个客户
流失的原因各不相同,对所有可能流失的客户采取相同的客户挽留策略是不妥的。
因此,本文认为,可以先通过预测建模预测出可能流失的客户,然后针对这些预
测出来的流失客户再通过聚类进行细分,归纳每一类客户的特征,从而对不同的
流失客户采取不同的行动,提高客户挽留活动的有效性。
④.提出一种新的数据挖掘方法对客户挽留活动的效果进行评估
利用数据挖掘进行客户流失分析,把可能流失的客户名单提交给客户服务部
门,然后客户服务部门根据每一类流失客户的特征而采取不同的客户挽留措施;
这也就是利用数据库营销进行客户挽留。客户挽留的实际效果如何,进行挽留和
不进行挽留有什么区别,利用数据库营销和利用随机方式进行挽留客户的选择是
否有差别;要解决这些疑问,可以利用数据挖掘对数据库营销的挽留活动的实际
效果进行评估。文章提出了一种新的数据挖掘方法,这种方法可以识别出那些对
挽留活动积极响应的客户。
§1.2.2 工作内容
本文从企业的数据挖掘应用项目角度,对客户流失问题进行分析研究。基于
基于数据挖掘的客户流失分析研究
4
这一总体研究目标,结合上一小节中提到的论文的创新性工作,本论文的主要工
作内容如下:
①.理清数据挖掘的概念,分析比较数据挖掘和相关学科的关系;简要的阐述数
据挖掘的研究内容和本质;数据挖掘的功能及其常用技术。这一部分作为理
解后面的数据挖掘过程以及选择数据挖掘方法的理论基础。
②.作为数据挖掘项目,指出数据挖掘的一般过程;项目的人员配备及项目过程
中应该注意的问题;特别是从系统化、规范化、工程化角度对数据挖掘过程
进行了细化,提出了数据挖掘过程的参考模型。这一部分作为后面的数据挖
掘项目的指导,贯穿于整个数据挖掘项目应用过程中。
③.从商业的业务角度对客户流失问题进行分析;指出客户流失的背景,流失客
户的类型,客户流失分析的基础;提出将业务问题转化为数据挖掘问题,建
立数据挖掘库。这一部分为数据挖掘建模提供理论及数据准备工作。
④.建立预测模型预测哪些客户可能会流失;同时从商业角度考虑对可能流失的
客户进行客户挽留活动,找出进行客户挽留投资回报率最高的客户。
⑤.预测模型找出了可能流失的客户,但事实上客户流失的原因及类型是不同的,
因此有必要对预测模型预测出来的流失的客户进行细分,分析每一类流失客
户的特征,从而对不同的流失客户采取不同的挽留措施。客户挽留活动是否
有效,挽留的实际效果如何。文章提出了一种新的数据挖掘方法,这种方法
可以识别出那些对挽留活动积极响应的客户。
§1. 3 论文的组织结构
基于上一小节的论文的工作内容,本论文按以下章节组织:
第一章 绪论,简要介绍本论文的有关背景和主要工作及论文的组织结构。
第二章 数据挖掘基础,介绍数据挖掘的概念,数据挖掘和相关学科的关系,
简要地阐述数据挖掘的内容和本质、功能及其常用技术。
第三章 数据挖掘过程的参考模型,指出数据挖掘的一般过程及项目的人员配
备和实施过程中应注意的事项,提出了数据挖掘过程的参考模型。
第四章 客户流失问题分析,指出客户流失的背景,流失客户的类型,客户流
失分析的基础;提出将业务问题转化为数据挖掘问题,建立数据挖掘
库。
第五章 预测客户是否流失,建立预测模型预测哪些客户可能会流失,会在什
么时候流失;同时从商业角度考虑对可能流失的客户进行客户挽留活
第一章 绪论
5
动,找出进行客户挽留效果最好的客户。
第六章 对预测为流失的客户进行细分,对预测模型预测出来的流失的客户进
行细分,分析每一类流失客户的特征,同时进行客户流失原因分析。
对不同的客户采取不同的客户挽留措施,但是客户挽留的实际效果如
何,提出了一种新的数据挖掘方法,这种方法可以识别出那些对挽留
活动积极响应的客户。
第七章 结论与展望,对数据挖掘结果进行应用,总结本论文的工作成果与不
足,并对进一步的研究工作提出一些建议。
文章的最后是参考文献列表和致谢。
基于数据挖掘的客户流失分析研究
6
第二章 数据挖掘基础知识
数据挖掘是人们长期对数据库技术进行研究和开发的结果。数据库技术最初
用于联机事务处理,即实现对大量数据的统一存储,并提供对数据的查询、插入、
删除等事务性操作。随着大量历史数据的积累,人们不满足只是简单地查询和修
改数据,而是希望能够发现数据之间的潜在关系,因此,对数据库技术提出了新
的要求,随着一些相关学科和研究领域的日渐成熟,以及现实世界中商业竞争的
压力日渐残酷,企业急切地希望通过快速处理这些数据获得有利于企业进一步发
展的决策依据,而是否能够最大限度地使用信息资源来管理和影响企业决策流程,
将决定企业是否能拥有最大程度的竞争优势,数据挖掘于是出现了,并得到快速
的应用。
数据挖掘可以应用在各个不同的领域。数据挖掘工具能够对将来的趋势和行
为进行预测,从而很好地支持人们的决策。数据挖掘自动在大量数据中寻找预测
性信息,因此,以往需要领域专家和分析人员进行大量人工分析的问题,如今可
以直接由数据本身迅速得出基于知识的决策。
§2. 1 数据挖掘概念
§2.1.1 技术上的定义及含义
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随
机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用
的信息和知识的过程[14]。这个定义包括好几层含义:数据源必须是真实的、大量
的、含噪声的;发现的是用户感兴趣的知识;发现的知识是可接受、可理解、可
运用的;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据
可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形
和图像数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,
也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程
控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它把人
们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。
在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技
术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数
摘要:
展开>>
收起<<
第一章绪论1第一章绪论§1.1论文背景随着各种现代生产管理手段和技术的发展,企业之间产品的差异越来越难以区分,产品趋同的趋势越来越明显,市场竞争日趋激烈,通过产品差异来细分市场从而创造企业的竞争优势也就变得越来越困难。与此同时,随着市场态势从卖方市场向买方市场的转变,客户的消费行为越来越成熟,期望也越来越高。在这一背景下,企业的经营理念也必将经历从“以产品为中心”、“以市场为导向”到“以客户为中心”。拥有客户就意味着企业拥有了在市场中继续生存的理由,而拥有并想办法保留住客户是企业获得可持续发展的动力源泉。这要求企业在广泛关注所有的竞争环境的同时,必须加大投入到关注客户这一因素的力度。客户生命周...
相关推荐
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 5
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
-
VIP免费2025-01-09 4
作者:陈辉
分类:高等教育资料
价格:15积分
属性:79 页
大小:1.55MB
格式:PDF
时间:2024-11-19