消费者购买可能性判断的模型设计(doc10).doc
《消费者购买可能性判断的模型设计(doc10).doc》由会员分享,可在线阅读,更多相关《消费者购买可能性判断的模型设计(doc10).doc(10页珍藏版)》请在三一文库上搜索。
1、消费者购买可能性判断的模型设计分类模型就是根据以往的经验,根据每个属性内的水平与类之间的对应关系,构造出分 类模型。本文旨在探讨分类模型的评价标准,并提出了两种分类方法。第一种分类方法比较简单,经济含义也比较明显, 但第一种方法要求属性(指标)之间不能有强的相关性。在第二种方法中,提出并证明了两条比较实用的结论,并利用这 两条结论与一些合理的假设,求解出了新的分类模型。 在一对一销售、信用评价等商业活动中,经常需要判断哪些人的购买倾向更高一些,哪些人的信用更好一些的问 题。这实际上是如何进行分类的问题。分类与聚类不同。聚类没有根据经验进行学习的过程。而分类模型根据以往的经验 ,根据每个属性内的
2、水平与类之间的对应关系,构造出分类模型。 分类模型的方法有:决策树、遗传算法、贝叶斯等。 在本文中,只分成两类,这两类用购买者与非购买者来代表。购买者表示购买某产品,非购买者表示不购买某产 品。 一、模型好坏评价的标准预测结果的好坏也就是预测准确程度。本文以销售时的情况为例,假设结果分为两类:购买者与非购买者。假设 在以往数据中购买者与非购买者的个数分别是a、b。我们利用某种模型在a个购买者中预测准确a1个人,不准确a2个人(或 者说a2个人被预测成非购买者);在b个非购买者中预测准确b1个人,不准确b2个人(或者说b2个人被预测成了购买者)。 很自然的想法是利用整体准确率来衡量: L1=(a
3、1+b1)/(a+b)100% 指标一 指标一的缺点是,有时购买者的个数要远低于非购买者的个数,比如,假设在某个人群中非购买者的比例占98%, 如果采用这样的预测方法:对于任何一个人,都认为他是非购买者,按照指标一,预测准确率可以达到98%,属于很高的预 测精度。但这与商家的目标不一致:商家希望根据以往的经验,根据每个人的属性特征,利用某种评价模型,从某个人群 中挑出一部分人来,与没有应用该种模型相比,挑出来的这部分人比原始人群具有很高的购买倾向。而利用指标一评价, 就属于一个人都没有挑出来。指标一的根本缺点是没有注意到预测准一个购买者与预测准一个非购买者的重要程度是不一 样的(在购买者与非购
4、买者数量基本相等时两者的重要程度是一致的)。 而以下指标就可以有效的克服上述缺点: L2=(a1/a+b1/b)50% 指标二 可以利用指标二来判别模型的预测能力,将L2称为分类模型拟合优度系数。容易证明,在一般情况下,模型拟合 优度系数在0.5与1之间。当L2=0.5时,说明利用分类预测模型并没有提高预测精度;而当L2=1时,说明分类模型将购买者 与非购买者完全区分开了。 将指标二进行变换,可以得到: L2=(a1/a+b1/b)50% =50%+(a1/ab2/b)50% 一般来说,a1/ab2/b 显然大于0。因为根据我们的目标利用模型挑选出来的人中,购买者的比例与原始人群相 比有所提高
5、,也就是: a1/(a1+b2)a/(a+b) (1) 其中,模型的左边是利用模型挑选出的人群中购买者所占的比重,模型的右边是原始人群中购买者所占的比例。 将式(1)两边同乘以(a1+b2)(a+b),经过整理可以得到: a1/ab2/b 同理,可以得到: b1/ba2/a0,并且容易得到: a1/ab2/b = b1/ba2/a (2) 本文将a1/ab2/b或b1/ba2/a称为模型的识别能力因子,识别能力因子越大,则模型的挑选能力越高,越能够 符合商家的需要。容易得到,能力识别因子在0与1之间。当能力识别因子等于0时,利用模型挑选出的人群中购买者占的比 例与原始人群相等,模型没有起到应有
6、的挑选能力的作用。而当模型识别能力因子等于1时,挑选出的人群全部是购买者或 非购买者,也就是说将购买者与非购买者完全分开,当然这是一种理想情形,实际上是不可能达到的。 二、评价模型设有m个属性(比如性别、年龄、以往购买情况等),每个属性由一定的水平构成,通过某种规则将每个属性的各 个水平赋予一定的值,设Xki表示第j个人的第k个属性对应的水平,将该水平赋予一定的数值Ukj (比如如果第k个属性是性别,如果第j个人是男,那么属性对应的水平就是男性,根据购买倾向等可以将男性赋予一定的 数值)。对于第j个人,若U1j+U2j+UmjP,则判断第j个人属于购买 者,否则判断为非购买者,U1j+U2j+
7、Umj称为第j个人的得分,P称为临界值。 假设共有m个属性,假设第i个属性共有ki个水平,分别赋予一定的数值:U(i,1),U(i,2), ,U(i,ki)。如果当每个属性的水平以及临界值取以下值时:U*(i,1),U*(i,2),U*(i, ki);P* 使模型评价标准取最大值,即 L2=max(a1/a+b1/b)50% =50%+max(a1/ab2/b)50% 或者使模型识别能力取最大值,即max(a1/ab2/b),则称U*(i,1),U*(i,2), ,U*(i,ki);P*为模型的一个最优解。 三、赋植方法利用统计的方法 假设属性A中的j水平有t比例的人属于购买者,则称A属性j水
8、平对购买的隶属程度为t。将t值赋予j水平,依据同 样的方法,则可以得到每个属性各个水平的赋植。 利用max L2=max(a1/a+b1/b)50%或max(a1/ab2/b)求出P值。对于第i个人,若 U1i+U2i+UmiP,则判断此人为购买者,否则判断为非购买者。 可以求出属性A的重要程度=da/d。 其中,da=属性A中各水平赋值的标准差,d表示所有属性水平标准差之和。 此种方法比较简单,经济意义也比较明显。但这种方法也有比较明显的缺陷:各个属性(指标)之间不能有强的 相关性,没有考虑到属性之间的交互影响,得到的解有可能不是最优解等。 利用不等式及定义对各水平进行比较精确的赋值 此种方
9、法要求将每个属性的水平赋予合适的值,赋值的范围从-到+。规则是若第i个人 U1i+U2i+UmiP 则判断此人为购买者,否则判断此人为非购买者。利用以下目标求出每个属性各个水平以及P的值: max L2=max(a1/a+b1/b)50%或max(a1/ab2/b) 其中max(a1/a+b1/b)与max(a1/ab2/b)是等价的。 为了提高算法的可行性,本文提出并证明以下两点结论: (1)结论一 在一个属性中,给各个水平赋值,有意义的不是各个水平赋值的大小,而是要看各个水平之间差距的大小。也就 是说,在一个属性中,给每个水平同时加上一个常数,不改变分类结果。 可以证明以下结论: 假设U*
10、(i,1),U*(i,2),U*(i,ki); P*是分类模型的最优解,其中i=1,2,m。则对每个属性各水平的以下赋值:U*(i,1) +ai,U*(i,2)+ai,U*(i,ki)+ai ;P*+a1+a2+am,i=1,2,m也是分类的一个最优解,其中 a1,a2,am是常数。 可以这样来证明: 对于任意第j个人根据第一种赋值方法即U*(i,1),U*(i,2), U*(i,ki);P*,其中i=1,2,m 来判断是购买者(如果是非购买者结论也 是一样的),则 U*1j+U*2j+U*mj P* 那么采用赋值方法:U*(i,1)+ai,U*(i,2)+ai, U*(i,ki)+ai;P*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 消费者 购买 可能性 判断 模型 设计 doc10
链接地址:https://www.31doc.com/p-1148665.html