投资理财数据挖掘.ppt
《投资理财数据挖掘.ppt》由会员分享,可在线阅读,更多相关《投资理财数据挖掘.ppt(82页珍藏版)》请在三一文库上搜索。
1、数据挖掘在投资理财分析中的运用,基于CATI的数据挖掘模型,目 录,投资理财分析中的数据挖掘技术,1.绪 论,1.1 研 究 背 景,台湾经济状况:,1.1 研 究 背 景,台湾经济状况:,台湾股市:,1.1 研 究 背 景,1.1 研 究 背 景,由于市场竞争日益激烈,再加上民众投资热情减退,证券公司要如何挖掘潜在的客户,创造客户的需求,针对客户的行为做出适当的营销决策,最大化自己和盈利,建立自身的核心竞争力,对于证券公司的发展乃至生存都是至关重要的。,1.1 研 究 背 景,1.2 研 究 动 机,2 数据挖掘流程简介,2.1 商务智能,商业信息,商务智能是一系列商业活动行为的数据 收集与
2、信息转化作业,协助企业制订出 最佳的策略主题与策略目标。,商务智能能透过数据的淬取、整合及分 析,支持决策过程的技术和商业处理流程,商务智能是企业利用现代信息收集、管 理和分析结构化和非结构化的商务数据 和信息,增强综合竞争力的智慧和能力”,2.2 数据挖掘,2.3 数据挖掘标准流程,数据挖掘标准流程(CRISP-DM),3 投资理财分析中的数据挖掘技术,3.1 数据挖掘技术在证券行业的应用,3.2 客户关系管理,3.3 本文采用的数据挖掘算法,3.3 本文采用的数据挖掘算法,3.3 本文采用的数据挖掘算法,3.3 本文采用的数据挖掘算法,模型评估方法提升图,红线表示理想模型,3.3 本文采用
3、的数据挖掘算法,模型评估方法分类矩阵,4.投资理财建模分析,4.1 数据准备,4.1 数据准备,4.1 数据准备,4.1 数据准备,数据分析结构,4.2 购买和未购买股票各占一半的调查者行为分析,分析购买者及未购买者共同的问题,4.2 购买和未购买股票各占一半的调查者行为分析,变量的筛选和模型的建立 我们将所有个人信息变量输入作为自变量,来作为判断其是否购买股票的标准。我们采取SQL的建议(SQL内部从中抽取一部分样本,进行验证),选择“年龄”,“教育程度”,“职业”,和“收入”作为自变量,分别建立决策树,逻辑回归,贝叶斯模型来预测被访者是否购买股票。,模型的精确度分析 三个模型都能预测出被访
4、者是否购买股票,我们对三个模型进行对比,分别用提升图和分类矩阵方法进行筛选。 提升图:,4.2 购买和未购买股票各占一半的调查者行为分析,分类矩阵:,4.2 购买和未购买股票各占一半的调查者行为分析,选择决策树作为我们最终模型,4.2购买和未购买股票各占一半的调查者行为分析,相依程度:,影响投资者是否购买股票因素由强到弱为:收入教育程度职业年龄,4.3股票购买者投资行为分析,对于购买的股票的人群来说,考虑的最主要的因素分析如下:,4.3股票购买者投资行为分析,Q5-Q23针对5类股票中的100只股票,均为多选题,我们在数据预处理中将选择了一种股票的记为1,未选择的记为0,通过多选题分析的方法得
5、到其比率,Q5,Q9,Q13,Q17,Q21为在未提醒被访 者的情况下让被访者说出至多5只股票 ,我们认为被访者对这些股票比较熟悉,Q7,Q11,Q15,Q19,Q23为是否购买 这只股票,最大选择个数为5,4.3.2股票投资者的购买行为分析,数据的处理:Q8,Q12,Q16,Q20,问投资者分别对金融板块,纺织板块,钢铁板块, 这几家上市公司的主要经营项目是否熟悉。如果投资者对每一个板块,我们记为1,否则为0。然后将四个板块的值加权重,形成新的变量Q30(清楚业务汇总). Q6,Q10,Q14,Q18,问题为:以下我将念出金融保险类股(或其他四个板块)的股票,请问您听过哪几家?复选,随机提1
6、-20项。在访问员说出这只股票,如果被访者听说过,我们就将其记为1,说明他对这只股票有印象,否则为0。 我们假定听说过的股票越多,对证券市场越了解。将被访者对各个板块听说过的股票数量加总起来,作为衡量被访者对股市的了解程度。但是这个指标的范围在0-90之间,分布图如下:我们根据这个指标的分布,将选择数量在0-40记为1(一般了解),31-50的记为2(比较了解),50-70的记为3(很了解),70以上的记为4(非常了解)。还有一个重要的指标即是股票购买金额。下面我们用这些指标建立聚类分析。,4.3.2股票投资者的购买行为分析,4.3.2股票投资者的购买行为分析,4.3.2股票投资者的购买行为分
7、析,教育程度较高的男性,对股票非常了解,年龄主要在30-39岁间,职业大多为管理阶层和白领,月收入介于3-7万,中高等的,受教育程度较低,高中或高职,男性居多,收入较低,年龄处于30-39岁,大多在大专以上,年龄在20-29岁间的白领上班族,收入在3-5万每月,工作不久,年龄在30-50岁的家庭主妇,由于这一类投资者收入较低,大都在1万以下每月,所以投资金额相对较低,在50万以下,管理阶层的男性,对股票也非常了解,教育程度也较高,收入大多在10万每月以上,所以这类人购买股票的金额很大,在100-500万,4.3.2股票投资者的购买行为分析,关联程度分析:,普通客户和潜在优质客户,这两类目前购买
8、的股票金额都差不多,但是一类会逐渐成为潜在优质客户或者上升为优质客户,一类可能停滞不前,作为证券公司要挖掘出潜在优质客户,为他们提供细致的理财服务,赢取未来的优质客户。其次第1类比较优质客户和第3类潜在优质客户的关联程度很高,因为他们大多有着相同的背景。,4.4 美金购买者行为分析,4.4.1 美金购买者的描述性统计分析,4.4.1 美金购买者的描述性统计分析,4.4.2 购买美金金额分析,变量的筛选和模型的建立 将所有个人信息的变量输入作为自变量,SQL从中抽取一部分样本,进行验证,根据SQL的建议选择“年龄”,“教育程度”,“职业”,“性别”和“收入”作为自变量,分别建立决策树,逻辑回归,
9、贝叶斯模型来预测被访者是否购买股票。,三个模型的精确度分析 提升图:,4.4.2 购买美金金额分析,分类矩阵:,选择决策树作为我们最终模型,4.4.2 购买美金金额分析,相依程度:,影响投资者购买美金金额的因素由强到弱为:收入年龄教育程度性别职业。,4.4.2 购买美金金额分析,模型分析决策树,4.4.2 购买美金金额分析,模型分析决策树,4.4.2 购买美金金额分析,4.4.3 美金投资者中股票购买行为分析,变量的筛选和模型的建立 有41.21%的美金购买者购买了股票,下面分析是什么样的投资者既投资股票也投资美金。,4.4.3 美金投资者中股票购买行为分析,变量的筛选和模型的建立 我们仍然以
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 投资 理财 数据 挖掘
链接地址:https://www.31doc.com/p-2990923.html