数据挖掘在检察系统预防职务犯罪中的应用研究.pdf
《数据挖掘在检察系统预防职务犯罪中的应用研究.pdf》由会员分享,可在线阅读,更多相关《数据挖掘在检察系统预防职务犯罪中的应用研究.pdf(89页珍藏版)》请在三一文库上搜索。
1、重庆大学工程硕士学位论文 数据挖掘在检察系统预防职务犯罪 中的应用研究 硕士研究生:李伟森 指 导 教 师 :石 锐 副教授 兼 职 导 师 :何国辉 高级工程师 工 程 领 域 :计算机技术 重庆大学计算机学院 二 OO 七年十月 II Engineering Master Degree Dissertation of Chongqing University Research of Applying Data Mining to Prevent the Crime of the Officeholder in Procuratorial Organization Master Degree
2、 Candidate:Li Weisen Supervisor:Associate Prof. Shi Rui Pluralistic Supervisor: Senior Engineer. He Guohui Specialty:Computer Technology College of Computer Science Chongqing University October 2007 III 摘 要 自从改革开放以来,随着经济的不断发展,城市规模的扩大,人口的大量增加, 如何在目前警力有限的情况下去打击贪污贿赂等职务犯罪,这是检察机关必须解决 的一个重要课题。 打击贪污贿赂等职务犯罪
3、,除了事后追查到底外,事前从源头进行职务犯罪预 防教育至关重要。然而,由于受人力、财力、物力等因素的限制,在现阶段对所有 的行业、部门都进行预防职务犯罪教育,既不可能,也不现实。因此,必须抓住主 要矛盾,对部分重点行业、部门进行职务犯罪预防教育。 那么,选择哪些部门和行业作为重点进行职务犯罪预防教育呢?要较好解决这 个问题,笔者提出使用数据挖掘技术,对已有的经济数据和职务犯罪数据进行数据 挖掘,建立模型,并进行预测,从而给出对选择哪些行业进行重点的预防教育给出 建议,为领导决策给予支持。 本文首先对职务犯罪进行了概述,介绍了职务犯罪的定义、职务犯罪的特点、 职务犯罪的社会危害,分析了职务犯罪的
4、产生原因,阐述了传统的职务犯罪预防对 策,并指出传统方法的不足之处,然后根据以上的分析提出了预防职务犯罪分析系 统的目标和要求,并给出该系统的系统框架,以及建立预防职务犯罪分析模型。 然后,本文阐述了数据挖掘的理论与技术方法,比较数据挖掘与传统分析方法 的区别和联系,指出数据挖掘在解决具有海量信息处理、要求深入分析历史信息、 从中发现数据特征、预测其发展趋势并辅助决策的问题方面有较强的优势,满足职 务犯罪预防分析系统的要求。 接着,详细分析了聚类与分类方法的原理和部分算法,并将其与职务犯罪预防 分析结合,并阐述了技术与模型结合的方法:应用聚类技术分析一系列职务犯罪预 防属性,得出职务犯罪多发行
5、业的主要特征。然后应用分类的决策树分析方法将这 些特征转化成判断职务犯罪的分类规则,并依据这个分类规则预测各个行业是否有 职务犯罪发生。 最后给出了本系统的总体设计和各主要模块的主要流程,并以某省近两年的数 据,应用聚类和分类算法实施了数据挖掘,得出职务犯罪多发行业的特征,并将这 些特征转化为判断职务犯罪的分类规则。通过对分类规则的检验,预测结果较好地 符合了实际情况。 关键词:数据挖掘,职务犯罪预防,聚类算法,分类算法 IV ABSTRACT Since the reform and open policy is executed, the economic level increases
6、rapidly. With the rapid increasing of the economy, the numbers of case of the crime of the officeholder, such as corruption, is also increasing. So it is import to the procuratorial organization that how to deal with the more and more cases with limit resource. Basing on the experience, criminal pre
7、vention education is more effective than the punishment. But limited by the resource, it is impossible to carry out the criminal prevention education in all departments. So we should choose some important departments to carry out the criminal prevention education. But which department should we choo
8、se to get the better effect? To solve the problem, we can use the data mining technique. We will build up a model about the crime of the officeholder, and then carrying out the data mining to analysis the data and then give the suggest of which departments to carry out the criminal prevention educat
9、ion. In this paper, first, the crime of the officeholder is summarized. The definition, characteristic and social damage of the crime of the officeholder is introduced, the cause of the crime of the officeholder is analyzed, traditional crime of the officeholder prevention countermeasure is expatiat
10、ed, and the shortage of traditional countermeasure is pointed out. The analysis system aim and require of the crime of the officeholder prevention is put forward according to the analysis above. Second, the theory and technique method is expatiated, the difference and contact between data mining and
11、 traditional analysis method was compared. Data mining is better preponderant in solving problems such as great capacity for liquor information, requiring deeply history information analysis, discovering data character in this, forecasting its develop trend, and assistant decision-making. Data minin
12、g meet the need of analysis system of crime of the officeholder. Third, the theory and some arithmetic of clustering and class method is analyzed in detail, and is combined with analysis prevention of crime of the officeholder. The combine method of technique and model is expatiated. It is method th
13、at the mainly characters of the trace with more business crime is found because a set of attributes of crime of the officeholder. Prevention are analyzed with clustering technique analysis And then these characters are changed to classing rule judge crime of the officeholder using the classic decisi
14、on-making tree. At last it is forecast that if there is crime of the officeholder happened according to this classic rule. V Finally in this paper, the flow chart of all major system models is given, such as data import model, data mining model.With two years data, crime of the officeholder prevent
15、model is carried into execution with clustering algorithm, classification algorithm. The mainly characters of the trace with more business crime is found and changed to classing rule judge crime of the officeholder. The forecast result is accorded with the fact with checking up the classified rule.
16、Key Words:Data Mining, Crime of the Officeholder preventing, Clustering algorithm, Classification algorithm VI 目 录 摘摘 要要III ABSTRACT .IV 1 绪绪 论论.1 1.1 问题提出1 1.2 论文意义1 1.3 作者主要工作2 1.4 论文结构2 1.5 本章小结3 2 预防职务犯罪分析系统预防职务犯罪分析系统.5 2.1 职务犯罪预防概述5 2.1.1 职务犯罪的定义.5 2.1.2 当前职务犯罪的特点.5 2.1.3 职务犯罪的社会危害性.6 2.1.4 职务犯
17、罪的产生原因.7 2.1.5 职务犯罪的传统预防对策.8 2.1.6 传统预防对策的不足.10 2.2 预防职务犯罪分析系统12 2.2.1 系统目标.12 2.2.2 系统要求.12 2.3 预防职务犯罪分析系统概述12 2.4 数据挖掘应用在职务犯罪预防方面的研究现状14 2.4.1 国外现状.14 2.4.2 国内现状.15 2.5 本章小结16 3 数据挖掘理论概述数据挖掘理论概述.17 3.1 数据挖掘的概念17 3.2 数据挖掘的发展18 3.3 数据挖掘的方法18 VII 3.4 数据挖掘与传统分析工具的区别和联系20 3.5 数据挖掘实施步骤22 3.5.1 问题定义23 3.
18、5.2 数据收集和数据预处理.23 3.5.3 数据挖掘模型的应用.25 3.5.4 结果解释和评估.26 3.5.5 模型的实施26 3.6 本章小结27 4 数据挖掘算法分析数据挖掘算法分析 .29 4.1 聚类算法29 4.1.1 聚类算法基本原理.29 4.1.2 聚类分析中的数据类型和相异度.30 4.1.3 聚类算法32 4.2 分类算法36 4.2.1 分类算法基本原理.36 4.2.2 决策树算法37 4.3 本章小结42 5 预防职务犯罪数据仓库的设计和实现预防职务犯罪数据仓库的设计和实现.43 5.1 数据仓库的设计43 5.1.1 概念模型设计.43 5.1.2 粒度层次
19、划分.43 5.1.3 数据分割策略.43 5.1.4 设计事实表和维度.43 5.2 库表结构46 5.3 数据预处理49 5.3.1 整合数据49 5.3.2 清洗数据50 5.3.3 构建数据51 5.3.4 选择数据51 5.3.5 格式化数据51 5.3.6 数据的加载51 5.4 本章小结54 VIII 6 OLAP 联机分析联机分析55 6.1 OLAP的各种操作55 6.2 使用EXCEL作为OLAP客户端浏览多维数据集56 6.2.1 数据透视表服务.56 6.2.2 使用Excel作为OLAP客户端57 6.2.3 使用EXCEL作为客户端的优点.62 6.3 本章小结63
20、 7 预防职务犯罪分析系统的设计与实现预防职务犯罪分析系统的设计与实现.65 7.1 预防职务犯罪分析系统65 7.2 预防职务犯罪分析系统的总体设计65 7.3 各模块的功能设计66 7.3.1 数据导入与清理模块.66 7.3.2 主题管理模块.66 7.3.3 数据挖掘模块.67 7.3.4 系统管理模块.70 7.4 数据挖掘应用71 7.4.1 聚类.71 7.4.2 分类.74 7.4.3 结果分析76 7.5 本章小结76 8 总结与展望总结与展望.77 8.1 总结77 8.2 展望77 致致 谢谢.79 参考文献参考文献.80 1 1 绪 论 1.1 问题提出 随着经济的不断
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 检察 系统 预防 职务犯罪 中的 应用 研究
链接地址:https://www.31doc.com/p-5185799.html