第十八部分资料探勘技术.ppt
《第十八部分资料探勘技术.ppt》由会员分享,可在线阅读,更多相关《第十八部分资料探勘技术.ppt(41页珍藏版)》请在三一文库上搜索。
1、第十八章 資料探勘技術,本章大綱,第一節 導論 第二節 資料探勘的動機及程序 第三節 資料探勘的分類技術 第四節 資料探勘的相關分析技術 第五節 時間相關的資料探勘技術 第六節 資料探勘的應用 第七節 結論,學習目標,資料探勘的基本概念 資料探勘的程序 資料探勘的常用技術,包括分類、關聯分析等 資料探勘技術在建立企業智慧及決策支援系統的應用,資料探勘的基本概念,建立企業智慧最主要的方法之一。 資料探勘是從資料中發掘知識的過程,亦有人稱為 資料庫的知識挖掘(Knowledge Discovery in Databases, KDD) 資料考古學(Data Archaeology) 資料型態分析(
2、Data Pattern Analysis) 資料探勘的定義 從大量資料中,尋找事前未知(previously unknown)、有效(valid)且可以付諸行動(actionable)之規則或知識。,資料探勘的基本概念(續),資料探勘的常用技術,依其性質分為三類 分類技術 相關分析 時間順序分析,圖18-1 資料探勘技術分類,資料探勘的動機,瞭解過去經營資料中有用的可能關係 找出有助於未來經營決策的知識 分析特定顧客的行為或市場的變化 對影響經營的因素有深入的瞭解,資料探勘的程序,決定企業探勘資料的目的 資料收集與整合 選擇適當的資料探勘技術 結果分析 知識應用,圖18-2 配合企業問題與資
3、料探勘技術的可能應用,資料探勘的分類技術,歸納分類 (Classification) 集群分析(Clustering Analysis),歸納分類,若一組資料共有N 類,分別為C1CN,而且一個案例在Ci類的機率為P(Ci),則計算該組資料的公式為,歸納分類(續),H (C | Competition=Low) = p (Up | Competition=Low) log2(Up | Competition=Low) p (Down | Competition=Low) log2(Down |Competition=Low) = = 0.918 H (C | Competition=High)
4、 = p (Up | Competition=High) log2(Up | Competition=High) p (Down | Competition=High) log2(Down |Competition=High) = = 0.811,歸納分類(續1),因為應用Competition加以分類後,會分成SalesUp及SalesDown兩類。因此其分類的總值為 H (C | A) 即以上例而言 H (C | Competition) 0.8752,表18-1 產品銷售分析,圖18-3 ID3產生的決策樹,集群分析,K平均演算法 步驟1:隨機初始k個中心點m1, m2, ., mk。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十八 部分 资料 探勘 技术
链接地址:https://www.31doc.com/p-2565112.html