Clustering聚类分析.ppt
《Clustering聚类分析.ppt》由会员分享,可在线阅读,更多相关《Clustering聚类分析.ppt(26页珍藏版)》请在三一文库上搜索。
1、Clustering 聚类分析,聚类,分类 相似的归为一类 不相似的归入不同类 未知类 仅依靠对象的相似度,应用,生物学 经济学 ,应用,文档分类 文档向量 1、分量 表示第i个词条的频率 2、分量 为0或1,表示是否引用第i篇文档,应用,社交网络,对象间的比较,相似度 例: 距离(不相似度) 例: 欧几里得距离,距离函数的选择,根据数据的情况选择 例:将图中的点按连边情况分类 点表示成邻接矩阵的行 a=(0,1,0,1,0,1) b=(0,1,1,0,1,0),研究顾客的行为,D种商品 N个顾客 K种顾客类型,KN 每种类型的顾客购买物品的情况满足一种概率分布,研究顾客的行为,顾客1:2种蔬
2、菜,3种水果,1种海鲜,0种零食, 顾客2:1种蔬菜,3种水果,1种海鲜,1种零食 顾客3:4种蔬菜,0种水果,3种海鲜,2种零食 顾客4:0种蔬菜,0种水果,0种海鲜,4种零食 顾客5:3种蔬菜,1种水果,5种海鲜,1种零食 可能的结果: 1,2 3,5 4 顾客1( 2 , 3 , 1 , 0 ) 蔬菜 水果 海鲜 零食,判断标准,每个类中,所有对象间的距离之和 每个类中,所有对象到“中心”的距离之和 k-median criterion 每个类中,所有对象到“中心”的距离平方之和 k-means criterion 通过最小化这些值得到最优的划分,判断标准的选择,根据分类的目标,依靠经验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Clustering 聚类分析
链接地址:https://www.31doc.com/p-4245966.html