【大学课件】数据挖掘研究的新进展.ppt
《【大学课件】数据挖掘研究的新进展.ppt》由会员分享,可在线阅读,更多相关《【大学课件】数据挖掘研究的新进展.ppt(15页珍藏版)》请在三一文库上搜索。
1、数据挖掘研究的新进展,http:/ 机器学习 统计分析 数据库 数据挖掘技术的产生 大规模的数据 数据分析的需要,http:/ 新的应用领域 WEB访问分析 入侵检测 生物信息学 新的工作形式 流数据分析 隐私保护 新的数据类型 文本数据 图数据 XML数据 数据挖掘的进一步深入,http:/ 生物序列数据分析 基因芯片分析 主要难点 数据规模大 数据的模糊性,http:/ 从大规模的基因序列中提取相关模式 基因序列的特征 序列长 每个单元不同的取值少 研究内容 基因序列中频繁模式的发现 重复序列的发现 基因序列的聚类 基因序列的高效组织方法,http:/ 从大量的芯片数据中提取相关模式 芯片
2、数据的特征 序列短、序列数量长 有时采用的是局部信息 研究内容 基因表达数据的聚类 基因表达数据的分类,http:/ 数据监控 超大规模数据处理 主要特点 数据只能扫描一遍 最多只有o(lgn)的空间可用来存储临时数据 主要难点 无法形成一个精确的整体状态 现有的挖掘算法需要重新研究,http:/ 分类 构造一个分类器,不断修正 构造多个分类器,通过投票的方法进行预测 聚类 针对流过信息建立数据摘要的方法 动态调整现有分类 对新增类的判断方法和对老类的合并,http:/ 关联规则挖掘 频繁模式的更新 精确度分析 变化监测 变化发生时刻的确定 数据变化模式 高速流的处理方法 数据采样 并行处理,
3、http:/ 防止通过挖掘结果对原始细节数据进行反推理 主要应用于医疗数据的管理 主要研究内容 敏感数据的标示 挖掘结果的裁减 通过规则的推导预测生成的细节数据 对挖掘结果进行裁减 裁减的效率研究,http:/ 数据的转换 挖掘前对数据进行转换 基于一定的模式对数据进行变化 添加一些错误数据 基于变化后的数据进行数据挖掘 将结果进行恢复 数据挖掘流程的再造 在多个结点之间进行数据的传递 每个结点只了解局部的信息和部分全局信息 单个结点无法推出其它节点的信息,http:/ 生物信息学 社会网络 分子结构 WEB网页分析 主要困难 结构复杂 子图同构的匹配计算复杂性高,http:/ 频繁子图挖掘 图索引结构 具有某些特征的子图模式挖掘 直径要求 连通性 挖掘的应用 图数据的管理技术,http:/ 今后的路:推进数据挖掘技术的广泛应用 企业界已经开始关注数据挖掘技术 研究部门应该做什么? 同现有应用领域相结合 金融业 生物信息学 信息检索 自身技术的研究 易用性 可用性 新的应用领域 ,http:/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学课件 大学 课件 数据 挖掘 研究 进展
链接地址:https://www.31doc.com/p-3024140.html