关于机器学习这九大误区是那几个你知道吗?.doc
《关于机器学习这九大误区是那几个你知道吗?.doc》由会员分享,可在线阅读,更多相关《关于机器学习这九大误区是那几个你知道吗?.doc(5页珍藏版)》请在三一文库上搜索。
1、关于机器学习这九大误区是那几个你知道吗?当技术像机器学习一样被炒作时,就会出现误解和错误概念。以下是对机器学习到底能干些什么和不能干些什么的一个清醒认识。机器学习正在被证明非常有用,认为它们能够解决所有的问题以及能够应用到所有环境中的想法十分具有吸引力。然而,与其他任何工具一样,机器学习只在特定的领域有用,特别是对于那些一直困扰我们但我们又清楚无法通过雇用充足人员加以解决的问题,或是有着明确目标但又无明确方法得以解决的问题。每一家企业可能都会以不同的方式利用机器学习的优点。在管理咨询公司Accenture近期的调查中,42%的企业主管表示,他们认为到2021年,所有的创新活动背后都有人工智能的
2、支持。但是如果能够清醒地认识到炒作的存在,避免由误解机器学习的能力而造就的神话,这将会让我们受益匪浅。误区1:机器学习就是人工智能机器学习和人工智能常常被作为同义词使用,然而尽管机器学习已经成功由实验室走入现实世界,但人工智能的覆盖领域更为广阔,如计算机视觉、机器人技术、自然语言处理,以及不涉及机器学习的约束补偿等解决方案。我们可以把它想象成能让机器看起来更聪明的东西。有些人所担心的那种将会与人类竞争甚至是攻击人类的“人工智能”,上述这些没有一个是。我们应当对各种流行词汇保持清醒和精准认识。机器学习是指学习模式和利用大数据集预测结果。结论可能貌似“智能”,但是实际上它们只是以前所未有的速度和规
3、模展开运算的应用统计学。误区2:所有数据都是有用的我们需要为机器学习提供数据,但是并非所有的数据对机器学习都有用。为了训练这些系统,我们需要具有代表性的数据,这些数据要涵盖机器学习系统将要处理的模式和结果。数据中不能有无关的模式(如所有男生都站着而所有女生都坐着的照片,或是所有的汽车都在车库中而所有的自行车都在泥泞野外的照片)。因为我们创建的机器学习模型将反映那些过于具体的模式,并在我们使用的数据中查找这些模式。所有用于培训的数据应当被清楚地标记,同时标示出它们的特征,这些特征还要与将要询问机器学习系统的问题相匹配。这些需要做大量的工作。不要想当然地认为我们拥有的数据都是干净、清晰、具有代表性
4、或易于标记的数据。误区3:我们总是需要大量的数据得益于更好的工具、能够并行处理海量数据的GPU等计算硬件、大量被标记的数据集(如ImageNet和斯坦福大学问答数据集),机器学习在图像识别、机器阅读理解、语言翻译等领域取得了重大进展。借助被称为“迁移学习”的技术,我们在特定领域内并不需要庞大的数理集才能得出优秀的结果。相反,我们可以教机器学习系统如何学习使用一个庞大的数据集,然后让它们使用这种能力去学习我们自己的一个要小很多的训练数据集。这就是Salesforce和微软Azure自定义视觉API的工作原理:只需要30-50张能够展示我们想要的分类内容的图片就能得出优秀结果。迁移学习可通过相对较
5、少的数据就为我们的问题定制一个预先训练好的系统。误区4:任何人都可以创建一个机器学习系统目前已经出现了许多针对机器学习的开源工具和架构,以及大量教授我们如何使用它们的培训课程。但是机器学习仍然是一个极为专业的技术,我们需要知道如何准备数据并将它们拆分用于训练和测试,需要知道如何选择最佳的算法和使用何种启发式算法,以及如何将它们变成一个可靠的生产系统。此外,我们还需要监测系统,确保随着时间的推移结果保持相关性。无论是市场发生了变化,还是机器学习系统已经足以满足应对不同类型的客户,我们都需要不断检查,让模型始终与我们的问题相匹配。让机器学习保持适用需要丰富的经验。如果是刚开始起步,在聘用数据科学和
6、机器学习专家创建定制系统的同时,我们还需要关注能够从内部代码调用的预训练模型的API。误区5:数据中的所有模式都有用哮喘病人、胸痛病人或心脏病病人以及任何年龄在100岁的老人在得了肺炎后的存活率要比我们想象的高。事实上,用于实现住院自动化的简单的机器学习系统可能会让他们回家,不让他们接受住院治疗(基于规则的系统使用与神经网络完全相同的数据进行训练)。病人有如此高的存活率的原因在于,因为肺炎对这几类病人非常凶险,因此他们总是能够立即被安排住院治疗。系统会查看数据中的有效模式,而有些(尽管可以帮助保险公司预测治疗成本但是)对于选择谁该住院来说并不是一个有用的模式。更为危险的是,我们不知道那些无用的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 机器 学习 这九大 误区 几个 知道
链接地址:https://www.31doc.com/p-3388557.html