卷积神经网络的介绍和应用用欧姆蛋来详细介绍.doc
《卷积神经网络的介绍和应用用欧姆蛋来详细介绍.doc》由会员分享,可在线阅读,更多相关《卷积神经网络的介绍和应用用欧姆蛋来详细介绍.doc(5页珍藏版)》请在三一文库上搜索。
1、卷积神经网络的介绍和应用用欧姆蛋来详细介绍介绍关于卷积神经网络从交通灯识别到更实际的应用,我经常听到这样一个问题:“会否出现一种深度学习“魔法”,它仅用图像作为单一输入就能判断出食物质量的好坏?”简而言之,在商业中需要的就是这个:当企业家面对机器学习时,他们是这样想的:欧姆蛋的“质量(quality)”是好的。这是一个不适定问题的例子:解决方案是否存在,解决方案是否唯一且稳定还没办法确定,因为“完成”的定义非常模糊(更不用说实现了)。虽然这篇文章并不是关于高效沟通或是项目管理,但有一点是很有必要的:永远不要对没有明确范围的项目作出承诺。解决这种模棱两可的问题,一个好办法是先构建一个原型模式,然
2、后再专注于完成后续任务的架构,这就是我们的策略。问题定义在我的原型实现中关注的是欧姆蛋(omelette),并构建了一个可扩展的数据管道,该管道输出煎蛋的感知“质量”。可以这样来概括:问题类型:多类别分类,6 种离散的质量类别:good, broken_yolk, overroasted, two_eggs, four_eggs, misplaced_pieces。数据集:人工收集了 351 个 DSLR 相机拍摄的各种煎蛋,其中:训练集包含 139 张图像;训练过程中的测试集包含 32 张图像;测试集包含 180 张图像。标签:每张照片都标有主观的质量等级。度量标准:分类交叉熵。必要的知识:
3、三个蛋黄没有破损,有一些培根和欧芹,没有烧焦或残碎的食物,则可以定义为“好的”煎蛋。完成的定义:在两周的原型模式设计后,测试集上产生的最佳交叉熵。结果可视化:用于测试集上低维度数据展示的 t-SNE 算法。相机采集的输入图像本文的主要目标就是用一个神经网络分类器获取提取的信号,并对其进行融合,让分类器就测试集上每一项的类概率进行 softmax 预测。下面是一些我们提取并发现有用的信号:关键成分掩码(Mask R-CNN):Signal #1.按照每个成分分组的关键成分计数(基本上是不同成分计数的矩阵):Signal #2.移除盛欧姆蛋盘子的 RGB 颜色和背景,不添加到模型中。这就比较明显了
4、:只需用损失函数在这些图像上训练一个卷积网络分类器,在低维嵌入一个选定模型图像到当前图像之间的 L2 距离。但是这次训练只用了 139 张图像,因此无法验证这一假设。通用 50K 管道视图(50K Pipeline Overview)我省略了几个重要步骤,诸如数据发现和探索性分析,基线和 MASK R-CNN 的主动标记管道(这是我为半监督的实例注释所起的名称,启发来自Polygon-RNN demo video-https:/youtube/watch?v=S1UUR4FlJ84)。50K 管道视图如下:Mask R-CNN 以及管道的分类步骤主要有三个步骤:1用于成分掩码推断的 MASK
5、R-CNN,2基于 Keras 的卷积网络分类器,3t-SNE 算法的结果数据集可视化。步骤一:Mask R-CNN 和掩码推断MaskR-CNN 最近较为流行。从最初的Facebooks 论文开始,再到 Kaggle 上的 Data Science Bowl 2018,MASK R-CNN 证明了其强大的体系结构,比如分割(对象感知分割)。本文所使用的基于 Keras 的MRCNN代码结构良好、文档完整、工作迅速,但是速度比预期的要慢。最新论文所展现的 MRCNN 框架MRCNN 由两个部分组成:主干网络和网络头,它继承了FasterR-CNN架构。不管是基于特征金字塔网络(FPN)还是 R
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卷积 神经网络 介绍 用用 欧姆 详细
链接地址:https://www.31doc.com/p-3398934.html