一文读懂机器学习的线性代数(10案例).doc
《一文读懂机器学习的线性代数(10案例).doc》由会员分享,可在线阅读,更多相关《一文读懂机器学习的线性代数(10案例).doc(5页珍藏版)》请在三一文库上搜索。
1、一文读懂机器学习的线性代数(10案例)线性代数是数学的分支学科,涉及矢量、矩阵和线性变换。它是机器学习的重要基础,从描述算法操作的符号到代码中算法的实现,都属于该学科的研究范围。虽然线性代数是机器学习领域不可或缺的一部分,但二者的紧密关系往往无法解释,或只能用抽象概念(如向量空间或特定矩阵运算)解释。阅读这篇文章后,你将会了解到:如何在处理数据时使用线性代数结构,如表格数据集和图像。数据准备过程中用到的线性代数概念,例如 one-hot 编码和降维。深度学习、自然语言处理和推荐系统等子领域中线性代数符号和方法的深入使用。让我们开始吧。这 10 个机器学习案例分别是:Dataset and Da
2、ta Files 数据集和数据文件Images and Photographs 图像和照片One-Hot Encoding one-hot 编码Linear Regression 线性回归RegularizaTIon 正则化Principal Component Analysis 主成分分析Singular-Value DecomposiTIon 奇异值分解Latent SemanTIc Analysis 潜在语义分析Recommender Systems 推荐系统Deep Learning 深度学习1. 数据集和数据文件在机器学习中,你可以在数据集上拟合一个模型。这是表格式的一组数字,其中每
3、行代表一组观察值,每列代表观测的一个特征。例如,下面这组数据是鸢尾花数据集的一部分5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa5.0,3.6,1.4,0.2,Iris-setosa这些数据实际上是一个矩阵:线性代数中的一个关键数据结构。接下来,将数据分解为输入数据和输出数据,来拟合一个监督机器学习模型(如测量值和花卉品种),得到矩阵(X)和矢量(y)。矢量是线性代数中的另一个关键数据结构。每行长度相同,即每行的数据个数相同,
4、因此我们可以说数据是矢量化的。这些行数据可以一次性或成批地提供给模型,并且可以预先配置模型,以得到固定宽度的行数据。2. 图像和照片也许你更习惯于在计算机视觉应用中处理图像或照片。你使用的每个图像本身都是一个固定宽度和高度的表格结构,每个单元格有用于表示黑白图像的 1 个像素值或表示彩色图像的 3 个像素值。照片也是线性代数矩阵的一种。与图像相关的操作,如裁剪、缩放、剪切等,都是使用线性代数的符号和运算来描述的。3. one-hot 编码有时机器学习中要用到分类数据。可能是用于解决分类问题的类别标签,也可能是分类输入变量。对分类变量进行编码以使它们更易于使用并通过某些技术进行学习是很常见的。o
5、ne-hot 编码是一种常见的分类变量编码。one-hot 编码可以理解为:创建一个表格,用列表示每个类别,用行表示数据集中每个例子。在列中为给定行的分类值添加一个检查或1值,并将0值添加到所有其他列。例如,共计 3 行的颜色变量:redgreenblue。.这些变量可能被编码为:red, green, blue 1, 0, 0 0, 1, 0 0, 0, 1 。.每一行都被编码为一个二进制矢量,一个被赋予0或1值的矢量。这是一个稀疏表征的例子,线性代数的一个完整子域。4. 线性回归线性回归是一种用于描述变量之间关系的统计学传统方法。该方法通常在机器学习中用于预测较简单的回归问题的数值。描述和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 读懂 机器 学习 线性代数 10 案例
链接地址:https://www.31doc.com/p-3363341.html