《自然语言处理技术》——实训16 提取MFCC特征.docx
《《自然语言处理技术》——实训16 提取MFCC特征.docx》由会员分享,可在线阅读,更多相关《《自然语言处理技术》——实训16 提取MFCC特征.docx(5页珍藏版)》请在三一文库上搜索。
1、项目5初识语音数据加工处理提取MFCC特征1实训目标(1) 掌握Iibrosa库提取MFCC特征的流程。(2) 掌握通过librosa.feature中的mfcc函数实现MFCC特征提取。(3) 熟练掌握使用Matplotlib库对MFCC特征进行可视化展示。2实训环境环境版本说明Windows1064电脑操作系统Python3.8.5Python语言版本pandas1.3.0主要用于数据读取、清洗等操作NumPy1.21.6主要用于Python中的数值计算jieba0.42.1主要用于文本分词Gensim4.2.0主要用于检索文本、计算文本相似度、训练词向量、建模主题等Matplotlib3
2、3.0主要用于数据可视化PaddlePaddle2.4.2是一个深度学习框架,提供了高效的计算框架和优化算法PaddleSpeech1.2.0主要用于语音和音频中的各种关键任务的开发scikit-learn1.0.2广泛地用于统计分析和机器学习建模等数据科学领域Librosa0.8.1主要用于分析一般的音频信号,是一个非常强大的Python语音信号处理的第三方库NLTK3.5是一个常用的自然语言处理工具包,可用于文本处理、语义分析、词性标注等SciPy1.7.3是一个科学计算工具包,可用于数学、科学、工程学等领域pyttsx32.9.0主要用于将文本转换成语音3实训说明在语音信号中,包含着非
3、常丰富的特征参数,各种不同的特征向量代表了不同的物理和声学属性。选择什么特征参数对说话人识别系统的成败意义重大。如果选择了好的特征参数,那么将有助于提高识别率。特征提取就是要尽量取出或削减语音信号中与识别无关的信息的影响,减少后续识别阶段需处理的数据量,生成表征语音信号中携带的说话人信息的特征参数。根据语音特征的不同用途,需要提取不同的特征参数,从而保证识别的准确率。梅尔频率倒谱系数(MelFrequencycepstralCoefficients,MFCC)是一种常用的语音特征,模拟了人耳对声音的感知特性。梅尔频率倒谱系数考虑了人类听觉系统的非线性特性,使得提取到的特征更符合人类的语音感知。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理技术 自然语言处理技术实训16 提取MFCC特征 自然语言 处理 技术 实训 16 提取 MFCC 特征
