《自然语言处理技术》——实训18 语音合成.docx
《《自然语言处理技术》——实训18 语音合成.docx》由会员分享,可在线阅读,更多相关《《自然语言处理技术》——实训18 语音合成.docx(5页珍藏版)》请在三一文库上搜索。
1、项目6熟悉常见语音处理技术语音合成1实训目标(1) 掌握通过PyttSX3库中的init()方法构建TTS引擎对象。(2) 掌握PyttSX3库中的TTS引擎参数设置。(3) 掌握利用Iibrosa库合成语音并通过Matplotlib库实现可视化。2实训环境环境版本说明Windows1064电脑操作系统Python3.8.5Python语言版本pandas1.3.0主要用于数据读取、清洗等操作NumPy1.21.6主要用于Python中的数值计算jieba0.42.1主要用于文本分词Gensim4.2.0主要用于检索文本、计算文本相似度、训练词向量、建模主题等Matplotlib3.3.0主要
2、用于数据可视化PaddlePaddle2.4.2是一个深度学习框架,提供了高效的计算框架和优化算法PaddleSpeech1.2.0主要用于语音和音频中的各种关键任务的开发scikit-learn1.0.2广泛地用于统计分析和机器学习建模等数据科学领域Librosa0.8.1主要用于分析一般的音频信号,是一个非常强大的Python语音信号处理的第三方库NETK3.5是一个常用的自然语言处理工具包,可用于文本处理、语义分析、词性标注等SciPy1.7.3是一个科学计算工具包,可用于数学、科学、工程学等领域pyttsx32.9.0主要用于将文本转换成语音3实训说明SAPI(SpeechApplic
3、ationProgrammingInterface)是微软开发的一种语音合成和语音识别技术,将文本转换成语音的过程,也称为文本到语音(Text-to-Speech,TTS)合成。SAPI能将文本转换为语音,支持多种语音合成引擎,兼容多种语音格式以及文本格式。SAPI的工作流程如图3-1所示。图3-1SAPI工作流程图SAPI工作的具体步骤如下。(1)文本预处理。SAPl对输入的文本进行预处理,包括断句、分词、词性标注等操作,这些操作有助于识别和解析文本中的语法结构、特殊字符、缩略词等。(2)文本规范化。在此阶段中,SAPl会将文本中的数字、日期、时间、缩略词等非标准文本转换成标准文本。例如,将
4、3月23日”转换为“三月二十三日”。(3)语音合成。SAPl将标准化的文本转换为音素序列。音素是语言中最小的发音单位,可以看作是音位的具体发音。在Python中可以通过pyttsx3库快速调用SAPl接口实现语音合成,一般流程如图3-2所示。图3-2调用SAPI接口流程图4实训步骤4.1 构建pyttsx3的TTS引擎构建pyttsx3引擎对象,如代码4-1所示。代码4-1构建TTS引擎对象#导入yttsx3库importpyttsx3#使用pyttsx3库中的init()方法创建一个TTS引擎对象engine=pyttsx3.init()4.2 设置TTS引擎参数对TTS引擎参数,如语音速
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言处理技术 自然语言处理技术实训18 语音合成 自然语言 处理 技术 实训 18 语音 合成
