基于单片机的语音录放软件设计.doc
《基于单片机的语音录放软件设计.doc》由会员分享,可在线阅读,更多相关《基于单片机的语音录放软件设计.doc(40页珍藏版)》请在三一文库上搜索。
1、安徽工程大学毕业设计(论文)基于单片机的语音录放软件设计摘 要目前,语音合成、语音识别、语音存储和回放技术的应用越来越广泛,尽管利用一般的单片机测控系统中都有的硬件电路(如A/D、 D/A、存储器等)能完成语音信号的数字化处理,但是功能比较单一、且效果不是很好。本文采用单片机AT89C52与语音芯片ISD2560组成的语音存储系统,实现了语音的录取、回放,同时使用Matlab软件进行滤波和频谱分析,可实现简单的语音录放功能,且输出语音信号音质较好。 系统硬件电路简单,调试方便,性价比高,实用性强。关键词:语音录放系统;滤波;频谱分析Software Design of Voice-record
2、ing and Playing Based on MicrocontrollerAbstract At present, speech synthesis, speech recognition, voice storage and playback technology is more widely applied, despite the use of general monitoring and control system in the SCM have the hardware circuit (such as the A / D, D / A, memory, etc.) can
3、be completed Voice of the digital signal processing, but a single function of comparison, and the effect is not very good. In this paper, with the voice chip ISD2560 AT89C52 microcontroller consisting of voice storage system to achieve the acceptance speech, playback while using Matlab software to f
4、ilter and spectrum analysis, simple voice recording function, and good quality output speech signal.System hardware circuit is simple, easy adjustment, cost-effective and practical.Key words: Voice Recording and Playing System;Filter;Spectrum Analysis目 录引 言1第1章 绪论21.1 导言21.2 数字语音录放系统的发展2第2章 数字录音的基本原
5、理32.1模拟音频和数字音频32.2数字音频技术的概念32.3语音信号的数字化42.3.1 取样42.3.2 量化52.4 滤波和频谱分析62.4.1 采样定理62.4.2 采样频率62.4.3 语音的录入与打开72.4.4 时域信号的FFT分析72.4.5 数字滤波器设计原理7第3章 硬件系统的设计83.1总体方案论证83.2系统硬件电路设计83.3器件选择93.3.1单片机AT89C5293.3.2 ISD2560语音芯片10第4张 系统软件设计134.1 系统软件总流程图134.2 AT89C52 单片机对 ISD2560控制的软件设计134.2.1 录音软件设计134.2.2 放音软件
6、设计154.3滤波和频谱分析184.3.1 图形用户界面概念184.3.2 图形用户界面设计184.3.3 语音信号的读入与打开184.3.4 语音信号的定点分析19致 谢24参考文献25附录A 系统总电路图26附录B 外文文献27附录C 主要参考文献题录及其摘要31附录D 主程序清单33插图清单图2-1 数字录音系统图 .10 图2-2 数字放音系统图.10图3-1 硬件系统框图.14图3-2 硬件总电路图.15图3-3 AT89C52引脚图.18图3-5 ISD2560引脚图.18图4-1 软件流程图.20图4-2 录音软件程序框图.21图4-3 放音软件程序框图.23图4-4 语音信号引
7、入与打开图.26图4-5 语音信号定点分析图.27图5-1 滤波和频谱分析图.29插表清单表2-1 数字音频质量等级表.11表3-1 单片机引脚功能表.1735安徽工程大学毕业设计(论文)引 言随着我国经济建设的迅猛发展,公安、铁路、民航、金融等部门对语音记录的需求不断增长。把语音生成技术用于工业监控系统、自动应答系统、多媒体查询系统、智能化仪表、办公自动化系统或家用电气产品中,使它们具有语音输出功能,使之能在适当的时候用语音实时报告系统的工作状态、警告信息、提示信息或相关的解释说明等,无疑在提高人机通信能力、减少对错误处理的遗漏、提高系统性能、降低人们的工作强度等方面都有极大的好处。数字语音
8、录放系统是将现场的语音模拟信号转变为离散的数字信号,然后存储在一定的存储介质上的一种录音方式,它也是数字语音处理技术中常用的一种方式。采用数字录音技术,有较高的效率和自动化程度,录音时间也长,并可将信息长期保存于存储介质中,同时对语音信息进行编辑整理非常方便,可快速查找。实现数字语音录放系统可以采用PC机实现和嵌入式系统实现两种方式。当使用PC机的时候,由于它的体积庞大,耗电高,造价也高,并且在某些情况下系统的稳定性得不到保证所以用PC机来实现前述的各项功能和操作,就受到了一定的限制。而嵌入式系统的体积小,供电方便,造价低,稳定性也高,所以得到了广泛的应用。第1章 绪论1.1 导言目前基于单片
9、微机的语音系统的应用越来越广泛,如电脑语音钟、语音型数字万用表、手机话费查询系统、排队机、监控系统语音报警以及公共汽车报站器等等。本文用单片机AT89C52和录放时间达60S的数码语音芯片 ISD2560 设计了一套智能语音录放系统,实现了语音的录取、滤波和频谱分析、回放,通过软件的修改还可以实现整段录取,循环播放,而且不必使用专门的 ISD 语音开发设备。1.2 数字语音录放系统的发展数字语音录放是指利用数字技术对语音信号进行采集、处理、并且在一定存储设备中进行存储,并可在需要时进行输出的过程。相对于模拟设备来说,数字设备易于集成、小型化、成本更低,同时更为稳定,且操作更为直接、方便,使得数
10、字语音录放系统目前在各种领域中都得到了广泛的应用。例如监控环境中使用的语音采集系统;再如家庭或学校中使用的语音复读机等,都可看作是数字语音录放系统的典型应用。 然而目前一般的数字语音录放系统中,对语音只是进行简单的采集、存储和播放;虽然可以较大程度上保证语音的保真度,但过多的语音数据会造成对大量存储设备的需求。对于大型系统,可通过采用大容量的硬盘、甚至大规模的磁盘阵列来解决;但是对于小型的设备,例如便携式的语音复读机,由于容量有限,则不能采用同样的方法。 近年来,语音信号处理技术研究的突飞猛进,为数字语音录放系统提供了新的发展空间。对语音的采集、处理从以前简单的波形编码转变为进行参数编码、压缩
11、从而大大减少了存储数据。举例来说,原始语音一般都是采用8KHz抽样,16bits的线性PCM编码进行采集,在一般的系统中就直接将采集后的数据进行存储;而如果采用参数编码对采集后的数据进行压缩,存储量则可以大大减少,当需要恢复语音时,可利用编码后的参数进行合成,可以得到质量令人满意的结果。第2章 数字录音的基本原理2.1 模拟音频和数字音频声音是由物体振动产生的,振动发声的物体称为声源。在空气中,声源的振动会使周围的空气质点产生一定的疏密变化,并以一定的速度传播出去形成声波。因此声波是疏密波,也称为纵波。包围地球表面的大气层,随高度的不同而存在不同的大气压强。有声音存在时,大气压强会有微弱的起
12、伏变化,即在静态大气压强上叠加了变化的分量,这个变化的分量称为声压p,通常声压的大小用它的有效值P表示,单位是Pa。人耳刚好能听到的声压约为210-5Pa,在房间中大声说话,在相距1米处的声压约为0.050.1Pa。声音在1秒间所传播的距离称为声速c,单位是米/秒(m/s),在室温下,1个大气压的空气中,声速约为340m/s.当声源作周期性振动,所发出的声波也是做同样的周期性振动,声源或声波每秒钟内的振动次数称为声音的频率f,单位是赫兹Hz,人耳能听到的声音频率范围是2OHz-20kHz。单位时间内穿过垂直声波传播方向单位面积的声能称为声强,单位是瓦/平方米(W/m2)。人耳对声振动的感受,在
13、频率及声压级方面都有一定的范围,在这个范围以外的声振动人耳是听不到的。人耳能感觉到的声振动约在20Hz-20kHz之间,称为可听声。紊乱断续或统计上随机的声音称为噪声,对于不需要的声音也称为噪声。噪声也用它的声压级dB数来表示它的大小,称为噪声级。在寂静的环境里,人耳能分辨出轻微的声音,但在嘈杂的环境中,这些轻微的声音就被淹没掉了。由于第一个声音存在而使第二个声音提高的现象称为掩蔽效应。掩蔽效应对数字音频编码起到重要作用。2.2 数字音频技术的概念模拟量是指在时间上和幅度上都是连续的量,声波就是声压幅度随时间连续变化的模拟量,它由传声器转换成声频信号后,也是时间和电压幅度都连续变化的模拟信号。
14、如果幅度只是一些特定值的阶梯波,则是时间连续而幅度不连续的信号。幅度连续而时间不连续的信号是脉冲幅度(PAM)调制信号。时间和幅度都不连续的信号是数字信号。从模拟磁带录音机和数字磁带录音机的比较来看,模拟录音存在很多缺点:(1) 在录音、编辑和放音过程中混入的各种噪音不能被分离出来,形成对信号的损伤。(2) 录音媒体的信噪比可成为记录信号信噪比的一部分。(3) 录音磁头、放音磁头等呈现的非线性会使记录的信号也呈现非线性。(4) 驱动、转动机械系统的不稳定会造成抖晃。数录音是将模拟信号转变为离散的数字信号后进行记录的。对于需要多次转接、复制的模拟录音,每转接、复制一次,信号的质量下降程度就要累加
15、一次,而数字录音就没有这一问题。数字录音具有下列优占。(1) 数字化的标准(取样频率、量化比特数)确定以后,性能的界限也就确定了,性能是稳定的。(2) 录音是以“0”或“1”数字进行的,放音时,只需判断出“0”或“1”,即判断脉冲“有”“无”即可,因而记录媒体的信噪比与放音信噪比无直接的关系。(3) 许多器件不需要具有线性。(4) 驱动、转动系统的不稳定,由于时钟脉冲信号和存储器的作用,不会造成晃。防混叠低通滤波器取样/保持A/D变换器交织纠错码处理模拟声频信号数字音频信号记录图2-1 数字录音系统图模拟恢复低通滤波器 窗口 电路D/A变换器纠错码处理反交织重放数字声频信号模拟声频信号图2-2
16、 数字放音系统图放音录音2.3 语音信号的数字化将模拟信号转变成数字信号,需经过取样、量化和编码三个步骤。2.3.1 取样(1)取样定理模拟声频信号可用幅度对时间的关系来表示,将模拟信号的幅度以一定的时间间隔取得样值,称为取样(或采样、抽样)。取样的时间间隔称为取样周期,每秒内取样的次数称为取样频率。根据取样定理,当取样频率fs为被取样信号最高频率fh的两倍时,则被取样信号可以被恢复,即fs2fh。(2)取样频率取样频率的选取应考虑以下两点:1)声频信号的最高频率;2)防混叠低通滤波器的截止特性。数字音频的质量与采样频率和量化精度有关,数字音频可分为以下几个质量等级:表 2-1数字音频质量等级
17、表信号类型频率范围(Hz)采样频率(KHz量化精度(位)电话语音200340088宽带音频5070001616调频广播2015K37.816高质量音频2020K44.116由于本系统录音的对象是人说话时的语音,人的语音频率大概在300Hz至3.4KHz之间,根据取样定理,采样频率应该高于6.8K Hz,从表3.1可以看出,普通语音选取的是8 KHz,但为了提高声音的保真度,减少滤波实现的难度,同时与微机的录音频率最大程度地接近,所以系统选取采样频率为11.025KHz。3) 混叠的防止经过取样后,原信号的频谱分布要有改变。如果取样频率小于信号最高频率的两倍,或信号的实际最高频率超过了f,则会产
18、生频谱混叠现象,以后就无法将原信号复原,并且出现混叠噪声。为了将声频信号严格限制在f以下,应先让原信号通过一个高频截止频率为f的低通滤波器后再进行取样。4) 取样保持电路取样保持电路是在A/D变换器之前,为使取样保持一定时间而设的。由于A/D变换器的转换需要一定时间才能完成,而输入的模拟信号是不断变化的,因此取样值必须保持一定时间。5) 取样产生的孔径效应取样定理所叙述的由取样的PAM 信号可以完全恢复原模拟信号是有条件的,即取样脉冲的宽度(即脉冲所占时间)应为无限小,但实际的取样脉冲都有一定的宽度,这就会使恢复的模拟信号的高频特性产生失真,这种效应称为孔径效应。实验证明,当取样脉冲宽度为取样
19、周期的1/4时,孔径效应所产生的高频损失约为0.2dB,人耳对它不能察觉到,不会成为问题。2.3.2 量化(1)量化的概念将模拟信号的取样值,经“四舍五入”的方法转换成一种数字信号的过程称为量化。在数字语音技术中,我们采用二进制表示一个数,即用“1”“0”来表示一个数,逢2进1,用电路的接通和断开即可实现。采用二进制时的有效位数称为比特数或位数,在进行舍入运算的过程中会产生舍入误差。由取样定理知道,如果取样频率能满足这个定理,就会完全恢复原波形,但要真正完全恢复原波形,则需要无穷多位数。在通常的数字系统中,每个取样点都会产生舍入误差,并且存在与这种舍入误差相应的失真和噪声,称为量化噪声或量化失
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 单片机 语音 录放 软件设计
