基于倒谱特征的说话人识别.doc

资料分类:电气工程 上传会员:暖暖大将军 更新时间:2024-08-12
需要金币1000 个金币 资料包括:完整论文 下载论文
转换比率:金额 X 10=金币数量, 例100元=1000金币 论文字数:14949
折扣与优惠:团购最低可5折优惠 - 了解详情 论文格式:Word格式(*.doc)

摘要:近些年来,计算机和通信产业的高速发展不断推动着生物识别的研究,说话人识别则是其中最热门的领域之一。与其他生物识别相比,因为其显著的低成本,便利的使用,识别率高的优秀特性,多年来一直是生物识别技术研究的重点。

 结合说话人识别的基本方法和语音信号的倒谱域分析理论,选择Mel频率倒谱系数参数(Mel Frequency Cepstrum Coefficient,MFCC)作为声音的特征参数,并与传统的LPC参数作比较。用矢量量化的方式对特征矢量进行处理并生成生成码本空间。通过编写Matlab代码实现说话人系统的构建并测试它的识别率。通过测试得知Mel频率倒谱系数比LPC参数拥有更高的识别率。 并且通过增大码本大小和改变失真测度的方法可以进一步提升系统的识别率,达到87%。

 

关键词:说话人识别;MFCC;矢量量化

 

目  录

摘  要

ABSTRACT

第一章  绪  论-1

1.1 说话人识别的基本概念-1

1.2 说话人识别的分类-1

1.3 说话人识别的历史和发展趋势-2

1.4 本论文的内容安排-2

第二章  语音信号及说话人识别的基本理论-4

2.1 语音信号的数学模型-4

2.1.1 激励模型-4

2.1.2 声道模型-5

2.1.3 辐射模型-6

2.2 语音信号的分类-6

2.2.1 浊音-6

2.2.2 清音和爆破音-7

2.3 语音信号的预处理-7

2.3.1 预加重和去加重-7

2.3.2 加窗和分帧-7

2.4 说话人识别基本理论-8

2.4.1说话人识别框图-8

2.4.2说话人识别与语音识别、语义识别的区别-9

2.4.3 说话人识别常用特征参数-9

2.5 本章小结-10

第三章  用于说话人识别的倒谱参数-11

3.1 特征参数选取的重要性-11

3.2 常用的特征参数-11

3.2.1 LPC系数-11

3.2.2 倒谱特征系数-12

3.2.3 Mel倒谱系数-13

3.3 本章小结-14

第四章  矢量量化在说话人识别中的的应用-15

4.1 说话人识别的基本方法-15

4.2 矢量量化的应用-15

4.2.1 矢量量化的基本原理-15

4.2.2 矢量量化的失真测度的选取-16

4.2.3 矢量量化的最佳码本设计-16

4.2.4 基于矢量量化的识别过程-18

4.3 本章小结-18

第五章  基于倒谱特征的说话人识别系统构建-19

5.1语音信号的预处理-19

5.2 特征参数的选取-20

5.3训练模块中码本的选择和建立-20

5.4识别模块中计算判决距离,做出判决-21

5.5 本章小结-22

第六章 系统的仿真与实现-23

6.1 实验环境-23

6.2 系统的工作流程-23

6.2.1 语音信号的获取-23

6.2.2 提取特征参数-23

6.2.3 码本的建立和选择-24

6.3实验结果与分析-24

6.3.1 对比MFCC参数和LPC参数的系统识别率-24

6.3.2 改变码本大小对识别率的影响-25

6.3.3 改变失真测度对识别率的影响-25

6.4 实验结果分析-25

结束语-26

参考文献-27

致  谢-28

相关论文资料:
最新评论
上传会员 暖暖大将军 对本文的描述:根据目的的不同将其分为说话人确认及辨认,其中说话人确认是说话人表明身份后,由系统对其进行验证;另一个则是不进行提前的声明,由系统来判断其身份。另一种则分为与文本无......
发表评论 (我们特别支持正能量传递,您的参与就是我们最好的动力)
注册会员后发表精彩评论奖励积分,积分可以换金币,用于下载需要金币的原创资料。
您的昵称: 验证码: