XCLW23951 基于CNN模型的语音识别方法研究 (字数:8744)摘要语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。神经网络是现..
XCLW23951 基于CNN模型的语音识别方法研究 (字数:8744) 摘要 语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。 神经网络是现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。 近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高。高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中重要的模型。由于该模型对于大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈。为了解决该问题,研究者开始关注深度学习技术。引入了CNN深度学习模型研究连续语音说话人识别的问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法。模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征组合进行连续测量。实验结果表明,CSR-CNN算法在连续一片段说话人识别领域取得了比GMM-HMM更好的识别效果。 关键词 连续语音;语谱图;CSR-CNN;深度学习 目录 摘要 I 引言 4 第1章 绪论 5 1.1研究背景和意义 5 1.2国内外研究现状 5 第2章 语音识别技术难点 7 2.1适应性 7 2.2建模 7 2.3语义识别 7 2.4商品化 7 第3章 卷积神经网络理论 8 3.1CNN(卷积神经网络) 8 3.1.1卷积层 8 3.1.2线性整流层 10 3.1.3池化层 11 3.1.4全连接层 11 3.2语音识别的基本原理 11 3.2.1特征提取 11 3.2.2模式匹配 12 第4章 CNN在智能语音中的实现 13 4.1CNN在智能语音中的实现 13 4.2实验与结果分析 13 4.2.1 实验数据准备 13 4.2.2 训练测试数据安排 14 4.2.3 特征提取 14 4.2.4 声学模型训练 14 4.2.4.1 深度神经网络结构 14 4.2.4.2 卷积神经网络结构 14 4.2.5 系统评价 14 4.2.6 实验结果 14 4.2.7 实验分析 15 4.2.8 结论 15 4.3 CNN的优势 15 参考文献 17
|
上一篇:基于C#的太赫兹波双路透射系统的.. | 下一篇:基于Cocos2dx的《2048》游戏开发 |
点击查看关于 基于 CNN 模型 语音 识别 方法研究 的相关范文题目 | 【返回顶部】 |