正常与病理嗓音分析识别虚拟仿真实验

正常与病理嗓音分析识别虚拟仿真实验

实验要求

由于病理嗓音的不可获取性,需要通过本实验,才能对病理嗓音进行声学分析。嗓音数据库内的正常嗓音和病理嗓音声音文件为对象,进行语音信号的预处理、语谱图绘制、特征提取、基于机器学习的语音识别,让学生完成语音信号处理的全过程,体会其中蕴含的数学信号处理课程中的基本理论和知识。

通过前期阅读语音信号处理相关书籍和文献,了解语音信号识别的流程;设计预加重滤波器(高通滤波器),提升高频部分,使信号的频谱变得平坦;按照短时分析法,设置帧长和帧移,并选择合适的窗函数,绘制并观察语谱图;提取预处理后语音信号的声学参数、线性预测倒谱系数(LPCC)和梅尔频率倒谱系数(MFCC)特征;选用主流机器学习分类器,采用10折交叉验证法进行正常嗓音和病理嗓音的识别。实验拓展任务:改变帧长,观察正常嗓音和病理嗓音的宽带和窄带语谱图,进行观察分析;综合评价LPCC特征(含不同阶数的选择)和MFCC特征(含不同滤波器个数的选择)在不同分类器下的识别性能;可自行设计特征参数进行二次开发实验;提出能够改进识别率的方法和思路,并进行实践。


教学成果

实验背景

嗓音疾病会使人发出的嗓音信号产生变化,使用信号处理方法能够实现低成本、非入侵、客观高效的嗓音疾病检测,本实验是解决语音信号处理领域问题的典型案例,具有较强实用意义。


设计原则

通过培养学生的实验操作技能,以及观察问题、分析问题和解决问题的能力,从而能够较全面地提高学生的基本素质。根据实验目的和实验所涉及的知识点,本实验采用老师演示实验和学生分组自主实验两种方式。演示实验主要由老师向学生介绍有关演示实验的思路并对实验结果进行科学地分析和说明。演示实验目的让学生了解实验过程和实验中所涉及到的基本知识。通过学生自主实验操作培养学生动手能力。


实验目标

通过实验让学生掌握基础的语音信号处理与机器学习方法,加深学生对课本知识的理解,增强学生对知识的实际应用能力,培养学生的思考、探索与创新能力以及严谨的治学态度。

实验后,学生应(1)了解预加重的含义及作用,掌握预加重的方法;(2)了解汉宁窗、矩形窗、三角窗、海明窗、布拉克曼窗等窗函数间的联系与区别,帧移、帧长对分帧结果的影响,掌握语音信号分帧方法;(3)了解语谱图的含义,掌握语谱图的绘制步骤;(4)了解基频类、振幅类、LPCC、MFCC等声学参数的概念,以及阶数对LPCC、MFCC等参数识别能力的影响;(5)了解并掌握十折交叉验证方法;(6)了解贝叶斯概率、反向传播神经网路、支持向量机、K最邻近、决策树等常见机器学习方法,并知道彼此间的区别,掌握使用这些机器学习方法进行分类实验的步骤。


成绩评定

采用基于过程化的考核评价方式,首先通过指导老师讲解,让学生对实验过程有个初步了解,随后进行预习讨论,让学生进行初步探讨,随后进行实验过程,最终形成实验报告,从而确定本次实验的考核成绩。