答辩公告
我的位置在: 首页 > 答辩公告 > 正文
肖宇锋预答辩公告
浏览次数:日期:2020-08-25编辑:研究生教务办2

肖宇锋预答辩公告

论文题目

基于深度学习的语音情感分类器研究

答辩人

肖宇锋

指导教师

赵欢

答辩委员会

主席

罗娟

学科专业

计算机科学与技术

学院

信息科学与工程学院

答辩地点

视频答辩

答辩时间

2020826日  晚上700

学位论文简介

语音情感识别技术旨在分析和提取语音信号中包含的情感信息来判断说话人的情感状态,是语音信息处理和人机交互领域的研究热点之一。近年来,随着深度学习在语音识别、图像处理等领域的成功应用,越来越多的研究者专注于将深度学习引入语音情感识别处理中。现有研究成果表明,尽管基于深度学习的语音情感识别算法的性能相比于传统分类算法得到了很大的提升,但是其识别性能依旧面临着巨大的挑战,包括域不匹配问题,标签数据稀缺和模型复杂度高等。本文主要研究内容和贡献包含以下几个方面:

1)提出了基于类对齐和广义域不变特征学习的语音情感识别模型来解决训练集(源域)与测试集(目标域)之间存在的域不匹配问题;

2)提出了一种基于半监督对抗变分自编码的语音情感识别模型,该模型融合了半监督变分自编码对输入数据在特征空间分布的学习能力和生成对抗网络对数据分布的强大拟合能力来缓解模型训练对标签数据的依赖,并且提高特征表达能力来改善模型性能;

3)提出了对抗训练训练的鲁棒性半监督对抗生成网络模型,该模型利用对抗训练和虚拟对抗训练对对抗方向的对抗样本进行平滑,提高模型的鲁棒性;

4)提出了基于二值化压缩的卷积式循环神经网络,该模型利用二值化函数将网络中浮点型的输入和权重值压缩成-1/+1表示,减少模型对存储空间和计算量的需求,在保证性能的前提下将模型运行于资源受限的移动平台。


主要学术成果

[1] Huan Zhao, Yufeng Xiao, Jing Han, Zixing Zhang. Compact Convolutional Recurrent Neural Networks via Binarization for Speech Emotion Recognition. In: Proc. of International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brighton, UK. IEEE, 2019, 6690-6694 (CCF B).

[2] Yufeng Xiao, Huan Zhao, Tingting Li. Learning Class-Aligned and Generalized Domain-Invariant Representations for Speech Emotion Recognition. IEEE Transactions on Emerging Topics in Computational Intelligence, 2020, 4(4):480-489.

[3] Huan Zhao, Yufeng Xiao, Zixing Zhang. Robust Semisupervised Generative Adversarial Networks for Speech Emotion Recognition via Distribution Smoothness. IEEE Access, 8(2020): 106889-106900. (SCI 2)


上一篇:
肖湘预答辩公告
下一篇:
张佳预答辩公告