人工智能比真人还能聊
技术的进步让AI越来越逼真
语音合成还有另一个广泛使用的技术,那就是文字转语音技术。语音提示在生活中提供了很大帮助,但不是所有文字都有机会真人录音,所以也使用到了语音合成技术。现在有不少的展示项目、地图导航、影音内容都出现了文字转语音的身影。
文字可以转声音,声音也可以转成信号,对各种设备发出指令,今天的有方课题就将介绍如何从各种声音中避开杂音识别出声源信息并定位,一起来学习!
课题介绍
课题名称:基于深度学习的声源定位
相关学科:计算机科学技术
课题介绍:声源定位技术在当前科技中有着广泛的应用场景,并且在近几十年中一直是热门研究领域。通常来说,会采用一组麦克风阵列来捕捉声音信号,随后通过声源定位算法进行处理,从而识别与定位声源。由于声源定位技术可以在复杂环境中识别定位声源,并去除其他无关的噪声,从而增强我们想要保留的声音。这使得声源定位技术在语音识别、智能家居以及机器人听觉定位中有着重要意义。
如今声源定位技术已经被集成进亚马逊Echo、苹果公司HomePod、小米小爱音箱、谷歌Home等智能设备,是当今智能设备的重要组成部分。本次课题将以语音识别中的声源定位问题作为背景,带领学生学习声学基础知识,声学信号处理,麦克风阵列,以及深度学习。并且学生将会在导师的指导下,采用当前最先进的深度学习模型处理麦克风阵列的声学信号,完成对声源的识别和定位。学生可以从中感受到人工智能与语音相结合的魅力。
导师介绍
鲁汶大学KU Leuven(THE/USNews Top 50)机械工程博士,本硕毕业于南京航空航天大学;
研究方向为眼科手术机器人,人工智能和医学图像处理;
曾任南方科技大学科研教学助理,有丰富的教学及科研指导经验,发表多篇SCI顶级期刊论文。
添加小师姐,咨询了解