一项新技术的研究者们宣布,在大脑活动的基础上,将语音合成技术提升到了一个新的层次,使得其更加接近真实的语音,加州大学旧金山分校(UCSF)的神经科学家创建了一个脑机界面,利用两个步骤来解释大脑语言区的信号。
researchers并不是试图将大脑活动直接转化为声音,而是将神经信号转换为人类声道来以数字方式创造这些声音的运动,实验结果显示,人工语音不仅更接近真实的人声,而且开始接近正常谈话速度。
“我们的研究首次表明,我们可以根据个人的大脑活动生成完整的口语句子,”加州大学旧金山分校神经外科教授Edward Chang周二告诉记者。
去年,麻省理工学院采用了一种切向相关的方法,使用耳机接收从大脑发送到嘴巴和下巴的信号,新系统正在Chang的实验室中开发,该团队的进展在周三发表在《自然》杂志上的一篇文章中有所概述。
研究人员与少数志愿者进行了这项研究,这些志愿者已经在他们的大脑中植入了临时电极,为神经外科治疗癫痫做准备,当他们的大脑活动被记录下来时,他们被要求大声读出几百个句子,这些数据以及参与者语音的录音,使科学家们能够创建一个虚拟的声道,可以通过大脑活动来控制用于创建语音的解剖结构的详细计算机模拟。
下面是研究的一些关键点:
1、使用计算机模拟明确模拟参与者声带的运动。
2、首次表明,我们可以根据个人的大脑活动生成完整的口语句子。
3、研究者表示,这种方法可能对语言障碍患者具有临床可行性。
4、一些研究者指出,虽然目前的系统有一些缺点,但未来可能会改进。
这项研究是一个重要的里程碑,为未来的语音合成技术提供了新的可能性。
0