想象一下,处在一个嘈杂的鸡尾酒会上,同时听到多个声源,有多人同时说话的声音、背景音乐声、餐具碰撞声、环境噪声等等。这样复杂的聆听环境,在听力学中常常被称为“鸡尾酒会难题”。
我们或许都有过这样的经验。尽管环境非常嘈杂,我们仍然能把注意力放在对话方说话的声音上,忽略和过滤其他背景声。这种选择性聆听的功能被称为“鸡尾酒会效应”,在1953年由英国认知科学家Edward Colin Cherry提出。
在酒会上将人声从环境噪声中分离出来对于正常听力人群来说也许不困难,但当我们的听力下降,我们还能够自动过滤背景声吗?研究显示,听力损失人群的降噪功能和选择性聆听功能都会因为听力系统损坏而下降,即使佩戴最先进的助听器也是如此。
将大脑功能复制到助听器?
所幸的是,科学家距离解决“鸡尾酒会难题”已经迈出了一步。2019年10月,纽约哥伦比亚大学Zukerman研究中心在《神经元》期刊发表了《关于人类听觉皮层的不同区域如何分离和重构混合语音的研究》,并指出如何将正常听力人群的大脑功能复制至助听器中,就是帮助听力损失人群克服“鸡尾酒会难题”的关键。
这项研究的负责人Nima Mesgrani在他还是马里兰大学研究生时就开始了这条探索之路。Mesgrani说:“当时,我想了解如果听众在多声源的场景中,大脑会重构出什么样的声音?我们的大脑会重建出所有的声源,还是只关注在某个声源呢?”
传统方向性并不能帮助大脑识别周围环境,使得听力损失用户仍然无法解决“鸡尾酒会难题”
在2012年, Mesgrani和他的团队通过研究显示大脑负责处理声音的区域非常敏感而强大,它可以毫不费力地过滤掉竞争声源,只放大特定的声音。虽然现有的助听器能够在放大语音的同时抑制环境噪声,但是很难达到大脑的精准和高效。这在嘈杂的环境中,例如家庭聚会,会严重地阻碍助听器用户顺畅沟通的能力,甚至会将他们与周围的人隔离开来。
Mesgrani和他的团队还做了另一项突破性的研究,他们将脑电波与分离的声源信号进行比较,并放大了与脑电波最相似的信号。研究结果显示当两个人互相交谈时,说话者的脑电波会逐渐变得与聆听者的脑电波相似。
助听新技术:脑电波操纵助听器,AI识别谈话人?
从不断的探索和研究中, Mesgrani和他的团队在2017年研究出一项实验技术,将强大的语音分离算法和神经学结合,模仿大脑检测和放大声音的天生能力,将助听器中的语音分离研究向前推进一步。
有别于现有的助听器,这种大脑控制的助听系统由人工智能(AI)驱动,不仅依靠外部的麦克风侦测环境声,还能检测助听器用户的脑电波并突出用户想关注的声音。这项新的技术会首先将单个说话者的声音从多个声源中分离出来,然后将每个说话者的声音与聆听者的脑电波进行比较,声音与聆听者脑电波最接近的会被放大。
虽然这项新技术的前景很好,但研究人员发现一个关键的限制:初版系统需要先经过训练才能识别特定的说话者声音。举个例子,当你和你家人在家对话时,这个系统可以识别和分析这些熟悉的声音,但是当家里来个客人时,这个系统会暂时失灵,没法立即识别和分析客人说话的声音。因此,Mesgrani和他的团队正以初版系统为基础,研究新算法并建立一个更复杂的系统。这个系统可以识别和分析所有声音,让用户可以在任何环境下与任何人对话。
延展阅读:为什么脑聆听理念如此重要?
正如“鸡尾酒会效应”带给我们的启示,大脑原本就有强大的分离处理能力。大脑的分离处理能力建立在对环境的整体感知上,区分不同声源的细微差别,过滤出想要听到的声源。
这也是为什么传统方向性技术一直难以解决复杂环境的原因。脑聆听理念根本上来讲是指助听器辅助大脑去聆听,在助听器中提前处理声音,还原细节,让播放出的声音更容易被大脑所识别。充分利用大脑的强大能力,才能从根源上解决噪声下难以理解的问题。
Copyright ©2013–2024 厦门艾声听力科技连锁有限公司 闽ICP备12006824号-3
免责声明