325日,在中国国际音频产业大会(Global Audio Summit,简称 GAS)上,歌尔携智能眼镜全栈声学解决方案亮相,首次发布自研智能眼镜语音分离算法,系统展示声学语音采集增强+沉浸式音效全链路技术能力。

语音采集增强领域,针对当前智能眼镜在复杂环境下双向对话与翻译存在的人声混叠、AI识别不准的行业共性难题,歌尔首次推出智能眼镜双路语音分离算法。该方案适配多种MIC阵列组合,结合基于深度神经网络(DNN)的降噪技术,可在嘈杂场景下实时精准拾取佩戴人与对讲人的语音,无论是双向对话还是翻译场景,均可有效锁定目标人声。同时,方案集成AI智能通话降噪、VPU(骨传导)鼻托模组、立体声录音、全向/近端/远端拾音等技术,助力智能眼镜在全场景下实现 “降噪强、听得清、听得准、分离稳的语音交互体验。 

参观者在歌尔展台了解智能眼镜音频算法

沉浸式音效领域,歌尔为智能眼镜定制开发高性能扬声器,并融合低音增强、动态杂音抑制、失真消除、立体声空间化四项自研核心算法,实现低音听感等效提升3dB,杂音抑制率超过90%,失真消除率最高达到80%以上,大幅度提升声场环绕感,实现360°沉浸式音频体验。有效解决轻薄型智能眼镜在响度、失真和沉浸感等方面的行业难题。

此外,歌尔还展示了一站式音频工具链解决方案,覆盖从算法设计、仿真调试到产品量产的全流程,可将音频应用开发周期缩短约60%,助力全球行业伙伴加速音频产品的创新与落地。

未来,歌尔将持续深耕声学技术创新,深化算法、硬件、工艺协同突破,携手行业伙伴共同打造AI时代智能眼镜音频新体验。

来源:歌尔股份

艾邦建有AR/VR产业链微信群,目前有HTC、PICO、OPPO、亮亮视野、光粒科技、影创、创维、佳视、歌尔、立讯精密、多哚(纳立多)、欣旺达、耐德佳,联创电子、至格科技、灵犀微光、舜宇光学、广景视睿、珑璟光电、京东方、海信视像、科煦智能、阿科玛、金发科技、思立可、新安天玉、四方超轻、大族激光、发那科、承熹机电等加入,也欢迎大家长按下方图片识别二维码加入微信群:
资料下载:
欢迎您点击此处加入AR/VR通讯录,目前已经有3000多人加入,如歌尔、HTC、OPPO、创维、PICO、字节跳动、黑鲨、联想、耐德佳、灵犀微光、立讯、领益智造、欧菲光、华勤、闻泰、立讯、珑璟光电、舜宇、深圳虚拟现实等,点击下方关键词可以筛选

作者 sun, keting