首页科技 AI语音在嘈杂环境比真人语音更易懂

AI语音在嘈杂环境比真人语音更易懂

华侨网 2026年4月28日

英国伦敦大学学院与罗汉普顿大学两位研究人员，对比了真人语音与人工智能（AI）生成的克隆语音的易懂程度。结果出人意料：在嘈杂环境中，克隆语音比真人语音更清晰易辨。相关论文发表于新一期《美国声学学会杂志》。

从Siri、Alexa等数字助手，到自动电话推销员和语音答录机，合成语音已悄然融入人们的生活。而生成式AI的进步，更催生了新一代合成语音——克隆语音。与传统合成语音不同，克隆语音无需配音演员在录音棚里耗费数小时，只需短短10秒的真人录音，便可复刻出几乎以假乱真的声音。

研究人员分析了上百项声学指标。他们原以为，克隆语音不过是真人语音的拙劣模仿，常人难以听懂。然而实验结果令他们震惊：克隆语音的易懂度竟比真人语音高出20%。

研究人员先让志愿者评价真人语音与克隆语音的清晰度，发现克隆语音更胜一筹。随后，他们又用老年志愿者（考察听力衰退的影响）、美国志愿者（考察口音差异）以及模拟人工耳蜗的滤波器（考察极端听力环境）反复验证。在每一种情况下，克隆语音的可理解性都超过人类语音。

研究人员还计划与文本转语音系统的专家合作，优化现有的开源克隆系统，以进一步研究为何克隆语音比真人语音更易懂这一现象。

免责声明：本文仅代表作者个人观点，与华侨网无关联。其原创性及文中陈诉内容未经本网证实，对本文内容、文字的完整、真实性，以及时效性本网部作任何承诺，请读者自行核实相关内容。如发现稿件侵权，或作者无意愿在华侨网发布文章，请版权拥有者通知华侨网处理。

标签:AI 人工智能大学美国