作者
Glaciohound
编辑陈彩娴
能够统一地理解语音和文本,是人类能够形成通用语言能力的重要原因。那么,人工智能是否也能如此?最近,来自字节跳动和UIUC的研究人员借鉴这一思路,设计了一个跨模态的翻译模型——Chimera(奇美拉)。它不仅在一项标杆性语音翻译任务中获得高分,其可视化结果也证实了这一机制能更好地理解人类语言。
论文:LearningSharedSemanticSpaceforSpeech-to-TextTranslation/在语音翻译任务中学习共享的语义空间(ACLFindings)
Arxiv链接: