9 月 13 日消息,据外媒 Neowin 今晚报道,微软发布了“突破性(breakthrough)的” Live Interpreter API,将实时多语言翻译能力引入 Azure Speech Translation。用户无需设置输入语言,就能实现流畅的跨语言沟通。
该功能支持 76 种语言和 143 个地区,具备自动识别语言、低延迟、接近人工口译的实时效果,还能使用个人语音保留说话者的风格和语气。目前已开放公测。
IT之家附地址:Announcing Live Interpreter API - Now in Public Preview
这项 API 可用于多语言呼叫中心、在线会议、课堂教学、社交电商直播等场景,软件开发者可以借此取消语言切换菜单,让对话过程中自由切换语言。
其中的个人语音功能尤为亮眼,其能够完整保留原说话者的语调和节奏,让翻译后的声音听起来更自然,并提供企业级的隐私和同意控制。
Live Interpreter API 基于 Azure Speech Translation 打造,能够实现连续语言识别、覆盖所有支持语言、并提供低延迟的语音翻译。
微软官方的新闻稿提到,公司已与安克创新合作展示实际应用。安克创新表示:“我们很高兴能与微软合作,展示 AI 与日常科技结合的可能性。借助 Live Interpreter,我们为全球用户带来更智能、直观且沉浸的视听体验。”
微软还提供了快速入门指南,方便开发者集成该功能。普通用户无需直接操作 API,就能通过接入该能力的应用或网站体验跨语言交流。