Microsoft 推出适用于 Azure OpenAI 的新 AI 文本到语音转换语音

Microsoft文本语音 (TTS) 应用程序推出了四种创新的 AI 神经语音,专为与 Azure OpenAI 服务集成而设计。这些语音已准备好增强基于语音的聊天机器人、语音助手和对话代理。

针对对话方案优化的语音

新引入的声音被命名为en-US-AndrewNeural,en-US-BrianNeural,en-US-EmmaNeuro(均为美国英语)和zh-CH-YunjieNeuro(中文)。这些语音已针对对话上下文进行了微调,目前可在三个区域提供公共预览版:美国东部、东南亚和西欧。Microsoft提供了这些语音的样本,突出了与现有的神经语音相比,它们在提供更自然和流畅的语音方面取得的进展。

“…友好,对生活持乐观态度,总是渴望帮助他人并分享有趣或实用的知识。说话的风格就像是和熟人喝茶的对话,保持着自然而不夸张的语气。Microsoft的这句话强调了每个声音背后的角色和语气。

声音背后的技术进步

Microsoft不断努力增强文本到语音转换(TTS)建模技术,从而显著提高了AI语音的质量。最近的项目,如DelightfulTTS 2和MuLanTTS,弥合了AI语音和专业人类录音之间的质量差距。这些项目在制作听起来更自然、更逼真的声音方面发挥了关键作用。这种技术进步为新引入的人工智能语音奠定了基础。

开发人员可以使用 Azure 语音 SDK 或 REST API 将这些语音无缝集成到其应用程序中。Azure 机器人框架还提供了用于制作智能机器人的功能,这些机器人可以利用这些新的神经 TTS 语音。

Microsoft 广泛的产品包括 400 多种神经语音,涵盖 140 多种语言和区域设置。这个庞大的数组可确保开发人员和企业拥有大量选择,以为其用户提供丰富的对话体验。

未经允许不得转载:表盘吧 » Microsoft 推出适用于 Azure OpenAI 的新 AI 文本到语音转换语音