04月

03日

  • Gladia 推出全球最快多语言实时语音模型 Solaria,转录提速近半秒,支持 42 种小众语言

    美国东部时间 2025 年 4 月 2 日,法国 AI 初创公司 Gladia 发布新一代语音识别模型 Solaria,主打实时多语言通信场景。该模型在英语、西班牙语等主流语言中实现 94% 单词准确率(行业最高)首词响应仅 270 毫秒(接近 Siri 级别)完整转录 698 毫秒(较 Deepgram 提速 49%,比 Speechmatics 快 66%)。其显著亮点包括:

    1. 覆盖百种语言生态,涵盖主流及 42 种稀缺语言(如孟加拉语、旁遮普语、毛利语),精准适配印度、东南亚等呼叫中心枢纽需求;

    2.抗噪自适应能力,可在嘈杂环境中解析行业术语(如医疗、金融行话),并学习特定企业员工语音特征;

    3.战略联姻开源框架 LiveKit,开放 API 供开发者构建多语言语音助手。

    据其 CEO Jean-Louis 透露,Solaria 已应用于全球超 700 家企业客户(包括 Attention、VEED.IO 等),其低延迟优势有望降低因语言障碍导致的商业损失——2023 年 Slator 报告显示 49% 企业高管因此产生财务风险。此次升级或重塑客服、会议记录等语音交互市场格局。

意见反馈
返回顶部