07月

09日

  • 阿里通义音频生成大模型 FunAudioLLM 开源

    牛透社7月9日消息:近日,据阿里通义实验室消息,音频生成大模型项目FunAudioLLM 现已开源。该项目由两个核心模型SenseVoice和CosyVoice组成。

    CosyVoice 专注于自然语音生成,具备多语言支持、音色和情感控制功能,在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行方面表现出色。SenseVoice 则致力于高精度多语言语音识别、情感辨识和音频事件检测,同时还具备情感识别和声音事件检测能力,以及快速的推理速度。

意见反馈
返回顶部