阿里通义音频生成大模型 FunAudioLLM 开源

07月

09日

阿里通义音频生成大模型 FunAudioLLM 开源

牛透社7月9日消息：近日，据阿里通义实验室消息，音频生成大模型项目FunAudioLLM 现已开源。该项目由两个核心模型SenseVoice和CosyVoice组成。

CosyVoice 专注于自然语音生成，具备多语言支持、音色和情感控制功能，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行方面表现出色。SenseVoice 则致力于高精度多语言语音识别、情感辨识和音频事件检测，同时还具备情感识别和声音事件检测能力，以及快速的推理速度。

新闻排行