多任务语音识别、翻译、语言ID
Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
录咖是一款AI智能多媒体服务...
将您的声音更改为我们为专业表演定制的任何精选声音
VAS视频加字幕是一款非常简单的视频加字幕和字幕翻译软件,通过AI一键视频加字幕、字幕翻译
字节旗下视频剪辑工具,内置强大的AI技术
根据心情为视频和播客创建 AI 生成的音乐
与大家分享音乐的乐趣。