语音大模型#1:MMS 模型可识别 1100+语言,旨在保护世界语种的多样性。MMS 模型在2023 年 5 月推出。现有的语音识别模型覆盖约 100 种语言,仅为地球上已知的 7,000 多种语言的小部分,MMS 使用 wav2vec 2.0 的自监督学习,支持 1,107 种语言的语音转文字和文字转语音以及超过 4,000 种语言的语言识别。MMS 用圣经训练,与 OpenAI Whisper 相比,使用 MMS 数据训练的模型支持 11 倍以上的语言,且在 54 种语言上的平均错误率仅为一半。