语音技术长期面临“数据偏食”问题:英语、中文等高资源语言模型飞速迭代,而非洲大陆上百种本土语言却在AI训练数据中近乎“失声”。为填补这一空白,谷歌AI联合多方研究者正式开源WAXAL——迄今规模最大的开源非洲多语种语音数据集。该数据集覆盖尼日利亚豪萨语、南非祖鲁语、肯尼亚斯瓦希里语等24种非洲语言,包含高质量录音、精准对齐的文本转录及发音标注,全部采用CC-BY 4.0协议开放,支持ASR(语音识别)与TTS(语音合成)模型训练。尤为关键的是,WAXAL强调本地化采集:超80%音频由母语者在真实生活场景中录制,并经语言学家审核,显著提升数据文化适配性与实用性。此举不仅助力非洲开发者构建本土化语音应用,也为全球AI公平性提供了可复用的协作范式。研究人员表示,未来将持续扩展语种与方言覆盖,并推动社区共建机制。
来源:MarkTechPost
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END


请登录后查看评论内容