谷歌开源非洲24种语言语音数据集WAXAL

语音技术长期面临“数据偏食”问题:英语、中文等高资源语言模型飞速迭代,而非洲大陆上百种本土语言却在AI训练数据中近乎“失声”。为填补这一空白,谷歌AI联合多方研究者正式开源WAXAL——迄今规模最大的开源非洲多语种语音数据集。该数据集覆盖尼日利亚豪萨语、南非祖鲁语、肯尼亚斯瓦希里语等24种非洲语言,包含高质量录音、精准对齐的文本转录及发音标注,全部采用CC-BY 4.0协议开放,支持ASR(语音识别)与TTS(语音合成)模型训练。尤为关键的是,WAXAL强调本地化采集:超80%音频由母语者在真实生活场景中录制,并经语言学家审核,显著提升数据文化适配性与实用性。此举不仅助力非洲开发者构建本土化语音应用,也为全球AI公平性提供了可复用的协作范式。研究人员表示,未来将持续扩展语种与方言覆盖,并推动社区共建机制。

来源:MarkTechPost

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片快捷回复

    请登录后查看评论内容