该报纸报道说,在人工智能(AI)期间,忽略了2,000多种非洲语言。例如,Chatgpt只能认识到豪萨(Hausa)的10%至20%的句子,这是9400万尼日利亚人所说的语言。由于缺乏培训数据,这些语言在大语言模型(LLM)中没有指出。如今,非洲国家的研究人员正在努力改变这种情况。根据大自然的说法,非洲“下一个语音”项目中的研究人员已被记录到来自各种非洲语言的9,000小时音频,并将其转换为数字语言数据集。最近,他们发布了第一批数据。这些数据是开放式访问,供开发人员将其包含在LLM中,作为语音到文本的那些模型或提供自动语言翻译。尼日利亚非P的首席官员Ife Adebara说:“我很高兴能改善特定语言的建模并帮助技术界的专注于非洲语言。”ROFIT技术“数据科学尼日利亚”。“ AI模型中本地语言的代表性不足仍然是维护最具促进的AI工具的主要挑战,Sanjay说。他说,重点是开发日常语言数据库。 SAI项目负责人他在组织联盟工作的团队使用这些数据来创建AI语言模型。他希望技术公司可以在此基础上有所改善。只要用户指示映射,项目结果就可以使用商业。 Jain说,现在有一些数据集可用,所有18种语言的数据将于今年晚些时候发布。 (Wenlele)