关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017388人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

黄慧颐手撕保剑锋 曾黎意外卷入风波

第一娱记 浏览 255 01-16

别说是大鹏,我都破防了…

仙女事件簿 浏览 566 08-12

赫罗纳3-3皇家奥维耶多,比尼亚斯破僵,戴维-卡尔莫扳平比分

懂球帝 浏览 285 10-26

广西一处收费站被指超期收费 村民:1天得花二三十块

三湘都市报 浏览 916 08-05

不满美威胁 格陵兰岛自治政府总理:我们未来自己决定

环球网资讯 浏览 286 01-18

女友BELLA+封面 | BossNoeul:爱的回声

伊周潮流 浏览 395 08-30

硅谷“抢人”大战中OpenAI先乱了?人事主管突然离职 据传也被“挖角”

财联社 浏览 487 08-23

金种子酒1.26亿卖掉金太阳药业,能否“轻装上阵”突围亏损困局?

征探财经 浏览 269 11-11

普通人夏天应该怎么穿衣?多穿基础色和基础款,简单又得体

静儿时尚达人 浏览 1138 06-30

得了方媛的病却没方媛的命,叶珂终付出了代价

乡野小珥 浏览 7218 08-11

smart的新战事:经典小车猛攻大众市场

网易汽车 浏览 398 06-07

从WAIC上爆火的功夫机器人,看到这家央企的具身智能「真功夫」

机器之心Pro 浏览 6309 07-29

全场最后一回合布朗尼杀出抢断 冲击篮下压哨上篮!

直播吧 浏览 6916 07-13

三万一辆的剁椒鱼头,成了不买房的年轻人的新家

快刀财经 浏览 415 09-10

内塔尼亚胡证实以色列打死伊朗情报部门负责人

央视新闻客户端 浏览 5489 06-17

上海AI判定停车费被指掐秒算钱:让人下车停12秒收4元

潇湘晨报 浏览 522 08-28

周受资,晋升一位90后女将

华尔街见闻官方 浏览 312 10-26

售9.98万起 2026款极狐考拉S正式上市

网易汽车 浏览 258 01-16

德米纳尔救赛点夺第十冠,90后冠军数排行榜上能列第几?

网球之家 浏览 3140 07-30

84岁老太被大女儿带出养老院盗取40万存款 老人起诉了

大风新闻 浏览 472 08-16

光伏反内卷会议:细节探讨将在今明两天展开

第一财经资讯 浏览 475 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11