关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2025-11-09 00:00:01301人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

「长短剧」牌局开打,爱奇艺Q3要企稳?

节点财经 浏览 451 08-26

少林寺新方丈上任干了4件事 件件都像在打释永信的脸

隐于山海 浏览 4518 07-31

美军发阅兵式预热视频 出现"绞死比尔·盖茨"死亡威胁

环球时报国际 浏览 8222 06-12

记者:佛罗伦萨&费耶诺德均想截胡板仓滉,但球员只想去阿贾克斯

直播吧 浏览 9122 08-07

美因茨4-1大胜奥格斯堡,席布建功,内贝尔破门

懂球帝 浏览 407 09-21

特斯拉车顶维权女车主终审败诉,被判赔偿17万元,媒体人封某被判赔偿25万元

红星资本局 浏览 8889 07-12

风光储全景!系统级构网启幕

环球网资讯 浏览 406 09-26

全市场:贾沙里缺席布鲁日官方球迷活动,他只想转会到米兰

直播吧 浏览 3488 07-14

山姆卖好丽友260元会员费被质疑"割韭菜" 客服回应

每日经济新闻 浏览 2850 07-16

参与雅江水电站建设的,为什么都是重研发的企业?

BT财经 浏览 5539 07-31

离婚3年 孙怡妈话揭露女儿离婚现实

逍遥史记 浏览 5208 08-10

男子劫持飞机在机场盘旋约25分钟 F-15出动拦截

看看新闻Knews 浏览 2157 07-18

重温两次"夜间模式"的震撼 九三阅兵演练画面百看不厌

人民网-人民日报 浏览 336 08-21

新车看点 | 品牌重组后首款战略车型,东风风神L8预售不到13万元起

观察者网 浏览 2027 08-13

佩通坦含泪谴责柬埔寨向平民区开火:军方已做好准备

新京报 浏览 2211 07-25

预计月底!雷军太需要一场年度演讲了

三言科技 浏览 462 09-11

4年2.29亿提前续约!福克斯致谢马刺:很荣幸 迫不及待去共创未来

直播吧 浏览 1433 08-06

我国成功发射巴基斯坦遥感卫星01星

我们的太空 浏览 6270 07-31

"四子王旗警察枪击案"当事人刑满释放:我将继续申诉

红星新闻 浏览 506 09-01

英法德启动“快速恢复制裁”机制,伊朗谴责

环球网资讯 浏览 375 08-30

董璇再婚现场照曝光!关悦佟丽娅出席场面朴实,男方黑历史被扒

萌神木木 浏览 4057 07-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11