关闭广告

武汉大学让AI学会诊断金融知识:像医生检查身体一样评估AI模型

科技行者2025-09-10 00:00:02421人阅读


这项由武汉大学人工智能学院的谢倩倩教授领导的研究团队在2025年8月发表,论文题为《From Scores to Skills: A Cognitive Diagnosis Framework for Evaluating Financial Large Language Models》,该研究首次将教育心理学中的认知诊断理论引入到金融AI评估领域。有兴趣深入了解的读者可以通过GitHub项目页面https://github.com/WHUNextGen/FinCDM访问完整研究成果。

当我们去医院体检时,医生不会只告诉你"身体状况70分"就完事,而是会详细检查你的心脏、肝脏、肺部各个器官的具体情况,告诉你哪里健康、哪里需要注意。但令人意外的是,在评估金融AI模型时,我们却一直在用那种简单粗暴的"总分"方式。

考虑这样一个场景:两个学生都考了80分,但一个是因为数学好语文差,另一个是语文好数学差。如果只看总分,我们永远不知道该给他们推荐什么样的补习班。武汉大学的研究团队发现,评估金融AI模型时也存在完全相同的问题。目前所有的评估方法都只给出一个总体得分,比如"在金融问答任务上准确率85%",但这个分数完全无法

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

合理膳食很重要!收好这份护胃小贴士

人民网-人民日报 浏览 10134 04-11

特朗普访问中东 此行瞄准的是啥

浏览 6002 07-14

高管震荡、次高端遇冷,舍得酒业做文旅能否破局?

征探财经 浏览 1534 08-07

美媒:用S-400换F-35 美国逼土耳其“二选一”

环球网资讯 浏览 255 12-12

海盗船发布《使命召唤:黑色行动 7》联名外设,含键盘等多款产品

IT之家 浏览 299 11-12

男子直播炫富称父母是东航招飞办负责人 曾为其破例招飞

潇湘晨报 浏览 9444 06-11

杨超越最新状态曝光!身材颜值全满分!

草莓解说体育 浏览 390 10-12

67岁梁家辉打戏封神!曾被封杀,妻子救了他

娱乐白名单 浏览 8282 08-14

国防部:美国"金穹"系统将打开潘多拉魔盒

界面新闻 浏览 4323 05-30

匈牙利维兹航空一航班自荷兰埃因霍温起飞后不久撞鸟返场

国际在线 浏览 5963 07-01

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者 浏览 345 10-28

硬件检测软件HWiNFO更新:新增RTX 5090D v2、提前支持Intel Nova Lake

快科技 浏览 564 08-13

分手传闻升级!鹿晗当众摘戒指 不给关晓彤留体面

白面书誏 浏览 9549 07-24

今年两院院士增选候选人名单有哪些看点?“85后”亮相,尖端领域群星闪耀

澎湃新闻 浏览 549 08-22

阿努廷当选泰国新任总理 外交部:表示祝贺

新京报 浏览 409 09-06

星链养AI,值不值?SpaceX的1.8万亿算力豪赌

钛媒体APP 浏览 27 06-02

把国产剧卖到非洲,80后小伙冲进福布斯榜

快刀财经 浏览 2616 07-17

追觅“星空计划”Nebula NEXT 01 Concept获CES官方置顶推荐

周天财经 浏览 253 01-11

何超琼身价突破700亿,手里的包包成为亮点

素素娱乐 浏览 220 02-24

成功首飞 新舟60民用搜救机试飞验证全面开启

看看新闻Knews 浏览 3881 07-26

首份上市银行中报预喜,净利同比大增17%

财经众议院 浏览 3967 07-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11