关闭广告

互联网数据“耗尽”后,高质量训练数据从哪里获得?专家热议

南方都市报2025-07-29 12:00:018295人阅读

7月28日,2025世界人工智能大会暨人工智能全球治理高级别会议在上海举行。在“大模型治理和有序发展生态分论坛”上,多位专家围绕大模型时代的数据治理与伦理建设,共商人工智能健康发展路径。有专家指出,互联网数据将在2026年左右被大模型训练“耗尽”已成行业共识,要建设新的高质量数据集,应从垂直行业获取、通过“众包众创”方式与前沿学校学者开展合作等实现。


论坛现场

对未处理的初级数据,比如语音、图像、文本、视频等进行加工处理,进而转换为机器可识别信息的过程,通常被称为数据标注。近年来,随着人工智能技术发展,数据标注成为大模型训练的必要环节,其上游产业需求大量增加。

据南都记者了解,海量、高质量的标注数据成为人工智能快速发展重要支撑的同时,该行业统一标准缺乏、标注质量不齐、人力水平与技术需求不匹配等问题也日益凸显,如何推动数据标注产业高质量发展备受关注。

上海库帕思科技有限公司首席运营官施佳樑在会上分享了他对数据标注行业的观察。随着人工智能技术的发展,数据标注行业正经历从人力密集型向知识密集型转变。从前,数据标注行业对就业的带动效果

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“四川水泥第一股”年薪百万总经理提前离任!44岁董事长暂代职责,上半年公司成功扭亏

红星资本局 浏览 426 09-11

俄媒:普京和特朗普共乘总统专车 系特朗普突然邀请

环球网 浏览 562 08-18

清华字节跳动首创视频换脸新纪元:让照片主角完美融入视频场景

科技行者 浏览 246 01-11

U22国足名单俱乐部分布:浙江队、西海岸4人最多,海港3人

直播吧 浏览 474 08-23

对话云势数据CEO周利锋:如何打通AI落地最后一百米

网易科技报道 浏览 3429 07-31

13 段“爆料”视频,华熙生物前高管持续曝光“财务内幕”

阿尔法工场 浏览 2728 08-12

中国大米超越日本“米王”,释放哪些信号?

环球网资讯 浏览 491 08-11

欧盟向特朗普低头 却对中国下命令:必须放开供应稀土

掌青说历史 浏览 8411 07-14

2-4遭海牛逆转,国安追平队史中超主场单场丢球纪录

懂球帝 浏览 358 10-27

媒体人:杨瀚森在老鹰的试训时间是他接触的所有球队中第二长的

直播吧 浏览 3206 08-09

“假发第一股”瑞贝卡的双重压力

斑马消费 浏览 484 08-19

扎卡:我想成为一名教练,在桑德兰的这段经历将对我未来大有裨益

直播吧 浏览 481 08-23

跟“雷尔法”一样豪华,再加个华为全家桶,卖35.99万元贵了吗?

吴佩频道 浏览 627 05-29

奥特曼气到快失眠?OpenAI前大佬力挺:小扎砸钱挖墙脚,1亿美元很合理

新智元 浏览 3425 07-14

日间为虫,夜晚化蝶,CHANEL的多变性

时尚COSMO 浏览 180 03-11

《风林火山》亏了4.2亿,古天乐终于拿出这部藏了6年的动作大片

靠谱电影君 浏览 358 10-12

廷贝尔:联赛杯决赛也许能成为争冠动力;哈弗茨不是安静的人

懂球帝 浏览 244 02-05

《红舞鞋》剧组被曝压榨群演!工作11小时仅70元,剧方还威胁学生

萌神木木 浏览 388 10-11

用大模型帮助投资!研究机构:到2029年AI投顾规模将增长600%

华尔街见闻官方 浏览 386 09-26

美国前高官:美国头回碰上 仅靠单打独斗已赢不了中国

澎湃新闻 浏览 567 09-09

小订过万!打死不说价格的全新小鹏 P7,用颜值吊起了所有人的胃口!

极客公园 浏览 7007 08-07
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11