关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2025-10-22 00:00:02311人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

乐道L80续航短了些,有90%选择baas,58%选择黑外观

正在说车 浏览 39 05-26

女子坚持要取走390万元现金 银行柜员无奈报警

鲁中晨报 浏览 8771 07-27

被坑惨了的年轻人,已经放弃找旅游搭子了

她刊 浏览 97 05-08

《树影迷宫》给10位演员演技排个名

皮皮电影 浏览 294 11-11

雷军称造车造芯把家底全押上:同时供两个"孩子"上大学

鲁中晨报 浏览 312 09-25

别克至境世家申报

大象新闻 浏览 548 08-11

翻译资格考试天津考点出现排错考场情况 考务热线回应

红星新闻 浏览 1002 06-23

传统工业机器人公司成具身智能“新势力”,能否后发制人?

南方都市报 浏览 4503 08-09

印度硬刚美国也要买俄油:进口一吨省89美元,加工后转手卖出还能赚差价

时代周报 浏览 496 08-22

百亿资产转让频现 银行加速甩包袱

北京商报 浏览 322 10-13

别再揪着不放!孙杨张豆豆就和麦琳李行亮一样,一个愿打一个愿挨

娱乐圈笔娱君 浏览 85 05-09

巨亏超7500万!“高端零食第一股”,也要卖了

侃见财经 浏览 3219 07-16

跑步游泳骑行,送你一份有氧运动指南!

人民网 浏览 8101 08-19

星巴克撤出中国?卷不动了

智谷趋势 浏览 2097 07-18

知名"富二代"所创明星机器人公司突解散 研发阵容豪华

每日经济新闻 浏览 316 10-19

泰国女子掉进沥青桶全身卡住,连桶一起送往医院

潇湘晨报 浏览 2155 06-26

闹大了!荣梓杉被女友控诉出轨家暴,回应否认,评论区沦陷了

娱乐圈笔娱君 浏览 331 10-17

皇马巴萨决裂:佛爷&拉波尔塔取消午餐会 卡瓦哈尔愤怒约谈亚马尔

风过乡 浏览 321 10-25

陕西省联社迎新副主任、内部提拔而来,形成一正四副高管架构

湘财Plus 浏览 5002 07-22

西部,风光电大崛起!

华商韬略 浏览 9434 08-07

市场变化越快,华润啤酒越稳

斑马消费 浏览 497 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11