分享好友 资讯首页 资讯分类 切换频道

DeepSeek发布新论文 提出条件记忆提升模型表现

2026-01-14 01:31240两砚网财联社

DeepSeek于12日晚发布了一篇新论文《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》。该论文由北京大学与DeepSeek共同完成,合著作者中包括梁文锋。论文提出了一种称为条件记忆的技术,通过引入可扩展的查找记忆结构,在相同参数和算力条件下显著提升了模型在知识调用、推理、代码及数学任务上的表现。DeepSeek还开源了相关的记忆模块Engram。

收藏 0
打赏 0
反外国不当域外管辖条例发布 维护国家主权与发展利益
国务院总理李强日前签署国务院令,公布《中华人民共和国反外国不当域外管辖条例》,自公布之日起施行。该条例旨在维护国家主权、安全和发展利益,保护中国公民和组织的合法权益,并维护以国际法为基础的国际秩序

0评论2026-04-1417

湖北荆州市委原书记吴锦被双开 严重违纪违法遭查处
湖北省纪委监委对第十二届湖北省委委员、荆州市委原书记吴锦严重违纪违法问题进行了立案审查调查

0评论2026-04-1411

一季度人民币存款增加13.73万亿元 增长势头强劲
4月13日,中国人民银行官网发布了2026年一季度金融统计数据报告。数据显示,3月末本外币存款余额为350.23万亿元,同比增长8.7%;人民币存款余额为342.41万亿元,同比增长8.6%。一季度人民币存款增加了13.73万亿元

0评论2026-04-1411

A股拟全面适用盘后固定价交易 推动市场交易机制完善
4月10日,沪深北三大证券交易所同步发布交易规则修订征求意见稿,推出两项关键举措:盘后固定价格交易拟覆盖全部A股与交易型开放式基金;主板风险警示(ST/*ST)股票价格涨跌幅限制比例拟由5%调整为10%

0评论2026-04-1411