分享好友 资讯首页 资讯分类 切换频道

林俊旸从阿里离职后首发长文 展望AI智能体时代

2026-03-27 01:35250两砚网第一财经

3月26日晚间,前千问大模型技术负责人林俊旸在社交平台发文,详述了他对大模型发展路线的理解及对AI下一阶段的预判。他认为过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,“思考”可以成为一种被训练出来的能力。DeepSeek-R1 证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要,但2025年上半年,行业焦点主要停留在“推理式思考”本身:如何让模型在推理时多想一会儿。他判断下一步是智能体式思考:为了行动而思考,在与环境交互过程中,并根据来自世界的反馈持续更新计划。

林俊旸提到,2025年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向,但合并说起来容易,做好却极难。真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:“思考”行为变得嘈杂、冗余或不够果断,而“指令”行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。

分开做在实践中仍然有吸引力。2025年下半年,Qwen 的2507版本发布了独立的Instruct和Thinking版本,30B和235B各一套。他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。推理链更长并不等于模型更聪明,很多时候,推理链越长,反而说明模型在乱花算力。千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,其定义特征是跟真实世界的闭环交互。

收藏 0
打赏 0
DNA鉴定师靠一滴蚊子血锁定嫌犯 神了!
在纤尘不染的实验室内,身着全套防护装备的DNA鉴定师张梦婷持握移液器,将待检液体滴入锥形容器中,眼神专注,一丝不苟。这间实验室是她坚守六年的刑侦战场

0评论2026-05-1026

遛狗不牵绳惊吓路人需担责吗 民法典明确责任归属
遛狗不牵绳是许多小区里常见的问题。有些人认为自家狗狗温顺不会咬人,松开绳子让它自由跑跑没什么大不了。但如果狗狗只是冲出来叫了几声,把路人吓得摔伤,狗主人是否应该负责?民法典对此给出了明确答案。傍晚时分,老赵在小区花园散步

0评论2026-05-1023

多名老人免费领鸡蛋被骗走50万 养老投资陷阱需警惕
威海市公安局经区分局皇冠派出所近日接到群众报警,称辖区内多名老人疑似遭遇养老投资诈骗。事件起因是一位超市老板经常回馈顾客,隔三差五送鸡蛋,并免费分享理财知识,赢得了老人们的信任

0评论2026-05-1030

钱朝阳任南方电网董事长 职务调整完成
2026年5月9日,中国南方电网有限责任公司召开了中层以上管理人员大会

0评论2026-05-1026