3月6日消息,上周二有网友发现,字节跳动旗下AI助手豆包正在小范围测试 思考模型,但接入的不是DeepSeek模型。
2025年3月5日,豆包宣布上线「 思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「 思考」推理模式,用户只需在输入框打开「 思考 Beta」开关即可。
上周测试时,豆包相关负责人回应表示,当前测试的是自家 思考模型的不同实验版本。还有消息称,豆包正在测试的 思考模型是基于豆包1.5基座模型研发。
IT之家查询发现,此前在1月中旬,豆包大模型团队在发布豆包1.5 Pro时就宣布了 推理模型Doubao-1.5-pro-AS1-Preview的存在,并称其“在完全不使用其他模型数据的条件下,通过RL算法的突破和工程优化,充分发挥Test Time Scaling的算力优势,完成了 RL Scaling,研发了Doubao 思考模式”。
简单来说, 思考模式可以让用户直观看到模型的思考过程,这中间涉及思维链的展示,也就是COT(Chain of Thought)—— 思维链是模拟出来的,通过训练让模型输出中间步骤,比如自我质疑和反思,虽然只是文字序列,但看起来像人类的思考过程。
在 思考模式下,用户不仅能看到AI的最终答案,还能观察到模型解决问题的完整逻辑链条,包括自我质疑、假设验证、错误修正等步骤。比如,在解决数学题时,模型会展示其从问题拆解、多方法验证到最终结论的全过程。
【来源:IT之家】