豆包App视觉推理升级 支持图片思考

互联网
2025
07/30
11:45
分享
评论

据悉,豆包App视觉推理能力已于近期升级,支持在思维链中运用图像思考。

现在,当用户在豆包App中上传图片并提出问题时,豆包不再是简单地“看”图,而是能主动“思考”如何更好地分析这张图片。例如,如果图片中包含需要仔细辨认的文字或细小物品,豆包会智能地对图片进行局部放大,确保不遗漏任何关键信息。同时,对于那些画面复杂、信息量大的图片,豆包也能够在思考过程中智能裁剪,并调用搜索进行文搜图、图搜图等,为用户提供更准确的结果。

据介绍,升级后豆包能更智能地调用多种工具对图片进行辅助分析。无论是日常生活中遇到的花草树木识别、商品信息查询,还是工作学习中对图表数据、专业图片的分析,豆包都能给出更精准、更实用的答案。

今年初,ChatGPT发布最新的o3模型时,首次实现将图像融入思维链中,将高级推理与网页搜索和图像处理(自动缩放、裁剪、翻转或增强图像)等工具无缝结合。据了解,豆包为国内首个实现这一能力的产品,用户可免费体验。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

相关推荐

1
3
Baidu
map