大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三

业界

2025

12/31

10:34

快科技

12月31日消息，近日，SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先，字节跳动的豆包大模型以73.15分跻身前三，展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出，基础认知得分89.01、视觉推理82.82、视觉应用79.09，全面领先其他模型。

国内阵营中，商汤科技SenseNova V6.5 Pro以75.35分位居第二，字节跳动的豆包视觉版紧随其后，其基础认知得分82.70，甚至超过部分国际竞品，仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五，其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中，Anthropic的Claude-opus-4-5得分71.44，OpenAI的GPT-5.2(high)仅获69.16分，排名相对靠后。

【来源：快科技】

THE END

广告、内容合作请点击这里寻求合作

谷歌Gemini

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表的观点和立场。

相关热点

苹果iOS 26.4~28路线图曝光：Siri接入谷歌Gemini

12 月 13 日消息，科技媒体 Mac World 昨日（12 月 12 日）发布博文，通过挖掘 iOS 26 内部开发构建版系统代码，发现了未来三年的产品路线图，涉及 iOS 26.4、iOS 27 以及 iOS 28。

业界

奥特曼：谷歌Gemini 3影响低于预期将在1月结束“红

北京时间12月12日，据CNBC报道，当地时间周四，OpenAI发布了最新AI大模型GPT-5.2，以应对势头迅猛的谷歌Gemini 3。

业界

奥特曼：谷歌Gemini 3影响低于预期将在1月结束“红

北京时间12月12日，据CNBC报道，当地时间周四，OpenAI发布了最新AI大模型GPT-5.2，以应对势头迅猛的谷歌Gemini 3。

业界

OpenAI被曝正开发全新AI大语言模型：代号“大蒜”，

12 月 2 日消息，The Information 今晚报道称，OpenAI 正开发全新 AI 大语言模型以应对谷歌 Gemini 3 的技术竞争，该项目代号为“大蒜”（Garlic）。

业界

华尔街名嘴：谷歌Gemini对OpenAI构成生存威胁 ChatG

北京时间11月25日，美国CNBC知名财经主持人吉姆·克莱默(Jim Cramer)周一表示，谷歌Gemini已对OpenAI构成生存威胁，后者必须进行反击。

业界

大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

关注我们

大模型视觉测评榜单出炉：Gemini遥遥领先 豆包冲进前三

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 电池

关注我们

大模型视觉测评榜单出炉：Gemini遥遥领先豆包冲进前三