大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三

业界
2025
12/31
10:34
快科技
分享
评论

12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

3

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

4

【来源:快科技】

THE END
广告、内容合作请点击这里 寻求合作
谷歌Gemini
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

12 月 13 日消息,科技媒体 Mac World 昨日(12 月 12 日)发布博文,通过挖掘 iOS 26 内部开发构建版系统代码,发现了未来三年的产品路线图,涉及 iOS 26.4、iOS 27 以及 iOS 28。
业界
北京时间12月12日,据CNBC报道,当地时间周四,OpenAI发布了最新AI大模型GPT-5.2,以应对势头迅猛的谷歌Gemini 3。
业界
北京时间12月12日,据CNBC报道,当地时间周四,OpenAI发布了最新AI大模型GPT-5.2,以应对势头迅猛的谷歌Gemini 3。
业界
12 月 2 日消息,The Information 今晚报道称,OpenAI 正开发全新 AI 大语言模型以应对谷歌 Gemini 3 的技术竞争,该项目代号为“大蒜”(Garlic)。
业界
北京时间11月25日,美国CNBC知名财经主持人吉姆·克莱默(Jim Cramer)周一表示,谷歌Gemini已对OpenAI构成生存威胁,后者必须进行反击。
业界

相关推荐

1
3
Baidu
map