消费

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

字号+ 作者:唇焦口燥网 来源:教育 2025-12-25 06:43:18 我要评论(0)

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月汇报》全新出炉!

豆包1.5·深度思索模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)一同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包含DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1另有DeepSeek-V3。

来自SuperCLUE

汇报指出,国内外第一梯队大模型在中文领域的通用实力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner体现最为亮眼。国内推理模型角逐格局初露端倪。

SuperCLUE是产业权威的通用大模型的综合性测评基准。本次2025年5月汇报聚焦通用实力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本领会与创作六大任务,总量为1579道多轮简答题。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 从“花费平权”到“生存精算”,看TCL真省电Pro二代界定年轻人空调

    从“花费平权”到“生存精算”,看TCL真省电Pro二代界定年轻人空调

    2025-12-25 06:41

  • 孟慧圆深夜打卡!单日狂卖6万、翻台5轮,“沸点计划”凭啥火出圈?

    孟慧圆深夜打卡!单日狂卖6万、翻台5轮,“沸点计划”凭啥火出圈?

    2025-12-25 05:35

  • 人保财险宁波市镇海支公司主动促进70周岁以上老年人意外险工程落地

    人保财险宁波市镇海支公司主动促进70周岁以上老年人意外险工程落地

    2025-12-25 05:15

  • 全友家居案例丨7个实用橱柜策划,照着装想翻车都难!

    全友家居案例丨7个实用橱柜策划,照着装想翻车都难!

    2025-12-25 04:55

网友点评