EpochAIResearch(@sundarpichai):EpochAIResearch评估了Google DeepMind发布的新旗舰模型Gemini 2.5 Pro在GPQA Diamond上的表现,并发现得分为84%,与Google报告的结果完全匹配。这是他们迄今为止在这个基准测试中找到的最佳结果!
- Google DeepMind发布了新的旗舰模型Gemini 2.5 Pro。
- 他们在GPQA Diamond上对其进行了评估,并获得了一个分数。
在最近的推特中,Google的CEO Sundar Pichai分享了EpochAI Research关于Google DeepMind最新成就的更新。推文宣布了DeepMind的新旗舰模型Gemini 2.5 Pro的发布,该模型已在一个名为GPQA Diamond的基准上进行了评估。该模型在这一基准上的表现引人注目,表明在人工智能领域取得了重大进展。对于那些对人工智能进展和Google DeepMind创新感兴趣的人来说,这篇内容提供了对最新发展和模型在GPQA Diamond上得分所反映的能力的一瞥。
评论