更新于2023-12-08

遥遥领先？Google发布AI大模型Gemini 1.0！

部分超越人类！吗？

12月6日，在AMD忙着改名锐龙8000并且宣布AI PC时代来临时，Google也没忘抬了AI一手，而Google一出手就有点石破天惊的意思，正式发布了旗下迄今为止最强大、最通用、最灵活的模型 —— Gemini。

图片来自于@ Google，版权属于原作者

Gemini一出来，对标的就是目前公认一哥、口碑极佳的OpenAI GPT-4模型，并且Gemini Ultra能够在多个场景均有着比GPT-4更佳的表现，甚至部分场景还能超越人类专家？

图片来自于@ Google，版权属于原作者

细说超越人类专家？那还真没法细说，毕竟果式对比大家都会，90.0%的准确率与人类基准89.8%只有很小的差距，而图示里为了对比GPT-4凸显自身巨大优势，y轴上半部被拉长很多，也顺带AOE到人类专家(果式对比被群嘲之后，现在这条曲线已经被Google去掉了)。

图片来自于@ Google，版权属于原作者

所以我们就来大致说下这个“超越人类专家”的MMLU测试结果吧。点开巨长的测试报告的6、7页，其实可以看到Gemini Ultra只是在提示词32次样本(CoT@32)中以90.04%击败了人类基准和GPT-4，而在无提示词的5次尝试中(5-shot)，Gemini Ultra的83.7%其实不如GPT-4的86.4%。