遥遥领先?Google发布AI大模型Gemini 1.0!
12月6日,在AMD忙着改名锐龙8000并且宣布AI PC时代来临时,Google也没忘抬了AI一手,而Google一出手就有点石破天惊的意思,正式发布了旗下迄今为止最强大、最通用、最灵活的模型 —— Gemini。
Gemini一出来,对标的就是目前公认一哥、口碑极佳的OpenAI GPT-4模型,并且Gemini Ultra能够在多个场景均有着比GPT-4更佳的表现,甚至部分场景还能超越人类专家?
细说超越人类专家?那还真没法细说,毕竟果式对比大家都会,90.0%的准确率与人类基准89.8%只有很小的差距,而图示里为了对比GPT-4凸显自身巨大优势,y轴上半部被拉长很多,也顺带AOE到人类专家(果式对比被群嘲之后,现在这条曲线已经被Google去掉了)。
所以我们就来大致说下这个“超越人类专家”的MMLU测试结果吧。点开巨长的测试报告的6、7页,其实可以看到Gemini Ultra只是在提示词32次样本(CoT@32)中以90.04%击败了人类基准和GPT-4,而在无提示词的5次尝试中(5-shot),Gemini Ultra的83.7%其实不如GPT-4的86.4%。
为我们人类打抱不平之后,小编也想看看Gemini现在的水平到底如何,而Google的使用门槛就比OpenAI的ChatGPT低多啦,页面下拉到“Bringing Gemini Pro to Bard”就能通过Bard使用Gemini Pro啦!对了,别忘了登录你的Google账号哦!
接着就是熟悉的Bard界面了,用过New Bing和ChatGPT的同学应该很容易上手,没用过的同学直接当作和SIRI聊天就行。然后你就可以用之前召唤无和谐版New Bing同样的方式,来召唤Gemini Pro。
先让Gemini Pro以李白的文风来自报家门吧:
你不是对语言理解很厉害么,小编接着掏出了博德之门3和后羿射日中西合璧疗效好,结果Gemini Pro似乎还应对得不错,大家说说它的回答能打几分:
总之小编觉得这个射日者设定还不错,Gemini Pro全自动做BG3的mod,甚至参与创作龙与地下城内容指日可待了。然后小编也让Gemini Pro锐评了一下TLOU2的剧情,这段看起来就更像收集全网评论然后洗稿了,显得不够尖锐不够主观,颇有端水大师的风范。
浅尝Gemini Pro模型后,小编个人感觉Google Bard使用门槛比ChatGPT要低不少,也不会限定IP、非会员限定GPT-3.5模型,关键也不会像ChatGPT非会员体验有卡卡的感觉,整体感觉会更丝滑。怎样,大家是不是也跃跃欲试想要vivo50试试实力了?那就打开Bard试试吧!