【雨林时评】新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

智趣 | 2024-12-07| 7

大家好,今天小编来为大家解答【新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜】这个问题,很多人还不知道,现在让我们一起来看看吧!

OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹!

一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。

另一边谷歌的Gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。

有网友感叹,o1、Llama 3.3和新版Gemini接连发布,马斯克的Grok3也要来,还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。

Llama 3.3:70B实现405B效果

Llama 3.3目前只有70B一个型号。

但在指令遵循(IFEval)、数学(MATH)、推理(GPQA Diamond)等领域,水平都超过了七月份发布的Llama 3.1 405B

在语言(MMLU)、代码(HumanEval)、长文本和多语种能力上,成绩也和Llama 3.1 405B比较接近。

而在工具使用(BFCL)上,和405B的差距则显得稍大一些。

不过,Llama 3.3的使用成本要比Llama 3.1 405B低得多

虽然Llama本身是免费的,但是各个大模型平台的服务价格也可以作为衡量成本的一个参考。

在Meta合作的平台当中,Llama 3.3最便宜的价格是0.1/0.4美元每百万输入/输出Token。

而Llama 3.1 405B,则是1美元每百万输入token,是Llama 3.3的10倍,输出token为1.8美元,是Llama 3.3的4.5倍。

Meta生成式AI团队领导者Ahmad Al-Dahle表示,Llama 3.3能用70B实现405B的效果,主要是“运用了后训练技术的最新进展”,并点名其中包括在线偏好优化(online preference optimization)。

Meta AI官方账号也提到,Llama 3.3的进步归功于新的对齐过程和在线强化学习技术的进步。

目前,Llama 3.3的模型权重已在官网和Hugging Face上开放下载。

Gemini迎来周岁生日

Gemini 1206上线的这天,刚好是Gemini的一周岁生日。

不过,从节奏和以日期命名的方式来看,Gemini更像是一次例行更新(上一个版本是1121)。

当然成绩还是很不错的,直接登上了lmsys大模型竞技场的榜首

而且不只是总成绩夺冠,困难提示词、代码、数学、创意写作等各个单项排名也都是第一

实际上,Gemini此前有个1114版本,也当了一周的“榜一大哥”,后来被更新的GPT-4o给比了下去。

现在的最新版本,又让Gemini重新回到了榜单上的王座。

此外,谷歌AI Studio产品负责人(原OpenAI开发者社区主管)Logan介绍,Gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌AI Studio和Gemini API免费使用。

谷歌首席科学家Jeff Dean表示,取得这样的成绩是对Gemini生日最好的庆祝方式。

不过也有网友给谷歌泼了盆冷水,表示o1还没出现在这个榜单上,而且GPT-4.5就要来了,谷歌第一的位置恐怕很快又会被OpenAI夺走。

One More Thing

除了谷歌和Meta,马斯克xAI也被盛传即将发布Grok 3。

有网友发现,正在测试的Grok 2 mini消失了,认为这是要发Grok 3的征兆。

除了对Grok 3的猜测,还有一条更确定的消息——此前要充会员才能用的Grok,现在可以免费用了

不过免费用户用量比较有限,每两小时只能处理10条消息,而图片分析一天只能处理三张。

有意思的是,我们试了试询问Grok自己,它也表示Grok 3计划在这个月上线。

但抓马的是,点进后面引用的消息源,发现这名博主也是问Grok之后发的帖子……

那么,在这个发布密集的十二月,你最钟意或者最期待哪一款产品呢?

以上就是【新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜】相关内容,更多资讯请关注科技网

相关推荐相关推荐

天天实时:60度电池跑出100度续航!特斯拉电耗水平全球第一 雷军承认小米需要3-5年学习

天天实时:60度电池跑出100度续航!特斯拉电耗水平全球第一 雷军承认小米需要3-5年学习

大家好,今天小编来为大家解答【60度电池跑出100度续航!特斯拉电耗水平全球第一 雷军承认小米需要3-5年学习】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,特斯拉公司副总裁陶琳今日发文称,特斯拉车型能耗表现出众,可以用6 ...

智趣 5 2024-12-22
世界滚动:雷军周末开小米SU7 Ultra跑山:戴墨镜、穿风衣

世界滚动:雷军周末开小米SU7 Ultra跑山:戴墨镜、穿风衣

大家好,今天小编来为大家解答【雷军周末开小米SU7 Ultra跑山:戴墨镜、穿风衣】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,今日雷军在微博晒出一组和小米SU7 Ultra的合影。照片中,雷军戴墨镜、穿风衣,站在小米SU7 Ultra ...

智趣 7 2024-12-22
全球速讯:荣耀Magic7 RSR保时捷设计手机上线官网:普罗旺斯紫、玛瑙灰双色可选,最高24GB+1TB

全球速讯:荣耀Magic7 RSR保时捷设计手机上线官网:普罗旺斯紫、玛瑙灰双色可选,最高24GB+1TB

大家好,今天小编来为大家解答【荣耀Magic7 RSR保时捷设计手机上线官网:普罗旺斯紫、玛瑙灰双色可选,最高24GB+1TB】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 22 日消息,荣耀 Magic7 RSR 保时捷设计及影像技术发布会定档 12 月 ...

智趣 5 2024-12-22
【焦点热闻】网友票选年度最佳手机:iPhone罕见跌出Top 4

【焦点热闻】网友票选年度最佳手机:iPhone罕见跌出Top 4

大家好,今天小编来为大家解答【网友票选年度最佳手机:iPhone罕见跌出Top 4】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,在Android Authority近期的年度最佳手机票选中,三星Galaxy S24 Ultra经过两轮激烈竞争后脱颖而出, ...

智趣 7 2024-12-22
新华时评|积核Geekom将推三款“全球首款”迷你主机!高通、Intel、AMD都有

新华时评|积核Geekom将推三款“全球首款”迷你主机!高通、Intel、AMD都有

大家好,今天小编来为大家解答【积核Geekom将推三款“全球首款”迷你主机!高通、Intel、AMD都有】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,据媒体报道,迷你主机厂商积核Geekom将在CES 2025上展出三款“全球首款”迷你PC,分 ...

智趣 7 2024-12-22
每日热议!苹果AI总结新闻闹乌龙,这比标题党更令人担心

每日热议!苹果AI总结新闻闹乌龙,这比标题党更令人担心

大家好,今天小编来为大家解答【苹果AI总结新闻闹乌龙,这比标题党更令人担心】这个问题,很多人还不知道,现在让我们一起来看看吧!万万没想到,苹果 AI 也会有被大骂「标题党」的一天。这对于迟迟没有推出 Apple Intelligence 完全体的苹果可不是一个好 ...

智趣 6 2024-12-22
参考消息:CPU-Z新版2.13发布:支持酷睿Ultra 200U、CAMM2内存

参考消息:CPU-Z新版2.13发布:支持酷睿Ultra 200U、CAMM2内存

大家好,今天小编来为大家解答【CPU-Z新版2.13发布:支持酷睿Ultra 200U、CAMM2内存】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,硬件工具CPU-Z发布了最新的v2.13版本更新,主要新增了对英特尔即将推出的酷睿Ultra 200U系列 ...

智趣 5 2024-12-22
热点播报:首批国产颗粒DDR5内存终于上市!32GB套装499元 三巨头要慌了

热点播报:首批国产颗粒DDR5内存终于上市!32GB套装499元 三巨头要慌了

大家好,今天小编来为大家解答【首批国产颗粒DDR5内存终于上市!32GB套装499元 三巨头要慌了】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,最近,金百达、光威先后推出了DDR5国产内存,且均表明新品基于“国产颗粒”打造。其中 ...

智趣 6 2024-12-22
焦点速递|威刚XPG动境机箱首发199元:独特洞洞板设计

焦点速递|威刚XPG动境机箱首发199元:独特洞洞板设计

大家好,今天小编来为大家解答【威刚XPG动境机箱首发199元:独特洞洞板设计】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月22日消息,威刚推出了XPG动境机箱,该机箱以经典的黑、白两色呈现,预售价299元,而首发期间199元。XPG动境机箱 ...

智趣 1 2024-12-22
华山论见|国产射频PA,走到哪了?

华山论见|国产射频PA,走到哪了?

大家好,今天小编来为大家解答【国产射频PA,走到哪了?】这个问题,很多人还不知道,现在让我们一起来看看吧!自20世纪80年代蜂窝网络实现商业化应用起,过去的40多年间通信技术呈现出了波澜壮阔的演进历史。发展至今,随着5G技术的成熟和渗透,不仅带来 ...

智趣 1 2024-12-22