连发六款大模型!亚马逊掀起了“万能模型”的超级战争?

| 2024-12-05| 12

Any-to-Any是AI大模型的终极形态?

日前,在re:Invent大会上,亚马逊云科技接连发布六款大模型,让2024年的大模型浪潮有了更加惊艳的压轴表现。

作为全球互联网、云计算和AI行业的领导者,亚马逊云科技连发六款大模型、全新AI服务器、芯片以及一揽子新技术,同时推出了任意转任意(Any-to-Any)万能模型,彻底改变了生成式AI的游戏规则,也前所未有地强化自身在AI领域的存在。


祭出“六脉神剑”,亚马逊云科技还有更大杀招

2020年GPT-3的面世正式引爆生成式AI浪潮,至今四年多时间过去,各类大模型层出不穷,但依然无法满足各行各业日益强劲、日益复杂的AI工业化需求。

亚马逊云科技发布的六款大模型分别面向不同场景、不同领域、不同用户:

  • Nova Micro:文本生成模型,效率高、延迟低、占用资源少,具有极高的经济性,适合纯粹的文字工作者;

  • Nova Lite:低成本多模态模型,具有30万token上下文窗口,可处理大约22.5万个单词、1.5万行计算机代码,或者30分钟视频素材,兼顾成本与功能,适合大多数普通用户;

  • Nova Pro:功能与Nova Lite相同,也拥有30万token上下文窗口,支持图文、视频素材分析,但性能和成本更加均衡,适合要求相对专业的广大用户;

  • Nova Premier:Nova系列性能最强的多模态模型,但定位是“教师”而非独立使用模型,可通过知识蒸馏技术来指导和提升一个更简单、更易于部署的学生模型的性能与精度。

  • Nova Canvas:图片生成模型,支持生成和编辑图片,提供配色方案和布局控件,适合图片设计师或图文工作者,其内置的安全控件能够生成可追溯性水印,从而限制用户利用Nova Canvas生成有害内容;

  • Nova Reel:视频生成模型,现已支持生成时长6秒的视频,即将推出可生成2分钟视频的版本。

这六款大模型覆盖了文字、图片、视频等主要内容生成领域。在2024年的最后一个月,祭出六款大模型的亚马逊云科技,让我们看到了这位全球科技巨头的AI实力与野心。

(图源:re:Invent大会)

相较于“人有我有,人有我优”的6款大模型而言,我最期待的是亚马逊云科技计划明年中期推出的“大家伙”:一款语音转语音模型,以及一款任意转任意(Any-to-Any)万能模型,可输出、文本、图片、音频、视频等任何模态的内容。

亚马逊云科技AI和数据副总裁Swami Sivasubramanian曾表示,暂时没有任何一款大模型可以统治世界,亚马逊云科技一半以上的客户,会针对不同应用场景选择不同的大模型。

的确,一款能够完成任何任务的万能模型,不论是训练还是推理,所需算力都将无比庞大。从技术难度与成本两方面考虑,放眼整个AI大模型行业,也没有多少企业能够构造出“万能模型”。可一旦真的有企业成功打造出这样一款万能模型,能够一站式输出全模态内容,无疑也将彻底改变AI行业的秩序。

万能大模型的到来,将彻底释放人类的创意,所有个体与组织都可在万能模型的帮助下任意自由创作图文、视频、音乐,基于万能大模型也将出现万能AI应用,一款大模型统治世界也就不再遥不可及。

有实力打造万能大模型的巨头有且只可能是世界级科技巨头,而亚马逊云科技正是其中之一。


亚马逊云科技吹响了“万能模型”的集结号

算力是大模型的基础,能输出任意内容的万能大模型,所耗算力将远超所有,这正是亚马逊云科技打造万能大模型的底气。作为世界云计算的开创者、领导者与AI技术的佼佼者,亚马逊云科技拥有庞大的算力规模和雄厚的技术底蕴。


在re:Invent大会上,亚马逊云科技推出了由Trainium2芯片驱动的Amazon EC2 Trn2实例(可理解成AI云服务),其专为大语言模型和潜在扩散模型的生成式AI高性能深度学习而打造;而集成了64颗Trainium2芯片的AI服务器Trn2 UltraServer,则能支持万亿参数的AI大模型实时推理。相较于当前由GPU驱动的EC2实例性价比提升了30%-40%。

亚马逊云科技还发布了新一代AI训练芯片Trainium3,其基于3nm制程工艺,实现了性能翻倍,能效提升40%;搭载Trainium3芯片的UltraServer;,性能预计比Trn2 UltraServer高出4倍。亚马逊云科技正在不断强化AI芯片布局,成为打破英伟达算力霸权的实力挑战者。

(图源:亚马逊云科技)

亚马逊云科技还与Anthropic洽谈合作,正在构建名为Project Rainier的Trn2 UltraServers EC2 UltraCluster,芯片规模可达数十万颗,将成为世界上最大的AI计算集群。

(图源:亚马逊云科技)

众所周知,云计算具有显著的规模效应,AI计算也是如此。从AI服务器到AI芯片再到超级计算集群,亚马逊云科技正在努力打造巨量规模的AI算力基础设施,显著提高AI计算效率、显著降低AI计算成本,给万能大模型构建了算力基座。


要打造万能大模型,不能只靠算力,AI技术同样重要,不只是大模型算法,还有适配AI大模型的网络、存储、调优、工具等技术,而亚马逊云科技,早已拥有领先的全栈AI技术。


在这一次在re:Invent大会上亮相的Trainium2 UltraServer采用的就是新一代AI网络结构tnp10,为数千台服务器提供数十PB网络容量的同时,延迟仅为10微秒,给运行参数量庞大的万能大模型提供了可能。

亚马逊云科技还在re:Invent大会上推出了自动推理检查、多Agent协作、模型蒸馏三大新功能,其中自动推理检查可验证大模型生成结果的准确性,提高推理结果的精度。

(图源:亚马逊云科技)

多Agent协作则面向企业用户,企业可在Bedrock上建造母项目,再将子项目分配给其他Agent推理计算,最终将不同Agent生成的内容整合输出。原先可能需要1周时间才能完成的任务,在多Agent协同功能的加持下,1个小时内就能完成推理。

模型蒸馏功能主要用于训练小模型,尽管小模型的精度和功能性会有损失,但是参数量大幅减少,可节省一定的资源,提升响应速度,更适合边缘计算、端侧AI、智能制造等特定场景。

亚马逊云科技还升级了Amazon Q Developer辅助编程平台、与NVIDIA联手打造Blackwell架构P6实例、升级数据管理系统,并推出了全新数据中心组件。

一切的一切,都在给万能大模型的到来打好基础。万事俱备只欠东风,面向下一个生成式AI阶段,亚马逊云科技已经准备好了。亚马逊云科技这家全球AI科技巨头的雄心壮志,已然浮出水面:探索AI的终极形态。


Any-to-Any将是通用AI大模型的终极形态

大模型当前百花齐放,有开源与闭源区别,有不同规模区别,还有通用型大模型和垂类大模型的划分,其中垂类大模型是指针对特定场景和用途训练的大模型,仅能解决对应性问题。我们日常所谈的头部大厂的大模型属于通用大模型,比如文心、豆包、通义、星火等等。

国内外诸多AI巨头在结束“大模型卷参数”后,已将重点放在大模型落地上,比如Apple Intelligence以及国内手机厂商的AI Agent,就是AI大模型在硬件产业的落地形态。

至于说大模型本身,当前很多科技巨头认为技术已经差不多了,很少有巨头提出要打造万能大模型的想法,甚至部分玩家如百度还明确提出了不做视频大模型——自然也不可能做万能模型了。

不过,也有不少玩家在丰富大模型的多模态能力,比如华为的盘古大模型,OpenAI的GPT-4等,都在丰富功能向“更全能”方向发展。

亚马逊云科技志向更加远大,在通过更高性价比的算力方案助推大模型落地应用的同时,积极探索万能大模型这一终极形态,让“输入任意模态信息与输出任意模态结果”的超级AI成为可能。

其实很多科技巨头不是不想做万能大模型,而是不能。在技术能力、算力资源的掣肘下,大多数通用型大模型甚至不支持输出音频和视频,但亚马逊云科技这一次推出的六款大模型,就已实现多模态内容输出,比如Nova Reel模型,生成视频长度即将达到2分钟,在行业属于领先水平。亚马逊云科技的AI算力与技术实力,足以让大多数AI公司艳羡。

(图源:亚马逊云科技)

如今,亚马逊云科技已吹响万能模型大战的集结号。25年,AI世界也将迎来革命性的Any-to-Any时刻。相信更多企业会加入万能模型的战争,而不是坐等亚马逊云科技的万能模型“统治世界”。


只剩不到一年的时间,让我们一起静候AI大模型的“超级大家伙”。


免责声明:前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。

以上就是关于【连发六款大模型!亚马逊掀起了“万能模型”的超级战争?】的相关消息了,希望对大家有所帮助!

Tags: ,

上一篇

已是最后文章

下一篇

已是最新文章

相关推荐相关推荐

中科驭数获批设立博士后科研工作站 加强DPU产学研合作

中科驭数获批设立博士后科研工作站 加强DPU产学研合作

中科驭数获批准设立博士后科研工作站,近日在北京市人力资源和社会保障局主办的博士后人才培养工作会议上,中科驭数获得由人力资源和社会保障部、全国博士后管委会联合授予的博士后科研工作站牌匾。

业界 23 2025-01-01
中国专利奖结果公布:新声、中微等半导体企业入选

中国专利奖结果公布:新声、中微等半导体企业入选

电子发烧友网报道(文/吴子鹏)近日,国家知识产权局在其官网正式对外发布了第二十五届中国专利奖评审结果。根据《中国专利奖评奖办法(2023年修订)》《国家知识产权局关于评选第二十五届中国专利奖的通知》规定,第二十五届中国专利奖共评选出中国专利 ...

业界 26 2025-01-01
鸿利智汇荣获两项中国专利优秀奖

鸿利智汇荣获两项中国专利优秀奖

近日,国家知识产权局公布了《第二十五届中国专利奖评审结果》,鸿利智汇集团两项发明专利同时上榜,充分展示了公司在半导体照明与显示领域的卓越技术实力。

业界 24 2025-01-01
智芯公司荣获7项电力创新奖

智芯公司荣获7项电力创新奖

近日,中国电力企业联合会发布2024年度电力创新奖获奖名单,智芯公司获各类奖励共7项,其中,技术成果一等奖1项、二等奖3项,信息化成果二等奖2项,职工成果二等奖1项。

业界 12 2025-01-01
看齐iPhone!三星Galaxy S25 Ultra将搭载车祸检测传感器

看齐iPhone!三星Galaxy S25 Ultra将搭载车祸检测传感器

12月31日消息,苹果在iPhone 14 Pro开始为手机配备了车祸检测传感器,可以检测正面、侧面、追尾甚至翻车,监测到车祸后会及时拨打急救热线。

业界 14 2025-01-01
地铁跑酷外挂被全网封了!《黑神话:悟空》玩家玩出跨年晚会

地铁跑酷外挂被全网封了!《黑神话:悟空》玩家玩出跨年晚会

《黑神话:悟空》单品“斗地篇”和“战天篇”的表演在近日的跨年晚会上引起了众多玩家的关注。其中,陈鸿宇、熊竹英、者来女、张紫宁、陈彼得与秦勇等知名音乐人在现场献艺,给观众带来了极佳的视听享受。此外,美术总监杨奇于12月31日在微博上发布了一张合照 ...

头条 14 2025-01-01
杰洛特和他的朋友们送祝福!《巫师 3》官方新年海报发布

杰洛特和他的朋友们送祝福!《巫师 3》官方新年海报发布

2025新年到来之际,波兰游戏开发商CDPR为玩家们送上了祝福。与以往的圣诞贺图以主角希里为主不同,这次的祝福中,杰洛特这位玩家们的老朋友以及《赛博朋克2077》中的NPC们成为了焦点,这不仅满足了喜欢魔幻风格的玩家,也迎合了喜欢未来科技画风的玩家群 ...

头条 13 2025-01-01
国产长鑫DDR5芯片亮相,UP主亲测性能强劲价格公道!

国产长鑫DDR5芯片亮相,UP主亲测性能强劲价格公道!

B站UP主“万扯淡”近日拆解了首批国产DDR5内存。这款内存的型号是金百达的DDR5 6000 16GB,共八颗粒,单Die 2GB。UP主指出,左边的国产DDR5颗粒表层有一些紫色的互联层(根据现有经验,有且只有一家长鑫)。右边则是三星的DDR5芯片。根据测量数据,长鑫DDR5 ...

头条 9 2025-01-01
手游《小丑牌》热度创新高,玩家人数突破4万

手游《小丑牌》热度创新高,玩家人数突破4万

《小丑牌》游戏在12月迎来一波新的热度,同时在线玩家人数突破4万大关,刷新了此前创下的3.79万的纪录。该游戏自11月初开始获得广泛关注,并且目前仍保持较高热度。独立开发者LocalThunk对这一现象表示,“这是一个疯狂的12月”。他将游戏的第二波热度归功 ...

头条 14 2025-01-01
TikTok Shop推出新退款政策 无需退货直接赔付

TikTok Shop推出新退款政策 无需退货直接赔付

根据跨境指南Cpsea的最新消息,TikTok Shop东南亚跨境业务即将推出一项新的退款政策。从2025年1月8日起,平台将引入“退款不退货”功能,即满足特定条件的退货退款申请将直接被批准,无需商家同意并要求买家退回商品。然而,此政策仅适用于东南亚跨境订单。 ...

头条 8 2025-01-01