AI日报:支付宝推AI创意生成平台;谷歌王炸推理模型Gemini2.0 Flash Thinking;Runway支持插入中间帧;OpenAI准备o3推理模型

| 2024-12-20| 69

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、谷歌发布王炸推理模型Gemini2.0Flash Thinking,挑战 OpenAI o1

谷歌近期推出的Gemini2.0Flash Thinking模型在多模态推理领域展现出强大的能力,支持32,000个输入标记和8,000个输出标记,极大提升了处理复杂问题的效率。该模型通过透明的逐步推理方式解决了AI“黑箱”问题,增强了用户对模型决策过程的理解。

【AiBase提要:】

🌟 Gemini2.0Flash Thinking模型具备强大的推理能力,支持32,000个输入标记和8,000个输出标记。

💡 该模型通过下拉菜单提供逐步推理,增强透明性,解决AI“黑箱”问题。

🖼️ 具备原生图像上传与分析能力,扩展了多模态应用场景。

详情链接:https://ai.google.dev/gemini-api/docs/thinking-mode?hl=zh-cn

2、支付宝面向商家营销推出AI创意生成平台,已累计生成8700万张AI素材

支付宝最近推出了名为“蚂上有创意”的AI创意生成平台,专为商家和设计师提供快速生成创意素材和智能分析的服务。该平台不仅免费开放了大量营销图片素材,还通过AI技术支持快速生成海报、视频等内容,并提供创意洞察服务,帮助商家提升营销效果。

【AiBase提要:】

🖼️ 支持快速生成海报、Banner、视频等多种内容,简化创意制作流程。

📊 提供AI创意洞察服务,帮助商家分析和优化营销物料,提高转化率。

🚀 自去年以来,支付宝已生成8700万张AI素材,推动商家营销的智能化发展。

3、Runway更新重磅功能: 支持插入中间帧控制视频生成

Runway平台最近推出了一项重要更新,允许用户在视频生成过程中插入中间帧。这一功能的推出满足了许多用户的期待,使得视频制作的创作自由度和灵活性大大增强。用户不仅可以上传首尾帧,还可以通过添加中间帧来丰富视频内容,提升画面的协调性和流畅度。

【AiBase提要:】

🎨 用户现在可以在视频生成中选择首尾帧并插入中间帧,增加创作灵活性。

🚀 新增的关键帧功能使得视频画面更丰富,提升了整体质量和流畅度。

✨ 用户体验反馈积极,展示了该功能在实际应用中的效果。

4、电商产品试穿神器!Krea AI新功能:几秒钟将真实产品添加到任何图像中

Krea AI最近推出了令人兴奋的新功能——自定义训练,允许用户在几秒钟内将真实产品添加到任何图像中。该功能通过简单的涂抹和选择商品图,实现了产品与图像的无缝融合,极大提升了设计和创作的效率。用户可以轻松替换模特的配件和服装,甚至进行logo的替换。

【AiBase提要:】

✨ 用户可以在几秒钟内将真实产品添加到图像中,提升设计效率。

🖌️ 通过简单的涂抹和选择,AI实现产品与图像的完美融合。

👗 支持多种替换操作,包括配件、服装和logo,操作流畅。

5、跳过o2!OpenAI 或计划推出新一代 “o3” 推理模型

OpenAI 正在研发新一代推理模型“o3”,旨在提升用户提问时的回应质量,使其更加深思熟虑和逻辑严谨。由于与英国电信公司O2的商标冲突,OpenAI选择跳过“o2”直接命名为“o3”。此举不仅反映了公司在品牌命名上的谨慎态度,也标志着OpenAI在应对产品更新放缓及市场竞争加剧方面的重要战略调整。

【AiBase提要:】

🌟 OpenAI 正在开发新的推理模型 “o3”,旨在提升思考能力和用户互动体验。

⚖️ 由于与英国电信公司 O2的潜在商标冲突,OpenAI 决定跳过 “o2” 直接命名为 “o3”。

📈 新模型的推出是 OpenAI 应对产品更新放缓的一项战略举措,期望在各行业实现更广泛的应用。

6、闪速!ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言

ElevenLabs近期推出了其最新的人声合成模型Flash,声称这是迄今为止最快的文本转语音解决方案,生成语音的延迟仅为75毫秒,特别适合低延迟的对话式语音助手。Flash模型分为两个版本,其中Flash v2仅支持英语,而Flash v2.5则支持32种语言。尽管在音质和情感深度上稍逊于Turbo模型,但Flash在盲测中表现优异,成为速度最快的选择。

【AiBase提要:】

🌟 Flash模型生成语音的延迟仅为75毫秒,适合低延迟的对话式语音助手。

🌍 Flash v2.5支持32种语言,用户生成每两个字符消耗1个积分。

🚀 在盲测中,Flash模型表现优于其他同类产品,成为速度最快的文本转语音解决方案。

7、ChatGPT桌面端新增应用协作功能Mac用户轻松读取应用内容

OpenAI最近推出了ChatGPT桌面应用程序的重要更新,其中新增的“与应用协作”功能使得ChatGPT能够直接读取多种应用程序的内容,如终端、IDE和文本编辑器。这一更新极大地提升了开发者和创作者的工作效率,支持的应用程序包括Apple Notes、Notion、VS Code等。

【AiBase提要:】

🌟 ChatGPT新增“与应用协作”功能,支持直接读取多个应用内容。

💻 支持的应用包括Apple Notes、Xcode、VS Code等,覆盖广泛。

🗣️ 更新后,用户可使用高级语音模式与应用进行互动,提供更直观的使用体验。

8、AI编程助手Cursor再获融资1亿美元,估值飙升至26亿美元

Anysphere 公司开发的 AI 编程助手 Cursor 在短短四个月内完成了1亿美元的 B 轮融资,估值飙升至26亿美元。这一轮融资由 Thrive Capital 领投,Andreessen Horowitz 参与但未主导。Cursor 的市场竞争虽激烈,但其受欢迎程度明显高于竞争对手,年收入在短时间内从400万美元增长至4800万美元。

【AiBase提要:】

🌟 Cursor 成功融资1亿美元,估值达26亿美元!

🚀 仅四个月时间,公司估值暴涨6.5倍,投资者热情高涨。

💰 公司的年收入从400万美元迅速增长至4800万美元,业绩亮眼。

9、GPT之父离职震动AI圈:OpenAI传奇研究员Radford转向独立研究

OpenAI的核心研究员Alec Radford宣布离职,转向独立研究,引发AI领域的广泛关注。他是GPT系列的首席设计师,曾在AI领域做出重要贡献,包括提出基于Transformer的语言模型生成预训练方法。Radford的离职标志着AI人才流动的挑战,同时也可能预示着独立研究者在AI技术创新中将发挥越来越重要的作用。

【AiBase提要:】

🚀 Radford在2016年加入OpenAI,推动了GPT系列模型的研发,奠定了现代AI的基础。

📈 他的离职发生在OpenAI高层频繁变动的背景下,可能影响公司的未来发展方向。

🤝 尽管选择独立研究,Radford计划与OpenAI及其他AI开发者保持合作,探索新的创新模式。

10、闪极推出国内首款999元AI眼镜:30g重量挑战可穿戴新赛道

闪极科技于12月19日发布了国内首款量产AI眼镜——闪极AI「拍拍镜」,起售价999元,预计于2025年1月15日开始发货。这款眼镜以经典黑框设计为主,重量仅50g,实际佩戴感受约30g。搭载索尼1600万像素摄像头及瑞声科技Hi-Fi扬声器,支持多种AI功能,未来还将通过在线升级增加更多功能。

【AiBase提要:】

🕶️ 闪极AI「拍拍镜」是国内首款量产AI眼镜,起售价999元,预计2025年1月15日发货。

📸 眼镜搭载索尼1600万像素摄像头和瑞声科技Hi-Fi扬声器,重量控制在50g,佩戴感受仅30g。

🚀 通过自研Loomo OS系统,支持语音识别、实时翻译等AI功能,未来可在线升级更多功能。

11、Stable Diffusion3.5Large正式上线亚马逊 Bedrock平台

在AWS re:Invent大会上,Stable Diffusion3.5Large(SD3.5Large)正式在亚马逊Bedrock平台上线,旨在为开发者提供一个安全、便捷的生成式人工智能应用开发环境。该模型在文本到图像生成方面表现卓越,支持多样化的视觉风格,并能准确响应用户的输入。

【AiBase提要:】

🌟 SD3.5Large模型已在亚马逊Bedrock平台上线,支持便捷安全的AI应用开发。

🎨 该模型具备多样风格生成、优异的文本提示遵循性和多元化图像输出能力。

🔧 新升级的图像服务包括稳定图像超级版和核心版,提供更高质量和性价比的生成解决方案。

详情链接:https://stability.ai/news/stable-diffusion-35-large-is-now-available-on-amazon-bedrock?utm_source=futuretools.io&utm_medium=newspage

12、14万亿token训练量加持:Falcon3挑战主流开源AI模型

阿布扎比技术创新研究院(TII)发布的新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上表现出色,创下新纪录。与前代产品相比,Falcon3的训练规模翻倍,展现出强劲的竞争力,尤其是在与其他主流开源模型的基准测试中表现优异。

【AiBase提要:】

🚀 Falcon3系列推出四种规格,满足不同用户需求,支持多种语言处理。

🏆 在Hugging Face的评测中,Falcon3超越了多款主流开源模型,展现出强大的性能。

💡 TII计划在2025年推出多模态模型,进一步扩展Falcon3的应用场景。

Tags: , ,

上一篇

已是最后文章

下一篇

已是最新文章

相关推荐相关推荐

安卓僵尸病毒再现!全球近20万台安卓设备中招

安卓僵尸病毒再现!全球近20万台安卓设备中招

智能家居设备成为病毒感染新目标。早些年由于缺乏重视,安卓手机市场出现过许多病毒软件,好在随着技术的发展,病毒软件基本成为了历史。然而最近又传来消息,一种名为BadBox的安卓恶意软件正在全球范围内迅速蔓延。据网络安全公司BitSight报道,BadBox僵 ...

11 2024-12-20
2024年的PC DIY市场:从低迷中走出,大厂纷纷押注AI

2024年的PC DIY市场:从低迷中走出,大厂纷纷押注AI

PC DIY正在焕发第二春?2024年,AI硬科技创新大年。“不卷参数卷应用”成AI行业共识。一边,硬件狂叠AI的buff,AI硬件爆发,手机、PC、家电、汽车、清洁、家居、耳机、相机、存储等行业争相妙用AI;另一边,AI深入改造软件,文小言、豆包等原生AI应用普及, ...

18 2024-12-20
车企成为CES 2025新主角!在智能座舱外,还有哪些看点?

车企成为CES 2025新主角!在智能座舱外,还有哪些看点?

汽车正在成为消费电子产品。如今已是智能座舱百花齐放的时代,市面上有“蔚小理”、比亚迪、长安、广汽、长城等车企的自研座舱方案,也有华为鸿蒙座舱、Flyme Auto智能座舱、高通座舱等开放式平台。燃油车不甘落后。根据最新消息,宝马、本田等多家车企确定 ...

20 2024-12-20
电视显示技术再突破!万象分区是下一个十年的答案?

电视显示技术再突破!万象分区是下一个十年的答案?

Mini LED画质如何卷?显示技术的进步,成了国产 3A 游戏爆发的最后一块拼图。继革命性的《黑神话:悟空》之后,包括《影之刃零》《明末:渊虚之羽》《昭和米国物语》等多款具有国际竞争力的国产3A作品正蓄势待发。根据中国音数协会发布的《2024年中国游戏 ...

20 2024-12-20
女子8年前交了5万定金买宝马:结果现在才想起 还能继续提车

女子8年前交了5万定金买宝马:结果现在才想起 还能继续提车

快科技12月20日消息,在宝马4S店交了定金准备买车,结果8年后才想起来去提车,河南彭女士就经历了这样一件魔幻的事。据报道,彭女士表示,她2016年在这家宝马4S店缴纳了5万元定金,准备买辆宝马汽车。但一星期后,因为投资其它生意,她的资金链断了,导致 ...

8 2024-12-20
AI日报:支付宝推AI创意生成平台;谷歌王炸推理模型Gemini2.0 Flash Thinking;Runway支持插入中间帧;OpenAI准备o3推理模型

AI日报:支付宝推AI创意生成平台;谷歌王炸推理模型Gemini2.0 Flash Thinking;Runway支持插入中间帧;OpenAI准备o3推理模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌发布王炸推理模型Gemini2.0Flash Thinking,挑 ...

69 2024-12-20
漫威《美国队长4》确认引进中国内地:黑人美队大战美国总统变身的红浩克

漫威《美国队长4》确认引进中国内地:黑人美队大战美国总统变身的红浩克

快科技12月20日消息,今日,漫威电影《美国队长4:美丽新世界》确认引进中国内地院线,目前上映日期待定。据了解,在《美国队长4》中,由安东尼麦凯饰演的猎鹰”萨姆威尔逊接任美国队长,身穿新战服登场大战美国总统变身的红浩克。另外还有蒂姆布雷克尼尔 ...

12 2024-12-20
Microsoft 365出Bug致激活失效!微软官方承认并给出临时解决方法

Microsoft 365出Bug致激活失效!微软官方承认并给出临时解决方法

快科技12月20日消息,据报道,微软Microsoft 365 Office应用出现了一个问题,会导致用户在使用Office应用程序时随机收到产品已停用”错误。根据Reddit和微软社区网站上用户的反馈,这一问题已经对用户体验造成了影响,对此微软承认确实存在该问题并开始调 ...

11 2024-12-20
尊界汽车法务部首次出击:一用户公开致歉

尊界汽车法务部首次出击:一用户公开致歉

快科技12月20日消息,刚刚,尊界汽车法务部发布账号成立以来的首条微博,针对近期某用户诋毁一事进行回应,其表示:近期,我们关注到新浪微博”用户看一眼就走kk”(曾用昵称你是我唯一kk”)存在恶意引导舆论、蓄意诋毁尊界汽车的行为,已对品牌声誉造成损 ...

5 2024-12-20
成立一年品牌商单不断,这帮“很癫”的98后创意人如何用AI赚钱?

成立一年品牌商单不断,这帮“很癫”的98后创意人如何用AI赚钱?

生成式AI的迅猛发展让我们站在了一个充满可能性的十字路口。每个身处其中的人,都渴望捕捉时代的机遇,成为建造新世界的一员。面对新一轮技术浪潮,率先拥抱变化的先行者们都在做些什么,成了十分值得探讨的命题。这里是“AI新榜”推出的对话栏目「头号AI玩 ...

11 2024-12-20