每日热讯|Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程

智趣 | 2024-12-16| 21

大家好,今天小编来为大家解答【Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程】这个问题,很多人还不知道,现在让我们一起来看看吧!

IT之家 12 月 16 日消息,月之暗面 Kimi 今日发布视觉思考模型 k1。该模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。

月之暗面官方表示,在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现超过了 OpenAI o1、GPT-4o 以及 Claude 3.5 Sonnet。

IT之家从月之暗面官方获悉,Kimi 新模型发布即上线。k1 视觉思考模型已陆续上线最新版「Kimi 智能助手」的 Android 和 iPhone 手机 App 以及网页版 kimi.com。在最新版手机 App 或网页版 Kimi+ 页面找到「Kimi 视觉思考版」,即可拍照或传图体验。

「Kimi 视觉思考版」会完整呈现推理思维链 CoT,让用户不只看到答题结果,也能完整看到模型思索答案的全过程。

从模型训练的角度看,k1 视觉思考模型的训练分为两个阶段,先通过预训练得到基础模型,再在基础模型上进行强化学习后训练。k1 的基础模型重点优化了字符识别能力,在 OCRBench 上得到 903 分的(state-of-the-art)结果,在 MathVista-testmini、MMMU-val 和 DocVQA 基准测试集上分数分别为 69.1、66.7 和 96.9。

月之暗面表示,k1 的强化学习后训练在数据质量和学习效率方面做了进一步优化,在强化学习的规模化(scaling)上取得了新的突破。

此外,科学的模型能力基准测试方案是大模型行业面临的重要挑战之一。由于市面上缺乏针对基础科学学科的图形测试集,Kimi 模型研发团队自主构建了一个标准化的测试集 Science Vista,涵盖不同难度的数理化图片题目,且从分布上与实际用户需求较为匹配。该测试集将开放给全行业,用户可申请在许可范围内使用。

在内部测试中,月之暗面也发现了一些 k1 视觉思考模型存在的局限性,例如在分布外(out-of-distribution)的泛化、在更复杂问题上的成功率、在更多噪声场景的准确率、多轮问答效果等方面,有很大提升空间。在一些场景和泛化能力上,k1 模型与 OpenAI 的 o1 系列模型相比仍有差距。

以上就是【Kimi发布视觉思考模型k1:试题拍照给出答题思考全过程】相关内容,更多资讯请关注科技网

相关推荐相关推荐

全球关注:网传极越正招募运维团队,飞书群还有100多人

全球关注:网传极越正招募运维团队,飞书群还有100多人

大家好,今天小编来为大家解答【网传极越正招募运维团队,飞书群还有100多人】这个问题,很多人还不知道,现在让我们一起来看看吧!鞭牛士 12月26日消息,今日有极越前员工称极越在招募运维团队,该员工透露招募是针对数字化产研群组的(不含整车那边,数 ...

智趣 3 2024-12-27
飞天网评:大疆深圳湾超级总部拿地,总建筑面积18.8万平方米

飞天网评:大疆深圳湾超级总部拿地,总建筑面积18.8万平方米

大家好,今天小编来为大家解答【大疆深圳湾超级总部拿地,总建筑面积18.8万平方米】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 26 日消息,深圳市政府官网昨天发布了一份《智能航空系统产业生态全球总部项目遴选方案》。文件显示, ...

智趣 2 2024-12-27
热点头条:吃谷子,找委托,月薪三万养不起这届孩子?

热点头条:吃谷子,找委托,月薪三万养不起这届孩子?

大家好,今天小编来为大家解答【吃谷子,找委托,月薪三万养不起这届孩子?】这个问题,很多人还不知道,现在让我们一起来看看吧!2024年最让家长迷惑的东西,一定是“谷子”。很多家长对“谷子”的初步了解,竟然不是从孩子的口中,而是从风起云涌的股市里习 ...

智趣 3 2024-12-27
「光明时评」马斯克自曝转用礼来减肥药:效果优于诺和诺德竞品,副作用更少

「光明时评」马斯克自曝转用礼来减肥药:效果优于诺和诺德竞品,副作用更少

大家好,今天小编来为大家解答【马斯克自曝转用礼来减肥药:效果优于诺和诺德竞品,副作用更少】这个问题,很多人还不知道,现在让我们一起来看看吧!财联社12月27日讯(编辑 夏军雄)世界首富埃隆·马斯克周三在社交媒体平台X上透露,他正在使用礼 ...

智趣 3 2024-12-27
「光明时评」郭有才说走红像“做梦一样”:爆红是一种偶然

「光明时评」郭有才说走红像“做梦一样”:爆红是一种偶然

大家好,今天小编来为大家解答【郭有才说走红像“做梦一样”:爆红是一种偶然】这个问题,很多人还不知道,现在让我们一起来看看吧!12月27日消息,据媒体报道,因翻唱《诺言》出圈,郭有才上半年走入了流量中心。半年多过去后,郭有才在接受采访时表示,他 ...

智趣 4 2024-12-27
大江时评:余承东赢了!网友热议华为死忠用户标准:敢说你是花粉吗

大江时评:余承东赢了!网友热议华为死忠用户标准:敢说你是花粉吗

大家好,今天小编来为大家解答【余承东赢了!网友热议华为死忠用户标准:敢说你是花粉吗】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月27日消息,你敢说你是花粉吗?如果没有满足以下标准,可能还真不算吧....近日不少网友开始在社交媒 ...

智趣 3 2024-12-27
每日热议!70岁董明珠谈从格力退休:股民、员工都不想我退休

每日热议!70岁董明珠谈从格力退休:股民、员工都不想我退休

大家好,今天小编来为大家解答【70岁董明珠谈从格力退休:股民、员工都不想我退休】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月27日消息,日前,格力电器董事长董明珠与新浪财经CEO邓庆旭对话时再次谈及了“明年是否会退休”的话题。邓 ...

智趣 2 2024-12-27
全球简讯:OpenAI ChatGPT AI服务再次“跳闸”

全球简讯:OpenAI ChatGPT AI服务再次“跳闸”

大家好,今天小编来为大家解答【OpenAI ChatGPT AI服务再次“跳闸”】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 27 日消息,OpenAI 的 AI 服务器再次“跳闸”,本次系统服务中断于北京时间 12 月 27 日凌晨 2 点 30 分左右开始,影响 ...

智趣 2 2024-12-27
热点播报:一加Ace 5 Pro发布:骁龙8至尊版游戏旗舰,售价3299元起

热点播报:一加Ace 5 Pro发布:骁龙8至尊版游戏旗舰,售价3299元起

大家好,今天小编来为大家解答【一加Ace 5 Pro发布:骁龙8至尊版游戏旗舰,售价3299元起】这个问题,很多人还不知道,现在让我们一起来看看吧!凤凰网科技讯 12月26日,一加今日召开新品发布会,一加Ace5系列新机正式发布。新机包含标准版和Pro两款,主打 ...

智趣 8 2024-12-26
报道:理想创始人李想重新露面并发声:不做特斯拉那样的 RoboTaxi,但想做一辆超级跑车

报道:理想创始人李想重新露面并发声:不做特斯拉那样的 RoboTaxi,但想做一辆超级跑车

大家好,今天小编来为大家解答【理想创始人李想重新露面并发声:不做特斯拉那样的 RoboTaxi,但想做一辆超级跑车】这个问题,很多人还不知道,现在让我们一起来看看吧!编者注:自今年上半年理想创始人李想不再在微博公开发声之后,他消失在公众视野已经 ...

智趣 9 2024-12-26