大家好,今天小编来为大家解答【对标OpenAI o1 ?杨植麟还说了这些】这个问题,很多人还不知道,现在让我们一起来看看吧!
作者|苗正卿、王欣
题图|虎嗅拍摄
1993年出生的杨植麟穿着一件黑色的月之暗面工装T恤、米白色工裤、带着黑色半框眼镜走进了月之暗面北京海淀知春路总部大楼的会议室。他面带微笑,但略显腼腆,笑的时候甚至会不经意地用手捂嘴。
此时是11月16日下午,距离Kimi Chat开放恰好一周年。在过去一周,月之暗面被复杂的舆论与情绪包裹环绕,但从杨植麟的神情上看,似乎外界的情绪对他影响并不大。
在稍坐几分钟后,杨植麟放下手中的咖啡,站了起来。相比于一年多前,他变得更幽默也“社牛”了许多,他跟大家寒暄了几句,还开了几个小玩笑。但很快,他恢复了原本那个“杨植麟”的样子:滔滔不绝地讲起技术和数学公式,眼神尽量躲避着与人接触,而是兴奋地盯着屏幕上的代码与数字。
“我们希望AI去探索,接下来最重要的方向是让AI具备思考的能力。什么能让模型锻炼模型的思考能力呢?我觉得是数学。”杨植麟说。
紧接着,他讲到了伽利略,谈到了伽利略的观点“宇宙的底层语言是数学”,然后亮出他今天第一张牌:他宣布发布Kimi新一代数学推理模型 k0-math。在基准测试中,k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。
在接下来大约20分钟的时间里,31岁的杨植麟几乎化身为一个“高中老师”,他在现场用大量高考数学题目演示kimi数学模型的“思考能力”。他是那样兴奋,以至于一度在近十分钟的时间里杨植麟目不转睛盯着桌面电脑、不看众人、沉迷讲题——像是北大数学天才韦神附体。
“目前,IMO题目和高考难题,有一定的概率会做错。但模型成长很快,去年这些题目正确率20%多,今年已经有90%多。这个最新的数学模型,估计未来一两周就会上线。”杨植麟说。值得注意的是,局限依然存在,kimi数学模型也会因为过度思考,而在简单问题上花费多余的步骤,同时在生物、化学、物理等学科的泛化性上仍然有待提升。
终于,在沉浸式体验30多分钟的“数学老师角色”后,杨植麟从中抽离,然后他回顾了过去一年:“我们去年也是这一天发布的产品,当时从1个用户开始,现在总用户数超过3600万。”在说完这些后,杨植麟如释重负,狠喝了一口水。
不过人们对于杨植麟的好奇,并不局限于他最新的模型。只是他在这次与媒体的交流中,并没有回应一切。
以下是11月16日下午在月之暗面总部,杨植麟交流实录:
今年什么时候决定聚焦Kimi,去缩减其他产品的?是什么原因做出这个决定?
杨植麟 :今年2~3月份,我做了这个决定。一个是基于美国市场的判断,一个是基于我们自己的观察。我们决定必须要做减法,而不是做加法。我会选择聚焦。以及,我会观察海外的情况,然后去判断哪些业务上限最高,接下来思考哪些业务最匹配我们的能力,基于此做聚焦,去把核心的创新能力做好。(虎嗅注:据虎嗅了解,此前月之暗面发力的ToC类出海产品 Ohai 和 Noisee,都已经出现了业务调整,或缩减合并到kimi本身,或进行项目裁撤)
最近你们有人才流失吗?如何看待行业内AI创业公司被收购、人才回流大厂?
杨植麟:我们没有遇到人才流失,月暗也没有出现人才回流大厂的情况。在几个大模型公司里,其实我们做的还好,我们一直保持人数最少,保持人和卡的比例保持健康。我们的规模保持在一个合理的状态,不希望公司人数涨得很猛。对AI行业而言,堆规模在一开始或许管用,但从长远看应该意义不大。所以应该聚焦,不要活生生做成大厂模式。比如说,如果我现在依然三个业务一起做,那我就活生生把自己做成了一个大厂,那我肯定没有任何优势。
今年最核心的任务是什么?
杨植麟: 用户留存。这是最关键的任务指标,它和你的技术成熟度有正相关,我们还有提升空间。现在模型的思考能力还不够强,这些能力提高后,用户留存会继续上升。
留存提高到多少,符合你的预期?
杨植麟:永无止境。
今年Kimi好像投放动作比较大?你们的投流策略是什么?
杨植麟:对我们而言最核心的是把留存做好,适当的投放是需要的,但平衡需要做好。
思考和交互哪个最重要?多模态是必要的么?
杨植麟:思考比交互更重要,思考是必要条件,之后才是交互。我觉得思考是当下大模型需要解决的第一要务。我们的多模态在内测,但多模态的前提是模型的思考能力
你怎么看待超级应用?
杨植麟:已经出现了。ChatGPT其实已经是了,它有5亿用户。就算说它不是一个超级应用,起码可以算半个吧?起码说明ChatGPT这个模式是被验证可以做成的。但相比之下,character.ai这种产品,一开始用户量很多,但最后发现是很难破圈的。这些海外发生的事情,都是我们的关键参照。
如何看待豆包今年猛烈的增长
杨植麟:我们不关注竞争本身,竞争本身并不产生价值。我们聚焦模型的思考能力、推理能力,去解决怎么给用户更大的价值。我觉得关键是去做正确的事情,而不是去思考做差异或者为了竞争单独做什么。
以上就是【对标OpenAI o1 ?杨植麟还说了这些】相关内容,更多资讯请关注科技网
大家好,今天小编来为大家解答【荣耀Play 9T Pro手机采用“视觉四等窄边”设计,后置50MP镜头】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 25 日消息,荣耀 Play 9T Pro 手机将于明日(12 月 26 日)开启预售,该款手机主打“轻薄抗摔 ...
大家好,今天小编来为大家解答【影视飓风2024年度相机颁奖:iPhone 16 Pro Max获最佳手机视频】这个问题,很多人还不知道,现在让我们一起来看看吧!快科技12月25日消息,B站千万粉UP主“影视飓风”公布了2024年度相机颁奖。其中“最佳手机视频”的桂冠颁给了 ...
大家好,今天小编来为大家解答【联想CES 2025多款新品曝光,含太阳能供电键盘、卷轴屏电脑等等】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 25 日消息,Evan Blass 今日曝光了一款联想为 CES 2025 准备的无线蓝牙键盘新品。据他介 ...
大家好,今天小编来为大家解答【罗永浩瞄准AI硬件!新品理念超前,能否一雪TNT前耻?】这个问题,很多人还不知道,现在让我们一起来看看吧!罗永浩的“真还传”还未画上句号,“最后一次创业”已在进程中。2022年7月10日,罗永浩创立了细红线科技有限公司,最 ...
大家好,今天小编来为大家解答【“深思熟虑”的AI:OpenAI提出全新安全对齐方法】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 25 日消息,OpenAI 的研究人员提出了一种名为“深思熟虑的对齐”(Deliberative Alignment)的新方法,以提 ...
大家好,今天小编来为大家解答【新研究发现OpenAI的o1-preview AI模型在诊断棘手医疗案例方面优于医生】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 25 日消息,由哈佛医学院和斯坦福大学组成的科研团队,在医学诊断领域深入评估 Op ...
大家好,今天小编来为大家解答【《黑神话:悟空》预告和《封神第二部》特效是同公司做的 网友:导演差距大】这个问题,很多人还不知道,现在让我们一起来看看吧!《封神第二部》首支预告片已于12月18日公布,其中魔家四将的出场画面被吐槽不如《黑神话: ...
大家好,今天小编来为大家解答【阿里通义千问开源视觉推理模型QVQ-72B-Preview:像物理学家一样思考】这个问题,很多人还不知道,现在让我们一起来看看吧!IT之家 12 月 25 日消息,阿里通义千问 Qwen 团队今天(12 月 25 日)发布博文,宣布基于 Qwen2-V ...
大家好,今天小编来为大家解答【技术进展放缓,是普通人AI革命的开始】这个问题,很多人还不知道,现在让我们一起来看看吧!1866年,西门子的一位工程师发明了人类第一台直流发电机。40年后,通用电气在1906年开始量产真正让电灯普及的第一代白炽灯泡。在 ...
大家好,今天小编来为大家解答【李想:要做人工智能企业,我要选择一个森林】这个问题,很多人还不知道,现在让我们一起来看看吧!三言科技12月25日消息,今日,理想汽车发布了理想AI Talk的预热视频,其中截取了部分公司CEO李想对人工智能的观点。李想被 ...