动作 - 科技网

当前位置：

首页
TAG:动作

阿里国际版o1来了，Marco-o1：聚焦开放式问题推理

阿里国际版o1来了，Marco-o1：聚焦开放式问题推理

自从 OpenAI 发布 o1模型以来，业界对其的追赶不断加速。大模型推理的一个关键挑战在于，现实世界常常提出很多开放式和创造性的问题，对于 AI 来说，这是一类很难评估的任务，因为没有「标准答案」或者易于量化的奖励。我们能否训练一个模型，让它能够从 ...

1 2024-11-24

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

Scaling Law又能续命了?如何通过语言智能体的高级规划来Scaling推理时计算?答案就是——使用LLM作为世界模型。也就是说，使用GPT-4o来预测网站上操作的结果，可以提供强大的性能，同时还能提高安全性和效率。近日，来自俄亥俄州立大学等机构的研究人员提出 ...

0 2024-11-23