OpenAI神秘項目「草莓」曝光!自我进化已超越人类智能?马斯克嘲讽:回形针灾难

根据路透社最新报道,OpenAI正在秘密开发代号为“草莓(Strawberry)”的全新项目。

根据路透社在五月份获得的 OpenAI 内部文件副本,草莓项目的工作原理目前仍保持高度机密,但 OpenAI 正在全力推进该项目。其目标是提升人工智能的推理能力,使模型不仅能够生成查询的答案,还能提前规划、自主浏览互联网,并执行 OpenAI 称之为“深度研究”的复杂任务。

草莓项目的最新动态

知情人士透露,草莓项目采用了一种特殊的后训练技术(post-training),该技术在模型通过大规模数据集预训练后进一步优化,使其在特定领域表现更加出色。

从爆料内容看,草莓项目与斯坦福大学在 2022 年开发的“自学习推理”(Self-Taught Reasoner,STaR)方法有相似之处。创造该方法的 Noah Goodman 教授告诉路透社记者,STaR 允许 AI 模型通过反复生成自己的训练数据来自我“引导”,从而达到更高的智能水平。理论上,这一方法可以使大语言模型超越人类的智能。

相关的两篇论文包括:

  1. STaR: Bootstrapping Reasoning With Reasoning 论文链接
  2. Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking 论文链接

推理在 AI 发展中的重要性

推理能力是实现人工智能达到甚至超越人类智能水平的关键。尽管大型语言模型已在总结复杂文本和撰写优雅散文方面表现出色,但在识别逻辑谬误和处理简单直觉问题(如井字棋)方面仍显薄弱,模仿时常会产生虚假信息的“幻觉”。

草莓项目被指能够自主浏览互联网并进行“深度研究”,采用了计算机使用代理(CUA)技术。其主要目标是增强人工智能的推理能力,结合特殊的“后训练”方法,利用“深度研究”数据集对模型进行训练和评估。这种方法使得 AI 模型能够处理复杂的长期任务(LHT),并提前规划一系列操作。OpenAI 联合创始人 John Schulman 在接受 Dwarkesh Patel 的播客采访时透露了项目的最新进展。

播客链接

如果草莓项目如爆料所言,可能会成为大语言模型研究进程中的一个重要转折点,标志着我们从单纯依赖大规模数据和计算能力的方法,转向更注重 AI 系统内在推理能力和自主学习的新范式。

知名人士的看法

领域内的知名人士也对此表示关注,马斯克对此进行了评论,他提到,过去人们常将 AI 灾难比喻为回形针问题,但如今更有可能是草莓田问题。马斯克提及了哲学家尼克·博斯特罗姆的观点:高度智能的 AI 有可能执行看似简单但潜在危险的任务。

此外,ChatGPT 之前关于“草莓”的笑话也在业内引发热议。

OpenAI 的全球智能评分体系

除了草莓项目的消息,OpenAI 近期还有一项重大进展。近日,OpenAI 举行了全员大会,推出了全球智能评分体系(AGI),并展示了接近人类推理能力的模型。在会议上,OpenAI 的高管告知员工,目前 ChatGPT 处于第一级阶段,但即将达到第二级,称为“推理者”。

以下是全球智能评分体系(AGI)五级评分系统的标准:

  1. 第一级(Level 1, ChatBots):这些 AI 目前能进行基本对话,如现阶段的 ChatGPT。
  2. 第二级(Level 2, Reasoners):能够进行基本推理和问题解决,类似于获得博士学位的人,且不依赖外部工具。
  3. 第三级(Level 3, Agents):在几天内代表用户执行任务,例如自动化复杂工作流程。
  4. 第四级(Level 4, Innovations):不仅能完成任务,还能提出新的解决方案或创新。
  5. 第五级(Level 5, Organizations):最高级别的 AI 可以像一个组织运作,处理大量复杂任务,几乎能完全替代人类在某些领域的工作。

对此,一个网友幽默地回应道,尽管他对这个分级没有异议,但若 AI 达到第五级,自己可能就要彻底失业了!他希望 AGI 的进化历程能延续一万年。

根据彭博社的独家报道,一位 OpenAI 高管透露,目前模型正处于第一级,但预计很快将晋升至第二级,即“推理者”。该公司正致力于在特定任务上实现博士级别的智能,可能在一年或一年半内实现这一目标。

滚动至顶部