“今天,所有VC的会上都在谈Sora”

推荐使用ChatGPT4.0中文网,国内可直接访问:www.chatgp4.com

仿佛梦回2023年,去年年初,ChatGPT引发了公众的热烈讨论,随后全球都在AI大模型投资上展开了一场军备竞赛。

龙年伊始,OpenAI又再次开辟了新天地。2月16日凌晨,OpenAI发布了文生视频大模型Sora。Sora可以依据文本提示创建详细视频,扩展现有视频中的叙述,甚至从静态图像生成动态场景。

尽管这类应用早已有之,但Sora的表现依旧令人惊艳。视频中的主体稳定可控,能够实现多角度切换,并且时长突破,最长可生成60秒的视频。这不仅彰显了OpenAI的实力,也标志着生成式AI进入一个新的里程碑。

与此同时,资本市场传来了新消息。OpenAI经过最新一轮交易后,其估值已飙升至800亿美元以上。这笔资金来自Thrive Capital精心策划的要约收购。

尽管OpenAI与Thrive Capital对此未做评论,但小红书博主“Shannon”的一则情绪大发的帖子引起了广泛关注,“明天所有基金开会的议题都有OpenAI的Sora。”

不过,与去年相比,投资者的心态有了变化。虽然并非人人都有机会投资OpenAI,但OpenAI的能力边界却切实影响着一批创业公司及其背后投资人的前景。

“水到渠成”和“令人发指”

需要明确的是,“文生视频大模型”并不是一条全新的赛道。在OpenAI之前,诸多头部大模型研发商早已推出自己的文生视频大模型,如Google的Lumiere和Stability AI的SVD(Stable Video Diffusion)。甚至已有针对多媒体内容创作的大模型独角兽,例如视频生成模型Gen-2的开发商Runway,2023年6月底完成Google、Nvidia、Salesforce参与的C轮融资,估值超过15亿美元。

更值得注意的是,这些已有的视频大模型隐隐透露出成为生产力工具的影子。

以Runway为例,其三位创始人Valenzuela、Alejandro Matamala和Anastasis Germanidis来自纽约大学艺术学院,他们共同认识到“人工智能在创造性方面的潜力”,从而决定研发服务于电影制作人和摄影师的工具。这样的基因背景,使Runway的发展更像是一场“影视城的奋斗史”。

起初,他们开发了一系列细分到极致的创作者辅助工具,满足视频帧插值、背景去除、模糊效果、运动追踪等需求。后来,他们逐步参与到图像生成大模型Stable Diffusion的开发中,积累了在静态图像生成方面的技能,同时也获得了参与《瞬息全宇宙》等大片制作的机会。在宣传中,出品人们称其加入使后期团队“保持了超乎寻常的小规模”状态,影视同行们惊叹许多复杂特效的制作已从“好几天”缩短至“几分钟”。

2023年2月,Runway发布第一代产品Gen-1,普通用户可以通过iOS设备免费体验,包括“真实图像转黏土”和“文本转视频”,使Gen-1成为了首批商业化的文生视频大模型;2023年6月,第二代产品Gen-2的训练量增至2.4亿张图像和640万段视频剪辑。

2023年8月,《流浪地球3预告片》这一 AIGC 作品在B站爆火,在线观看量超过千万,获得郭帆点赞,而这段视频正是基于Gen-2制作的。根据作者@数字生命卡兹克的社交媒体分享,该视频的制作大致分为两部分:由MidJourney生成分镜图,然后由Gen-2扩散至4秒的视频片段。最终获得693张素材图和185条备用剪辑,耗时五天。半年后,通过“MJ V6画分镜-Runway跑视频”技术,@数字生命卡兹克制作了一段3分钟的故事短片《The Last Goodbye》,并参与了Runway Studios主办的第二届AI电影节Gen48的比赛。

换句话说,早在一年之前,“文生视频大模型”就已拥有足够的关注度,目前的用户规模甚至被严重低估。Runway的联合创始人Valenzuela在C轮融资后透露,他们除了和New Balance这样的世界500强客户合作外,还有“数百万个人创作者”。

此外,Sora展现的“精准的物理世界还原能力”并不是OpenAI独自探索的领域。马斯克在Sora发布后的两天半,即2月18日,在科技播客栏目“DrKnowItAll”中留言称,“这种精准还原现实世界物理规律的虚拟世界生成能力,特斯拉已经快掌握一年了……不过因为素材来自车载摄像头,所以视频看上去没那么有趣。”

OpenAI同时发布的技术论文《Video generation models as world simulators》也明确,Sora更像是“数据驱动的物理引擎”,通过大模型持续扩散“高性能地模拟物理世界或数字世界中的人、动物及其他物体”,但仍旧面临一些“同行们都会遇到”的局限,如“难以准确模拟复杂场景的物理原理,无法理解因果关系等问题”。

真正让人感到压力的,或许是Sora不可思议的进化速度。从技术层面看,无论是“拥有精准物理规则的真实世界”、“支持60秒视频生成”还是“单视频多视角”,都可以被视为其发展的必然。然而,正如上面提到的,Gen-2的发布日在2023年6月,支持生成的“4秒视频”和“明显掉帧”的技术在如今看起来显得有些笨拙,却正是这八个月的时间间隔。

2023年11月,Meta发布的Emu Video在Gen-2的基础上更进一步,能够支持512×512、每秒16帧的“精细化创作”。然而仅仅三个月后的Sora却已能生成任意分辨率和长宽比的视频,根据开发者技术论文,Sora还能够执行多项图像和视频编辑任务,如创建循环视频、即时向前或向后延伸视频以及更改现有视频背景等。

如果要去理解这种惊人的进化速度,除了“外星文明”的可能性,最现实的解释恐怕只有“海量资金投入”。

作为Runway道路上的伙伴,Stability AI在过去两年中周期性面临“现金流压力”。传闻其高层积极探索出售公司,而早期投资者Coatue Management的内部信也直指“Stability AI的财务状况令人忧虑”,甚至建议CEO恳请辞职。最揪心的消息是,为了让亚马逊相信自己不会拖欠高达7500万美元的云服务费用,Emad Mostaque选择以个人财产作为担保。

然而从融资的角度来看,Stability AI在2022年10月完成超过1亿美元的融资,估值早早达到了独角兽级别。Emad Mostaque在去年7月的一次采访中表示:“Bard AI因为在宣传片中的不准确信息,每天损失超过1000亿美元……人工智能基础设施所需的投资总额可能高达1万亿美元,这无疑将成为人类历史上最大的泡沫。”

知乎上,一位名为“像素炼金师”的创业者坦言,在目睹Sora发布后,他产生了害怕的情绪:“我害怕科技巨头的产品如火车一般飞驰而过,而我所努力做的却如同路边的野草,在技术飞速发展的时代中徒劳无功。”

估值800亿与领头羊的边界

无论如何,OpenAI再次重申了其在AI领域的巨无霸地位。其能力看似无远弗届,使估值在不到10个月的时间里翻了一番。CB Insights数据显示,OpenAI目前是全球最有价值的科技初创企业之一,仅次于字节跳动和SpaceX。

在拓展模型能力的同时,OpenAI也在推进多元化战略。尤其在半导体领域,奥尔特曼正在与潜在投资者、半导体制造商及能源供应商等各方利益相关者接触,甚至考虑成立一家独立于OpenAI的新公司以进入AI芯片行业。

这一交易也反映了奥尔特曼对OpenAI不可或缺的角色。实际上,在去年11月,OpenAI本应敲定最新融资交易,但奥尔特曼遭遇了被解雇的风波。尽管不清楚这笔交易是否受到影响,但最终770名员工中的700多人签署请愿书要求其复职。

回顾这轮融资,OpenAI并没有发行新股,而是允许员工对外出售所持股份。这对OpenAI来说并不算陌生。2023年,Thrive Capital、红杉资本、Andreessen Horowitz及K2 Global等风险投资巨头曾参与OpenAI的要约收购,当时该公司的估值已达到290亿美元。

那么,OpenAI的边界究竟在哪里?

这个问题不仅涉及OpenAI的估值,也关系到无数生成式AI创业公司的未来。

在视频生成领域,海外已涌现出几家知名创业公司。Runway就是其中之一,另一个领头羊是成立于去年4月的Pika。Pika在11月宣布完成5500万美元的A轮及天使轮融资,估值达2.5亿美元。Pika的创始人郭文景和孟晨琳都曾是斯坦福大学人工智能实验室的博士生,背景非常亮眼,郭文景更是被誉为“华裔天才少女”。

OpenAI会冲击这些公司吗?别急,Sora公开后,有海外博主已对几家公司产品做了对比,发现Sora在生成时长、连贯性等方面均具有显著优势。

值得一提的是,这些从事视频生成的公司都在开发自己的大模型,而非单纯基于其他大模型的应用场景。然而,即便如此,抵挡OpenAI的冲击依然艰难。

这并不意味着专注应用的公司没有前途,背后或许也涉及阶段性的挑战。

去年的一篇文章中,红杉资本的两位合伙人再次审视自己一年前的市场判断。他们承认,一个错误的预测是“垂直分离尚未发生”。他们仍相信,应用层公司与基础模型提供商之间会有明显分化,模型公司专注于规模和研究,而应用层公司则专注于实际产品和界面设计;但实际上,这种分离并未彻底形成,最成功的应用往往是垂直整合的公司。

国内的情况也类似。

有投资者对我表示,他们关注的一家AIGC公司正在研发基于特定产业数据的独有模型,而不是单纯调用其他API。“否则很难指望他们在应用层面上做到真正的差异化。”

回首过去一年,OpenAI的每一次技术突破都在不断拓展资本市场对它的想象空间,同时也堵塞了部分创业公司的进路。

“AGI去年已经让软件行业遭受重创。如今,公众只是目睹着这一过程的发酵。”一位创业者在朋友圈评论道。

因此,AI投资变得更加困难,尤其是在应用层。“关键在于清晰界定哪些东西能够在大模型演进中受益,哪些则可能被瓦解。”一位AI投资人曾模糊地向我表述。但OpenAI的超能力使得这一关键问题变得难以预判。

再看大模型。我曾写到《北京最火独角兽翻了6倍》,智谱AI在过去一年间估值增长了六倍多,已有投资者对其预估价值达200亿。我最近还听说,百川智能与MiniMAX传出了新一轮融资的好消息。OpenAI的新动作,令这些公司必然会感受到压力。幸运的是,他们的资金储备依然充足,Sora的问世无疑将引发新一轮的追逐。

借助Sora的热潮,AI相关概念必将再次受到关注,特别是以英伟达为代表的企业将借机获利。但对一级市场的创业者和投资者而言,只能说,暂时还要继续竞争。

滚动至顶部