本站没有人访问都是0,没有赚取一分钱
请扫码咨询

新闻动态

NEWS CENTER

跟着ChatGPT等大言语模型的面世,人工智能进入了一个全新的年代

2024-12-21

跟着ChatGPT等大言语模型的面世,人工智能进入了一个全新的年代。在这股浪潮中,多模态AI技能成为业界竞相追逐的方针,OpenAI的Sora更是将这股热情推向高潮。

等待了299天之后,屡次跳票的Sora终于来了,OpenAI在北京时间12月10日凌晨正式发布了全新视频生成模型Sora Turbo。

可是,从实测的作用来看,Sora的作用并没有带来太多惊喜,无论是在视频时长、生成作用一致性、仍是指令遵循方面,都没有显着强于市面上的已有视频模型。


事实上,Sam Altman将Sora比作视频版GPT-1的说法其实暴露了这个项目的为难处境。由于GPT-1更像是一种实验性模型,不太适合作为直接可用的生产工具,它主要被用作科研范畴的参考。

在投入大量资源和时间后,Sora假如呈现的只是一个概念验证等级的产品,假如真如GPT-1一般需要通过多次迭代以及技能突破才能达到实用水平,那么考虑到视频生成所需的巨大算力投入和数据需求,这种战略选择的成本效益比恐怕令人担忧。

一边用夸张的宣扬和神秘感制造期待,一边交出的却是一个并没有多少突破性进展的产品。特别是在2024年底这个时间点,当国表里竞争对手现已通过快速迭代完成了类似水平的作用,这种“落差”的体现略显为难。

不可否认,Sora的发布代表了多模态AI技能的重要里程碑。它展现了一个“会猜测未来”的AI体系的雏形,让人们对通用人工智能(AGI)的到来充溢期待。只不过,这次OpenAI现已不再将Sora称为“国际模拟器”了。


关于Sora的技能局限性的争论由来已久,例如,Sora在生成视频时常呈现逻辑错误,如物体运动不符合物理规律、因果关系紊乱等问题,现在的Sora Turbo显然也没有处理这一问题。早在年初,Meta首席科学家杨立昆就直言,Sora的生成式技能路线“注定失利”,由于其依赖于大规模数据练习的概率模型,无法真实了解物理国际的因果关系。此外,Sora的生成过程更多是对已有数据的拟合,而非创造新知识,这使其在模拟实在国际方面仍有很长的路要走。

愿望总归要回到实际,除了技能老练度,Sora在产业化方面还存在诸多应战:

首先,Sora的练习和使用成本极其高昂。据Factorial Funds预算,假如Sora要大规模使用,还需要约72万片英伟达H100 GPU的支持,这意味着216亿美元的硬件投入。如此天价的算力耗费,让Sora很难在短期内完成商业闭环。

其次,Sora在落地场景方面尚不老练。尽管Sora现已正式发布,但在作用上离真实的“国际模拟器”距离甚远,现阶段更像是一个玩具而无法成为一个真实实用的构思工具。可以说,Sora离真实的“iPhone时间”还有适当长的路要走。

相关推荐