本站没有人访问都是0,没有赚取一分钱
请扫码咨询

新闻动态

NEWS CENTER

使用驱动”成为第一性原理

2024-12-21

就像上世纪60年代的核聚变发电:展示出令人震慑的潜力,吸引了大量投资和顶尖人才,但跟着研究深入,技能难度和资源投入却呈指数级增加。尽管每隔几年就有突破性开展的陈述,但要实现实在可控、稳定的商业使用,一直像隔着“永久差30年”的距离。

所以,如今的Sora面对这样一个窘境:在完美的演示视频背面,是否存在不可逾越的技能瓶颈?这种寻求完美视频生成的路径,会不会终究被证明是一个代价高昂的技能死胡同?要将实验室的演示转化为实在有价值的使用,可能比咱们幻想的要困难得多。

对此,百度创始人李彦宏在最近接受采访时曾表示:“假如真的可以做到恣意场景下视频生成,那可能要很长很长时间,而且成本很高。”由此可见,百度并非不重视Sora所代表的技能方向。只是基于务实的判别,挑选了另一条道路。

二、“使用驱动”成为第一性原理

与许多厂商专注于打造Sora这样的通用文生视频模型不同,百度智能云的着眼点在于帮助客户实现多模态使用的落地。正如李彦宏所言,“咱们更关怀怎样帮用户把使用跑起来”。事实上,在很多职业客户的实践场景里,他们实在需求的是在自己的使用中拥有可靠的多模态才能,而不仅仅是一个裸的通用模型。百度智能云深谙此道,经过多年来在多模态范畴的深厚积累和大量工程化实践,以更简略快捷、低门槛的方式赋能客户,让多模态使用可以开花。这也是百度暂不直接做Sora,而是聚焦使用落地的重要原因。

不做Sora,并不意味着百度在多模态AI范畴缺席。恰恰相反,百度一直在多模态范畴有着长期而深厚的积累,只是挑选了一条使用驱动的道路。

跟着当前大模型性能增加遇到瓶颈,AI正在进入“镇定期”。海外AI巨头从寻求AGI转向务实道路,OpenAI尝试转向盈利性商业化运营,谷歌、微软等纷纷聚焦商业变现和产业使用,重点开展To C业务、企业服务和开发者生态。

正如历史上的典型的技能周期:高期望→泡沫→镇定期→务实使用。职业需求从“技能优先”的逻辑切换到“使用优先”的轨道,经过实践中反馈的需求和问题为技能开展指明方向。

那么,什么是“使用驱动”?简而言之,便是从实在使用场景出发,整理AI落地的要害问题,并聚焦资源予以处理,终究让技能产生实践价值。这有别于动辄“颠覆性创新”、寻求酷炫Demo的做法。在李彦宏看来,“我更多期望尽早触摸场景及触摸使用,看在这个进程傍边,究竟遇到了什么问题,把这些问题带回来,咱们综合一下,看大家遇到的最多的问题,便是咱们优先处理的问题。”

这种理念,与当年云计算之于互联网的联系有着异曲同工之妙。回溯历史,正是得益于云计算渠道在基础设施层面的支撑,互联网企业才能将更多的精力聚焦在业务创新上,加快用户需求与技能才能的迭代融合,终究催生出一个繁荣的使用生态。

如今,百度智能云正是期望在多模态AI范畴扮演这样一个“助推器”的角色。经过在算力、渠道、安全等多个维度供给支撑,让更多的企业和开发者无需在复杂的模型训练、部署、使用开发上“跋山涉水”,而是专注于挖掘职业需求、打造可用的智能化使用,让多模态AI从实验原型逐步开展为日常东西。

站在这个思路上审视多模态AI,就不难理解百度智能云的战略挑选。在多模态AI落地的进程中,有两大要害挑战亟待霸占:一是实现更天然的人机交互,二是提高模型的可控性、尽可能消除幻觉。单纯的视频生成模型尽管看上去很帅,但还难以很好地处理这两大问题。反而是在一些垂直范畴,用更简略实在的多模态技能,就能让AI先跑起来。

比如在工业质检范畴,结合图画识别和文本描述的多模态体系现已能精确找出产品瑕疵并生成具体的检测陈述;又如在医疗印象诊断中,将X光片、CT等图画与病历文本结合分析的计划,现已在多家医院实现规模化使用。这些看似日常的使用,才是AI实在发明价值的开始。

相关推荐