当前位置：首页 >新闻动态 >新媒体服务

由于AlphaGo正好规矩是清晰的，只需符合围棋规矩的任何测验都是实在的一部分

2023-09-01

那到那里能找到这种对逼近实质和元真有协助的多样化的数据呢？

现在看只有两种方法：一种方法是加大采集范围和力度，也就是说等着实在世界出产，但拿的更全；一种则是自生成。让人工智能生成的数据可以辅佐人工智能的进化。前者对应多模态，后者则首先是范畴自身的特质。

三、多模态解决问题么？

2010年前后开端的人工智能浪潮是从多模态开端的，尽管不同创业者往往从不同的维度开端，但最大的两个分支：视觉和语音依靠的正是声光电热力磁几个要害感知维度中的声和光。需求弥补一点的是：声不单是常见的识别还包含声纹、噪声检测、毛病检测等，光也不单包含人脸识别还可以用红外线来查看物品质量、问题，深度摄像头来做三维场景的感知等。

传感器的低成本和精度提升是多模态的基础。

多模态必定能解决数据上量的问题，质的问题则不太行。

量上只需一定量的摄像头就可以每天获取很多信息。

但质上面由于你布置多少维度的传感器就有多少维度的信息，真要获取这些信息，朴实依靠自己就需求慢慢布置累积，依靠协作则更困难由于数据交易流转自身困难重重，所有权、使用权并不清楚。所以多模态在长时刻轴上能协助缓慢解决问题，但注定需求非常大的成本和时刻，没或许辅佐启动智能飞轮。

这很像一个大排气量的轿车配了个小的供油管，怎样用力给油也是不行。

四、数据能够自生成么？

数据自生成有个悖论。

假如元真和实质配合着全量的规矩，做数据的生成，那对实质的表达是充沛的，这样你生成的数据是多样且有意义的，必定有助于智能飞轮。但假如规矩是局部的，那就会生成很多重复数据，这些数据都在原来的范畴里面等于垃圾数据。从他们也只会回到部分规矩和实质。

这时候问题的要害变成到那里寻觅一种随机性，并且这种随机性的结果，在范畴或特定的范围里是实在的。你发明了一些爬行动物的数据，那得和蛇或许其它的什么相同，恐龙都行，否则就构成对爬行动物这个概念的污染。

从这个视点看大模型的错觉是有益的，它供给了原始的或许。但这类错觉有助于构建一个虚拟的世界，对现实问题则不行。假如任由它错觉下去却是或许有个智能飞轮，但没人知道它会飞到那里去了。

（这个错觉缺陷在数据生成场合或许并不是真的缺陷）

https://www.arxiv-vanity.com/papers/2306.08302/

五、那AlphaGo为什么行？

由于AlphaGo正好规矩是清晰的，只需符合围棋规矩的任何测验都是实在的一部分。这时候“错觉”反却是有助于穷尽或许性。

上一篇：在许多贴近关闭场景的场合其实能够找到最优解，关键是鸿沟要切清楚

下一篇：朴实从技能视点看智能飞轮和常常说的算力、算法、数据三要素相关