因为智能的发展轨迹,如果你回顾进化史,它的最终目的是让动物和人类能够在世界中自由移动、互动,进而创造文明,甚至是做一片三明治。因此,将这种 的本质转化为技术,是释放无数潜在应用的关键,即便有些看起来只是表面上的进步。 我认为这是一个非常微妙却至关重要的观点。或许我们可以通过谈论一些应用场景来进一步深入讨论。
当我们谈论
开发一种可以实现空间智能的 西班牙邮件列表 技术模型时,它可能具体是什么样子的?有哪些潜在的应用场景? 我们设想的空间智能模型可以做很多事情,其中一个让我特别兴奋的是“世界生成”。类似于文本-图像生成器,我们现在已经有了文本-视频生成器——输入一张图像或
段视频
系统就能生成一个两秒钟的惊人片段。但我认为 运营管理中的技术集成:简化流程,提高效率 我们可以将这一体验提升到 3D 世界。 我们可以想象空间智能未来帮助我们将这些体验提升到 ,不仅仅生成一张图片或一段视频,而是生成一个完整的、模拟的、丰富的互动 世界。也许用于游戏,也许用于虚拟摄影,应用领域广泛得令人难以想象。 我觉得这项技术会随着时间的推移逐渐进步。构建这些东西非常困难,所以静态问题可能会相对简单一些,但从长远来看,我们希望它是完全动态的、可交互的,正如你刚才所描述的一切。 是的,这正是空间智能的定义。我们会从更多的静态问题开始
但你提到的所有
内容都在空间智能的未来规划中。 这也体现在 AFB 目录 我们公司 ”的名字上——这个名字的含义是关于构建和理解世界。起初我们告诉别人这个名字时,他们并不总是能理解,因为在计算机视觉、重建和生成领域,我们通常会对所能做的事情进行区分。第一级是识别物体,比如麦克风、椅子等这些世界上的离散物体。许多 ImageNet 的工作都与识别物体有关。 但接下来我们提升到了场景的层次——场景是由物体组成的。例如,现在我们有一个录音室,里面有桌子、麦克风和坐在椅子上的人,这是物体的组合。但我们想