全新的——智能手机出现了,这些手机有相机,有新的传感器,并且可以在 世界中定位。这不仅仅是你从互联网上获取一堆像素并试图判断这是一只猫还是一只狗的问题了。 我们希望把这些图像当作与物理世界的通用传感器,帮助我们理解世界的 结 和构,无论是在物理空间还是生成空间中。 博士毕业后,我做了一个很大的转变,进入了 计算机视觉领域
与我的同事们
一起研究如何预测物体的 形状。后来,我对通过 台湾邮箱列表 数据学习 结构的想法产生了浓厚的兴趣。 我们讨论数据时常会提到,获取 数据很难,但实际上 图像是 世界的投影,这里有很多可以利用的数学结构。即便你有大量的 数据,你也可以通过这些数学结构推导出 世界的结构。 年是一个突破性时刻。我们的共同创始人 提出了 (神经辐射场)方法。
这是一种非常
简单、清晰的方式,可以通过 观测推导 我们将详细探讨印 出 结构,点燃了整 计算机视觉领域。 与此同时,始崭露头角。很多语言建模的工作实际上在学术界已经发展了很长时间。即使在我的博士阶段,我也与在 年进行了一些语言建模工作。 这其实是出现在 之前的事情,但到了 – 的时代,你在学术界已经很难再做这样的模型了,因为它们需要的计算资源太大了。然而,有趣的是 提出
的 Nerf 方法
只需要在单个 U 上训练几个小时。 这让很 AFB 目录 多学术研究者开始重新聚焦于这些问题,因为可以在有限的计算资源下解决一些核心算法问题,而且你可以在单个 上获得最先进的成果。所以当时很多学术研究者都在思考:我们如何通过核心算法来推动这个领域的发展?我和 聊了很多,我们都非常确信这一点。 是的,我们发现我们的研究方向在某种程度上正朝着相似的目标前进。我还想 一个很有趣