RTFM,一个由World Labs开发的新型生成互动世界模型,可以从单张图像生成实时视频,以探索3D世界。 该模型在大规模视频数据上进行训练,以预测下一个帧。通过空间记忆实现无限持久性。 试试吧: