给我1张图，生成30秒视频！DeepMind新作

精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

给我1张图，生成30秒视频！DeepMind新作

7月11日囍孤女投稿

　　编辑：Joey桃子
　　【新智元导读】近日，DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架Transframer。
　　AI又进阶了？
　　而且是一张图生成连贯30秒视频的那种。
　　emm。。。。这质量是不是有点太糊了
　　要知道这只是从单个图像（第一帧）生成的，而且没有任何显示的几何信息。
　　这是DeepMind最近提出的一种基于概率帧预测的图像建模和视觉任务的通用框架Transframer。
　　简单讲，就是用Transframer来预测任意帧的概率。
　　这些帧可以以一个或者多个带标注的上下文帧为条件，既可以是先前的视频帧、时间标记或者摄像机标记的视图场景。
　　Transframer架构
　　先来看看这个神奇的Transframer的架构是怎么运作的。
　　论文地址就贴在下面了，感兴趣的童鞋可以看看
　　https：arxiv。orgabs2203。09494
　　为了估计目标图像上的预测分布，我们需要一个能够生产多样化、高质量输出的表达生成模型。
　　尽管DCTransformer在单个图像域上的结果可以满足需求，但并非以我们需要的多图像文本集｛（In，an）｝n为条件。
　　因此，我们对DCTransformer进行了扩展，以启用图像和注释条件预测。
　　我们替换了DCTransformer的VisionTransformer风格的编码器，该编码器使用多帧UNet架构对单个DCT图像进行操作，用于处理一组带注释的帧以及部分隐藏的目标DCT图像。
　　下面看看Transframer架构是如何工作的。
　　（a）Transframer将DCT图像（a1和a2）以及部分隐藏的目标DCT图像（aT）和附加注释作为输入，由多帧UNet编码器处理。
　　接下来，UNet输出通过交叉注意力传递给DCTransformer解码器，该解码器则自动回归生成与目标图像的隐藏部分对应的DCTToken序列（绿色字母）。
　　（b）多帧UNetblock由NFNet卷积块、多帧自注意力块组成，它们在输入帧之间交换信息和Transformer式的残差MLP。
　　再来看看处理图像输入的MultiFrameUNet。
　　UNet的输入是由N个DCT帧和部分隐藏目标DCT帧组成的序列，注释信息以与每个输入帧相关联的向量的形式提供。
　　UNet的核心组件是一个计算块，它首先将一个共享的NFResNet卷积块应用于每个输入帧，然后应用一个Transformer样式的自我注意块来聚合跨帧的信息。（图2b）
　　NFResNet块由分组卷积和挤压和激发层组成，旨在提高TPU的性能。
　　下面，图（a）比较了RoboNet（128x128）和KITTI视频的绝对和残差DCT表征的稀疏性。
　　由于RoboNet由只有少数运动元素的静态视频组成，因此残差帧表征的稀疏性显著增加。
　　而KITTI视频通常具有移动摄像头，导致连续帧中几乎所有地方都存在差异。
　　但在这种情况下，稀疏性小带来的好处也随之弱化。
　　多视觉任务强者
　　通过一系列数据集和任务的测试，结果显示Transframer可以应用在多个广泛任务上。
　　其中就包括视频建模、新视图合成、语义分割、对象识别、深度估计、光流预测等等。
　　视频建模
　　通过Transframer在给定一系列输入视频帧的情况下预测下一帧。
　　研究人员分别在KITTI和RoboNet两个数据集上，训练了Transframer在视频生成上的性能如何。
　　对于KITTI，给定5个上下文帧和25采样帧，结果显示，Transframer模型在所有指标上的性能都有所提高，其中LPIPS和FVD的改进是最显而易见的。
　　在RoboNet上，研究人员给定2个上下文帧和10个采样帧，分别以64x64和128x128的分辨率进行训练，最终也取得了非常好的结果。
　　视图合成
　　在视图合成方面，研究者通过提供相机视图作为表1（第3行）中描述的上下文和目标注释，以及统一采样多个上下文视图，直到指定的最大值。
　　通过提供12个上下文视图，在ShapeNet基准上评估模型Transframer，明显优于PixelNeRF和SRN。
　　此外在数据集Objectron进行评估后，可以看出当给定单个输入视图时，模型会产生连贯的输出，但会遗漏一些特征，比如交叉的椅子腿。
　　当给出1个上下文视图，以128128分辨率合成的视图如下：
　　当再给出2个上下文视图，以128128分辨率合成的视图如下：
　　多视觉任务
　　不同的计算机视觉任务通常使用复杂的架构和损失函数来处理。
　　这里，研究人员在8个不同的任务和数据集上使用相同的损失函数联合训练了Transframer模型。
　　这8个任务分别是：单个图像的光流预测、对象分类、检测和分割、语义分割（在2个数据集上）、未来帧预测和深度估计。
　　结果显示，Transframer学会在完全不同的任务中生成不同的样本，在某些任务中，比如Cityscapes，该模型产生了质量上好的输出。
　　但是，在未来帧预测和边界框检测等任务上的模型输出质量参差不齐，这表明在此设置中建模更具挑战性。
　　参考资料：
　　https：sites。google。comviewtransframer

投诉评论转载

人像新标杆，全新vivoS17带给你无与伦比的新体验！热议聚 vivo在手机摄影方面一直是行业内高标准代表，在vivoS系列产品就可以看出来vivo在这方面下的功夫。市面上很少能找到一部外观颜值超高和旗舰摄影能力相结合的手机，但是让人惊喜……感恩的信作文热文聚热点网感恩的信作文妈妈：您好！感恩，是全世界的话题；中国有句古话“百善孝为先”，孝，是中华民族的传统美德。自古以来，就有许多孝顺的人从历史长河中被我们所熟知刘……给我1张图，生成30秒视频！DeepMind新作热议聚热点网编辑：Joey桃子【新智元导读】近日，DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架Transframer。AI又进阶了？而且是一张图……孩子高一数理化都不好，可孩子选科就选数理化怎么办？热博聚热点感谢您的邀请，教师老李会用心回答您的问题，供你参考。这位家长您是不懂？高一选课，数学是不参与选课的，所以无论数学成绩好与不好都得学。物理和化学是要进行选课的，如果孩子物理……传统销售和商业模式的优劣势分别在哪？热闻聚热点网销售和商业模式都是企业发展中非常重要的组成部分，但是它们的作用和影响范围是不同的。销售是企业获取收入的主要途径，它直接关系到企业的生存和发展。销售可以带来短期的收益和利润……上海易美口腔拔智齿究竟有什么风险热传聚热点网拔除阻生智齿的佳时机是16～18岁，因为此时智齿的牙根形成长度大约为正常牙根的三分之一，还没有完全形成，牙根较短，拔除比较容易，再加上处于此年龄阶段的病员的耐受力较好，愈合能力……OMG又在打窝子，再次让一追二击败FPX！WBG看好了，59 自从杭州亚运会中国电子竞技国家集训队，公布了英雄联盟亚运会的最终名单之后。不管这个名单怎么样，这六人基本上就是板上钉钉的事实了。与其在愤懑的贷款亚军，还不如外战时一致对外。也许……最便宜的国产轿车有哪些？热议聚热点网最便宜的国产轿车是比亚迪F32020款比亚迪F3新款经典版指导价4。49万且有小幅优惠，目前实际价格在4万级且符合国6标准的轿车仅此一台，而且这台车也是最便宜的三厢轿车，要求“……对于新疆美食你了解多少？热议聚热点网哇塞！提起新疆的美食我的口水就要流出来了，不怕您见效，我对新疆的美食可是情有独钟，无论是拉条子、拌面、羊肉串、还是大盘鸡、烤包子、馕饼、酥油茶一时半会我还真的说不完，这一切都是……现代和丰田汽车涉嫌虚假宣传，其广告在英国被禁止投放热评聚热点近日，英国广告监管机构广告标准局（ASA）接到英国消费者的两份投诉，其投诉对象为丰田汽车和现代汽车两家制造商，投诉内容为虚假宣传。而在受理案件之后，ASA展开了事件调查，……广州TTG又出事了，TTG总经理发文道歉！忆安巅峰赛撞车五名 KPL转会期已经结束了，目前转会成功的选手都已经陆续抵达新战队，如果要评选本届转会期讨论度最高的队伍，除了本身就拥有极高人气的AG超玩会战队外，就要数广州TTG战队了。其实，本……“励志的尽头是璀璨王志刚个人发布会暨书法公益拍卖会”洋河梦之近日，由洋河梦之蓝品牌冠名的海南著名肖像摄影家、励志偶像王志刚先生“励志的尽头是璀璨个人发布会暨书法公益拍卖会”签约仪式在三亚举行。洋河股份海南事业部刘远航总经理和著名摄……

<<<<<<－>>>>>>

罗志祥的行为和马蓉的行为哪个更无耻呢？热议聚热点网 STM车间热文聚热点网大魔王逆境翻盘拿下大比分优势，第五人格总决赛还带这么玩热评聚拆解十亿流量与销量的底层“爆品逻辑”热闻聚热点网印尼雅万高铁联调联试时速达到350公里热博聚热点网传奇人物周兴和五十五岁时做父亲热传聚热点网罢黜百家，独尊儒术热传聚热点网【歌词】腓立比书1：20歌手：活水热文聚热点网麻油鸡丝的做法麻油鸡丝怎么做热传聚热点网这些新兴国家多类商品的需求快速增长，出口商快收藏起来！热闻聚并不罕见的“罕见病人”热文聚热点网《黑神话：悟空》8月20日将开启首次线下试玩活动热文聚热点网

精华四年级春天的田野作文300字锦集10篇奔腾年代冬妮娅是谁？冬妮娅和常汉卿什么关系？最温暖的时刻做小月子腰疼是怎么回事呢 LOL中后期能和剑圣掰手腕的ADC有哪些？曾国藩的正面与侧面读书笔记4 蜂蜜生姜红茶的做法柴米油盐酱醋茶，也是有良效的中药三伏贴可以治月子病吗三伏贴是治月子病的有效途径渭水流日夜散文吃剩的蔬果有可以干嘛这些小妙招分享给大家带你读诗仰望天空

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找新乡渭南铜川松江山南雅安松原荃湾淮北昭通平凉鞍山赤峰苗栗保亭池州渝北株洲陇南濮阳三沙秀山密云鸡西