生活工程体验信仰哲学精神
投稿投诉
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

兼具CNNTransformer优势,灵活使用归纳偏置,Fa

5月5日 蚀肉堂投稿
  机器之心报道
  编辑:小舟、陈萍
  归纳偏置强大但需要灵活使用,来自Facebook的研究者提出了一种ConViT模型,使用soft卷积归纳偏置进行初始化,模型可以在必要时学会忽略这些偏置。
  AI研究人员在构建新的机器学习模型和训练范式时,通常会使用一组被称为归纳偏置(inductivebiases)的特定假设,来帮助模型从更少的数据中学到更通用的解决方案。近十年来,深度学习的巨大成功在一定程度上归功于强大的归纳偏置,基于其卷积架构已被证实在视觉任务上非常成功,它们的hard归纳偏置使得样本高效学习成为可能,但代价是可能会降低性能上限。而视觉Transformer(如ViT)依赖于更加灵活的自注意力层,最近在一些图像分类任务上性能已经超过了CNN,但ViT对样本的需求量更大。
  来自Facebook的研究者提出了一种名为ConViT的新计算机视觉模型,它结合了两种广泛使用的AI架构卷积神经网络(CNN)和Transformer,该模型取长补短,克服了CNN和Transformer本身的一些局限性。同时,借助这两种架构的优势,这种基于视觉Transformer的模型可以胜过现有架构,尤其是在小数据的情况下,同时在大数据的情况下也能实现类似的优秀性能。
  论文地址:https:arxiv。orgpdf2103。10697。pdfGitHub地址:https:github。comfacebookresearchconvit
  在视觉任务上非常成功的CNN依赖于架构本身内置的两个归纳偏置:局部相关性:邻近的像素是相关的;权重共享:图像的不同部分应该以相同的方式处理,无论它们的绝对位置如何。
  相比之下,基于自注意力机制的视觉模型(如DeiT和DETR)最小化了归纳偏置。当在大数据集上进行训练时,这些模型的性能已经可以媲美甚至超过CNN。但在小数据集上训练时,它们往往很难学习有意义的表征。
  这就存在一种取舍权衡:CNN强大的归纳偏置使得即使使用非常少的数据也能实现高性能,但当存在大量数据时,这些归纳偏置就可能会限制模型。相比之下,Transformer具有最小的归纳偏置,这说明在小数据设置下是存在限制的,但同时这种灵活性让Transformer在大数据上性能优于CNN。
  为此,Facebook提出的ConViT模型使用soft卷积归纳偏置进行初始化,模型可以在必要时学会忽略这些偏置。
  soft归纳偏置可以帮助模型不受限制地学习。hard归纳偏置,例如CNN的架构约束,可以极大地提高学习的样本效率,但当数据集大小不确定时可能就会成为约束。ConViT中的soft归纳偏置能够在不需要时被忽略,以避免模型受到约束限制。
  ConViT工作原理
  ConViT在visionTransformer的基础上进行了调整,以利用soft卷积归纳偏置,从而激励网络进行卷积操作。同时最重要的是,ConViT允许模型自行决定是否要保持卷积。为了利用这种soft归纳偏置,研究者引入了一种称为门控位置自注意力(gatedpositionalselfattention,GPSA)的位置自注意力形式,其模型学习门控参数lambda,该参数用于平衡基于内容的自注意力和卷积初始化位置自注意力。
  如上图所示,ConViT(左)在ViT的基础上,将一些自注意力(SA)层用门控位置自注意力层(GPSA,右)替代。因为GPSA层涉及位置信息,因此在最后一个GPSA层之后,类token会与隐藏表征联系到一起。
  有了GPSA层加持,ConViT的性能优于Facebook去年提出的DeiT模型。例如,ConViTS性能略优于DeiTB(对比结果为82。2vs。81。8),而ConViTS使用的参数量只有DeiTB的一半左右(48Mvs86M)。而ConViT最大的改进是在有限的数据范围内,soft卷积归纳偏置发挥了重要作用。例如,仅使用5的训练数据时,ConViT的性能明显优于DeiT(对比结果为47。8vs。34。8)。
  此外,ConViT在样本效率和参数效率方面也都优于DeiT。如上图所示,左图为ConViTS与DeiTS的样本效率对比结果,这两个模型是在相同的超参数,且都是在ImageNet1k的子集上训练完成的。图中绿色折线是ConViT相对于DeiT的提升。研究者还在ImageNet1k上比较了ConViT模型与其他ViT以及CNN的top1准确率,如上右图所示。
  除了ConViT的性能优势外,门控参数提供了一种简单的方法来理解模型训练后每一层的卷积程度。查看所有层,研究者发现ConViT在训练过程中对卷积位置注意力的关注逐渐减少。对于靠后的层,门控参数最终会收敛到接近0,这表明卷积归纳偏置实际上被忽略了。然而,对于起始层来说,许多注意力头保持较高的门控值,这表明该网络利用早期层的卷积归纳偏置来辅助训练。
  上图展示了DeiT(b)及ConViT(c)注意力图的几个例子。()表示可学习的门控参数。接近1的值表示使用了卷积初始化,而接近0的值表示只使用了基于内容的注意力。注意,早期的ConViT层部分地维护了卷积初始化,而后面的层则完全基于内容。
  测试是在ImageNet1K上进行的,没有进行知识蒸馏,结果如下:
  AI模型的性能在很大程度上取决于训练这些模型所用的数据类型和数据规模。在学术研究和现实应用中,模型经常受到可用数据的限制。ConViT提出的这种soft归纳偏置,在适当的时候能够被忽略,这种创造性的想法让构建更灵活的人工智能系统前进了一步。
投诉 评论 转载

兼具CNNTransformer优势,灵活使用归纳偏置,Fa机器之心报道编辑:小舟、陈萍归纳偏置强大但需要灵活使用,来自Facebook的研究者提出了一种ConViT模型,使用soft卷积归纳偏置进行初始化,模型可以在必要时……田姓女孩诗词取名带解释其实通过诗词来取名并不难,大家要是有兴趣的话不妨做个简单的了解,很快就能学会。吾爱诗经网已经把合适的姓名选项都整理好了,包括每个名字的意思,还有出处都有说明。其实起名是一件非常……饿的时候胃疼是怎么回事饿的时候千万不能吃不然山楂柿子和黑枣等食品中含有丰富的鞣酸和果胶,在胃酸的作用下与蛋白质结合生成一些不溶于水的沉淀物,会变成结石,对胃部造成伤害。对于患有胃病,如胃炎、胃溃疡的人,本来就胃酸分……直接移民火星是不可能的,只能改造它这样子,这种生物是合适选择第二次世界大战结束之后,世界迎来了短暂的和平时期,多个参与大战的国家亟需休养生息。然而二战过去还不到二十年,由美国和苏联挑起的冷战开始了。好在这次冷战双方阵营并没有以战争的形式……就够了造句用就够了造句大全151、有裂痕的盘子无法恢复原状,不过只要还能用,维持现状就够了。赤司征十郎152、快乐很简单,只是在你很饿的时候恰好有吃的,而还恰好是你爱吃的,这就够了。每一个小小的期……女生自慰要怎样戒除现在很多的大学女学生,没有找对象的,但是却又有生理需求,所以就会自己选择自慰,只是自慰不能一辈子吧,所以要想办法戒除自己的自慰习惯,下面我们就来看看女生自慰要怎样戒除?下面就一……不打不相识的故事中国古典小说《水浒全传》中有这样一段故事:宋江因犯案被发配到江州,遇到早就想结识他的戴宗。于是两人一起进城,在一家酒店里喝酒。才饮得两三杯,又遇到李逵后来,三人又到江边的琵琶亭……大手笔!2。6万平淄博会展中心空气源热泵项目火速完工并运行衡量一个项目是否优异,一要看产品品质,二要看工程进度,最后还要看运行效果。近期,由中广欧特斯精品打造的山东淄博会展中心空气源热泵项目,在高强度、高难度等施工环境下,仅用2……堆砌造句用堆砌造句大全(91)枪林箭雨,白刃横空,数万人舍死忘生的呐喊,整个杀戮战场一片沸腾,但叛军冲至城墙再寸进半步都是用无穷的鲜血和死尸来堆砌。(92)两岸之山如刀切斧砍一般,山体上各种鬼……马桶一般用几年更换马桶什么情况下要更换我们都知道,马桶是比较常见的一种卫生间用品,很多人家里面都会装马桶。马桶的使用也是有一定讲究的,尤其是马桶的使用时间。马桶使用到一定年限就需要更换,那么马桶一般用多久要更换呢?……皮制造句用皮制造句大全61,5片桨叶的半刚性铰接式旋翼,桨叶用碳纤维缠绕梁和蜂窝复合材料夹层结构蒙皮制成,前缘附有钛防蚀带,后缘有金属调整片,桨叶采用新翼型,可以提高后行桨叶的升力。62,这些……跑鞋需要稳定性吗HOKAONEONEROCKETX相比几年前的黑马姿态,HOKAONEONE现在已经不再是什么运动品牌的新兴力量。在欧美市场,HOKAONEONE在专业跑鞋领域已经站稳脚跟,而在国内,也有越来越多的跑者对这双飞……
原创PHP实战PDO优化及SQL注入疯狂的槟榔世卫组织认定为1类致癌物,为何大部分人仍在嚼?探索太空的能力基本取决火箭推力,世界上正研制的火箭有哪些?科学是万能的吗?并不是,这些现象科学就无法解释曾垄断中国市场的美企,今却暗淡退出,终于被国产替代国产SRAM芯片EMI502NL16VM可替换IS61WV1如何为系统选择合适的NANDFLASH芯片的保护神检测设备相对论意义的黑洞不存在男性为什么比女性高?答案简单,但生物学家或许弄错了几十年ampampquot奇妙的大自然ampampquot你知道吗宇航员生病了怎么办?探索太空从来都不简单幻塔前车之鉴,原神不送自选五星才是正常操作?真送才说明有问题浅秋的味道最普通的婚姻,却藏着最美好的爱情老婆怀孕如何解决性欲过高90的人都分不清气虚血虚阴虚阳虚?看完这篇文章就懂啦!关于生命的议论文3篇零件测量与质量控制技术微课教学的应用分析与实践种食物最伤大脑我的同桌宁山在哪里(十渡去哪个景区最好)你让我好好想想制作动态效果的后台导航栏左侧导航

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找