生活工程体验信仰哲学精神
投稿投诉
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

一层卷积能做啥?BOE告诉你一层卷积可以做超分!

1月13日 心碎巷投稿
  作者丨Happy
  来源丨AIWalker
  编辑丨极市平台
  arXiv:https:arxiv。orgpdf2108。10335。pdf
  本文是京东方团队关于端侧超分的深度思考,以端侧设备超分为切入点,对经典上采样与深度学习超分之间的空白地带进行思考,提出了一类一层超分架构(脑洞真的太大了),并对所提方案与其他轻量型超分方案以及bicubic从不同角度进行了对比,同时也为未来端侧超分算法的设计提供了一个极具价值的参考点。Abstract
  经典的图像缩放(比如bicubic)可以视作一个卷积层一个上采样滤波器,它在所有显示设备与图像处理软件中是普遍存在的。
  在过去的十年里,深度学习技术已被成功应用到图像超分任务上,它们往往由多个卷积与大量滤波器构成。深度学习方法已成功占据了图像上采样任务的质量基准。深度学习方法能否在端侧设备(比如显示屏、平板电脑以及笔记本电脑)上取代经典上采样技术吗?一方面,随着能高效运行深度学习任务的硬件的迅速发展,AI芯片发展趋势呈现出了非常好的前景;另一方面,只有少数SR架构能够在端侧设备上实时处理非常小尺寸图像。
  我们对该问题的可能方案进行了探索以期弥补经典上采样与轻量深度学习超分之间的空白。作为从经典到深度学习上采样之间的过渡,我们提出了edgeSR(eSR):一层架构,它采用可解释机制进行图像上采样。当然,一层架构无法达到与深度学习方法的性能,但是,对于高速度需求来说,eSR具有更好的图像质量推理速度均衡。弥补经典与深度学习上采样之间的空白对于大量采用该技术非常重要。
  本文贡献包含以下几点:提出了几种一层架构以弥补经典与深度学习上采样之间的空白;在1185中深度学习架构中进行了穷举搜索,可参考上图,不同的架构具有不同的性能速度均衡。对一层自注意力架构进行了可解释分析,对自注意力机制提供了一种新的解释。
  上述结果可能会带来以下影响:图像超分系统有可能大量应用到端侧设备;对小网络的内部学习机制有更好的理解;对未来应用于研究了一个更好的性能耗时均衡参考。SuperResolutionforEdgeDevices
  Classical图像上采样与下采样指的是LR与HR之间的转换。最简单的下采样有pooling、downsample。downsample一半是在水平和垂直方向进行均匀的像素丢弃,这种处理会导致高频信息丢失,导致Alisaing问题。为解决该问题,经典的线性下采样首先采用antialiasing低通滤波器移除高频,然后再下采样。现有深度学习框架中采用strideconvolution实现。线性上采样则与之相反,下图给出了实现可视化图,即先上采样后滤波。
  由于引入过多零,造成大量的资源浪费,上图中的定义实现非常低效。本文提出了一种高效实现,见上图下部分,即先滤波再pixelshuffle。注:作者采用标准bicubi插值滤波器系数进行验证,两者具有完全相同的结果。
  Maxout本文提出的首个一层网络为edgeSRMaximum(eSRMAX),见下图。
  classedgeSRMAX(nn。Module):definit(self,C,k,s):super()。init()self。pixelshufflenn。PixelShuffle(s)self。filternn。Conv2d(1,ssC,k,1,(k1)2,biasFalse)defforward(self,x):returnself。pixelshuffle(self。filter(x))。max(dim1,keepdimTrue)〔0〕
  SelfAttention本文提出的第二个一层网络为edgeSRTemplateMatching(eSRTM)。下图给出了该方案的解释示意图,它利用了模板匹配的思想。
  classedgeSRTM(nn。Module):definit(self,C,k,s):super()。init()self。pixelshufflenn。PixelShuffle(s)self。softmaxnn。Softmax(dim1)self。filternn。Conv2d(1,2ssC,k,1,(k1)2,biasFalse)defforward(self,x):filteredself。pixelshuffle(self。filter(x)B,C,H,Wfiltered。shapefilteredfiltered。view(B,2,C,H,W)upscalingfiltered〔:,0〕matchingfiltered〔:,1〕returntorch。sum(upscalingself。softmax(matching),dim1,keepdimTrue)
  Transformer本文提出的第三种方案是edgeSRTRansformer(eSRTR),见下图,它采用了Transformer的自注意力机制,某种程度上时eSRTM的简化。
  classedgeSRTR(nn。Module):definit(self,C,k,s):self。pixelshufflenn。PixelShuffle(s)self。softmaxnn。Softmax(dim1)self。filternn。Conv2d(1,3ssC,k,1,(k1)2,biasFalse)defforward(self,x):filteredself。pixelshuffle(self。filter(x))B,C,H,Wfiltered。shapefilteredfiltered。view(B,3,C,H,W)valuefiltered〔:,0〕queryfiltered〔:,1〕keyfiltered〔:,2〕returntorch。sum(valueself。softmax(querykey),dim1,keepdimTrue)
  edgeSRCNN此外本文还提出了edgeSRCNN(eSRCNN),见上图c。下图给出了所提几种方案的算法实现。
  classedgeSRCNN(nn。Module):definit(self,C,D,S,s):super()。init()self。softmaxnn。Softmax(dim1)ifD0:self。filternn。Sequential(nn。Conv2d(D,S,3,1,1),nn。Tanh(),nn。Conv2d(S,2ssC,3,1,1,biasFalse),nn。PixelShuffle(s))else:self。filternn。Sequential(nn。Conv2d(1,D,5,1,2),nn。Tanh(),nn。Conv2d(D,S,3,1,1),nn。Tanh(),nn。Conv2d(S,2ssC,3,1,1,biasFalse),nn。PixelShuffle(s))defforward(self,input):filteredself。filter(input)B,C,H,Wfiltered。shapefilteredfiltered。view(B,2,C,H,W)upscalingfiltered〔:,0〕matchingfiltered〔:,1〕returntorch。sum(upscalingself。softmax(matching),dim1,keepdimTrue)
  DeepLearning作为对标,本文以FSRCNN、ESPCN为候选,结构见下图。两者的区别有两点:激活函数、上采样方式。
  Experiments
  上图所构建的1185超分模型池,训练数据采用General100与T91进行,模型的输入为1通道灰度图像。整个训练过程花费了两个月时间TeslaM40GPUX7。为测试最终模型,主要考虑了两种推理设备:NvidiaJetsonAGXXavier:Nvidia公司的嵌入式GPU设备,功耗30WRaspberryPi400:树莓派CPU处理器,功耗15Watt。
  测试过程中,每个模型的输出为14个FullHD图像,测试集源自DIV2K。推理过程采用FP16推理。图像质量评价则采用了Set5、Set14、BSDS100、Urban100以及Manga109等基准数据集。
  上图对比了不同方案的性能速度,以bicubic作为基准,从中可以看拿到:在端侧GPU设备上,所提edgeSR成功弥补了经典上采样与深度学习超分之间的空白,同时具有比bicubic上采样更好的速度质量均衡;在树莓派CPU设备上,edgeSR弥补了x2与x3倍率下的空白,但x4任务上bicubic上采样具有更佳的性能。深度学习方案更擅长于提升图像质量,如ESPCN在高质量范围具有最快速度;eSRCNN并未提升ESPCN质量,但提升了其速度;eSRMAX具有最快速度,但质量不稳定;eSRTM与eSRTR在中等速度质量方面具有最佳性能。
  上表给出了不同方案的性能,可以看到:eSR方案取得了最佳速度、最低功耗,同时具有比bicubic上采样更好的图像质量。
  上述两个图对eSRTM与eSRTR进行了可视化解释,从中可以看到:对于eSRTM而言,不同滤波器处理不同频率带;尽管滤波器不平滑,但具有一定程度的方向辨别能力;对于eSRTR而言,matching与上采样滤波器同样不平滑,但有一定的方向性。个人反思
  视频类lowlevel算法想落地到端侧,尤其是要求高分辨率实时推理时,难度真的非常大,谁做谁知道。性能好的模型,速度完全跟不上;但是要速度快吧,性能又不突出,视频lowlevel算法真的适合用AI吗?
  京东方的研究员脑洞实在太大了,不去关注性能,转而去关注bicubic插值与深度学习超分方案在性能速度均衡之间的那块空白区域,进而提出了脑洞更大的一层超分模型!一层能干啥?在看到该文之前,真是想都不敢想。
  就算是一层模型,京东方的研究员也是玩出了花样,又是Maxout,又是模板匹配、又是Transformer,真是大写的!
  比较可惜的是这篇文章并未开源,虽然复现很简单,但作为拿来主义的我,有训练好的谁还去重新训练呢,对吧。。。
投诉 评论 转载

腾讯业绩阴转晴视频号海外游戏抢眼将加码AI大模型3月22日,腾讯公司发布了2022年第四季度及全年财报。2022年第四季度,腾讯实现营收1449。5亿元,同比增长1,归属于公司权益持有人的净利润1062。7亿元,同比增长12……火箭骑士与爵士三队交易报价!火箭有意补强控卫,并将交易目标对准了骑士控卫加兰,加兰本赛季为骑士队出战了58场比赛,场均上场35分钟可以得到22分2。7篮板7。9助攻1。4抢断,加兰是骑士队内的助攻王。……旅行带186元去看祖国的大好河山偶尔的,你是否想着,来一张火车票,一台单反,一个背包,一本书,几首适合旅行听的歌曲,开始一个人的寻梦之旅。释放被困的心灵,挣脱束缚,带着这186元去这些景点旅游吧,去看看……皮相美和骨相美的女人,40岁后差距会越来越明显,你属于哪种?近几年在时尚圈当中出现了两个名词叫做皮相美和骨相美,也就是说你的脸部状态究竟是骨骼更为标准立体,还是皮相所衬托的高颜值呢?像娱乐圈当中就有不少的女明星,是骨相还是皮相的美……欧冠国际米兰VS波尔图,中前场伤6人,我为何还期待波尔图?昨天聊的欧冠焦点战,皇马再次宣告了自己在欧冠的统治力,落后两个的情况下,逆风翻盘连灌五个,以压倒性的优势取得了首回合的胜利,非常满意。今天两场欧冠焦点战,咱们长文章里先说说国米……送给自己的年终总结时光匆匆飞逝,2022年对自己总结一下,似乎只有失,得到的极少。人到中年,还是该有个积极奋斗的心态。年尾之际发表此文,希望2023年始终如一保持奋斗不止的高昂斗志。年初的……你想要的厂家都为你考虑到了,千元骨传导我更愿意选这款NANK对于喜欢在路路、徒步、骑行的时候听音乐的户外运动爱好者来说,骨传导相比真无线耳机更为合适。骨传导耳机对耳膜是无害的,这几年用户群的扩展也是越来越快,其中也包括一些需要长期打电话……湘当自觉自信自强桃花源景区文旅融合起航高质量发展中国山东网感知山东2月25日讯(记者刘锬)面临沅江,背倚群峰。距离常德市西南34公里,是东晋诗人陶渊明笔下芳草鲜美,落英缤纷,有良田、美池、桑竹之属的传颂,是《辞海》《辞源》释……一层卷积能做啥?BOE告诉你一层卷积可以做超分!作者丨Happy来源丨AIWalker编辑丨极市平台arXiv:https:arxiv。orgpdf2108。10335。pdf本文是京东方团队关于端侧……可背心,可长袖三款钩织的大花花,装扮咱们整个春天头条创作挑战赛第一款和第二款,排版图一致。第三款动感排版。依据排版图,你随心织成背心或者长袖。这三款都建议用中粗纯棉蕾丝钩织。应合春季需要。色泽搭配方面,姐妹们可以……行游华蓥山观雾文王婧文深冬,连日阴雨,蛰居室内。一早,推窗见雨住,便趁兴驱车入华蓥山深处,转山看景。行至华蓥山山脚下,摇下车窗,大口大口咀嚼着有质感的呼吸。远远还见不着山,就知道……多色食物多营养,吃出多彩年味来色、香、味、形是美食的四大要素在这四个要素中颜色排在首位不仅为了视觉美观其中也有健康道理看色知营养红色食物,如红豆、番茄、红苹果、红枣、草莓等,富含的番茄红素是自然……
日常生活中注意这点小细节,可以预防和改善便秘哦分享关于金铲铲之战的一点新手知识北京小众景点有哪些?这16个地方,轻松避开人群,感受老北京文随手一拍都是风景!来宝山街头,遇见热情明艳的紫薇立秋后,中老年人生活别太节俭,5种食物该吃就吃,千万别心疼钱每天在吃饭,但是你真的会吃吗?前女足球员离奇身亡!与友人在加拿大双双被枪杀,后者身家过亿青海魔鬼谷ampampamp三峡夏冰洞次数有限!奥尼尔职业生涯只被隔扣过3次,都有谁呢?早晨吃一个水煮鸡蛋,几个月后会有什么变化?建议肝不好的看看赵继伟被研究透了吗?战术地位不比郭艾伦差,双子星缺一不可台积电创办人张忠谋身价逾600亿!靠自己成为富一代背后秘辛黄山导游词锡纸烫适合什么发质发量少的你真的超合适菜鸟联盟为什么那么快?菜鸟联盟能送到农村吗懈怠的生活作文600字八一年肉赋能单亲妈妈,让我们的爱成为她前行的“源动力”高二写人作文我们还是孩子老人改善脑代谢的药物有哪些呢?乡镇文化站调研报告个性日系时尚扎发温柔大方不失女人味童年趣事小学优秀作文范文1点思绪

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找