苹果M1徒有其表？地表最强芯只能剪视频引知乎热议

精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

苹果M1徒有其表？地表最强芯只能剪视频引知乎热议

10月18日辞凤阙投稿

　　来源：网络
　　编辑：好困小咸鱼【新智元导读】5nm工艺，570亿晶体管，70CPU性能提升，4倍GPU性能提升。号称史上最强芯片的M1Max，只能剪剪视频？
　　最近，苹果开了一个芯片新品发布会。
　　光看参数，M1Pro和M1Max两款芯片确实太顶了！
　　M1Pro，晶体管面积达到245mm，内置337亿个晶体管，是M1的2倍多。
　　而M1Max更夸张，搭载570亿个晶体管，比Pro还要大70，芯片面积达到432mm。
　　M1Pro和M1Max均采用大小核设计，最多10个核心，包括8个高性能内核和2个高效内核，CPU的性能直接比前代M1芯片提升70。
　　GPU方面，M1Pro采用最多16个核心，性能比M1芯片的GPU高出两倍。
　　而M1Max一举将GPU的核心数量干到32个，算力可以达到恐怖的10。4TFLOPs，比M1的GPU还要再快4倍！
　　10TFLOPs，这个数字有点熟悉啊？
　　对GPU性能敏感的朋友可能联想到了，空气显卡公司Nvidia的RTX2080给出的GPU参考性能也是这个数字。
　　M1
　　M1Pro
　　M1Pro
　　M1Max
　　M1Max
　　GPU核心数
　　8hr14hr16hr24hr32hrTeraflops
　　2。6
　　4。5
　　5。2
　　7。8
　　10。4
　　AMDGPURX560
　　（2。6TF）RX5500M
　　（4。6TF）RX5500
　　（5。2TF）RX5700M
　　（7。9TF）RXVega56
　　（10。5TF）
　　NvidiaGPUGTX1650
　　（2。9TF）GTX1650Super
　　（4。4TF）
　　RTX305075W（4。4TFGTX1660Ti
　　（5。4TF）RTX2070
　　（7。4TF）RTX2080
　　（10TF）
　　RTX306080W（10。94TF）
　　现在深度学习这么火，要不让M1系列的芯片和RTX2080比试比试？
　　M1VS2080Ti
　　提到深度学习框架无非就是TensorFlow和PyTorch。
　　然而，这俩一直以来都只支持在NVIDIA的GPU上使用CUDA加速。而苹果用户只能在CPU上慢慢跑。
　　不过，苹果在2020年11月推出了采用M1芯片的Mac之后，很快，TensorFlow也出了2。4版本更新，支持在M1的GPU上训练神经网络。
　　https：machinelearning。apple。comupdatesmlcomputetrainingonmac
　　TensorFlow2。4的tensorflowmacos利用MLCompute，使机器学习库不仅能充分利用CPU，还能充分利用M1和英特尔驱动的Mac中的GPU，大幅提高训练性能。
　　说得这么nice，到底怎么样，还是要实践才知道。
　　鉴于搭载M1Pro和M1Max的最新款MacbookPro还未开售，就先用他们的小弟M1代替他们出场吧。M1的GPU最高可以跑到2。6TFLOPs，差不多是NvidiaRTX2080独显的四分之一。
　　先在fashionMNIST数据集上，训练一个小的三层全连接网络试试。
　　importlibrariesimporttensorflowastfimporttimedownloadfashionmnistdatasetfashionmnisttf。keras。datasets。fashionmnist（trainimages，trainlabels），（testimages，testlabels）fashionmnist。loaddata（）trainsetcountlen（trainlabels）testsetcountlen（testlabels）setupstarttimet0time。time（）normalizeimagestrainimagestrainimages255。0testimagestestimages255。0createMLmodelmodeltf。keras。Sequential（〔tf。keras。layers。Flatten（inputshape（28，28）），tf。keras。layers。Dense（128，activationrelu），tf。keras。layers。Dense（10）〕）compileMLmodelmodel。compile（optimizeradam，losstf。keras。losses。SparseCategoricalCrossentropy（fromlogitsTrue），metrics〔accuracy〕）trainMLmodelmodel。fit（trainimages，trainlabels，epochs10）evaluateMLmodelontestsettestloss，testaccmodel。evaluate（testimages，testlabels，verbose2）setupstoptimet1time。time（）totaltimet1t0printresultsprint（）print（fTrainingsetcontained｛trainsetcount｝images）print（fTestingsetcontained｛testsetcount｝images）print（fModelachieved｛testacc：。2f｝testingaccuracy）print（fTrainingandtestingtook｛totaltime：。2f｝seconds）
　　测试开始，先在一台搭载Inteli79700K，拥有32GB内存，以及一张NvidiaRTX2080Ti独立显卡的Linux系统电脑上运行上面的代码。
　　很快，就得到了结果：训练和测试花了7。78秒。
　　接着，用搭载M1处理器（8个CPU核心，8个GPU核心，16个神经引擎核心）和8GB内存的MacMini训练模型。
　　结果非常amazing啊！
　　训练和测试仅仅耗时6。70秒，比RTX2080Ti的GPU还要快14！这就有点厉害了。
　　但说实话，fashionMNIST分类这种任务有点过于简单了，如果想在更大的数据集上，训练更强大的模型呢？
　　所以，得给它们来点更难的任务，分别用M1和RTX2080Ti在Cifar10数据集上训练一个常用的ResNet50分类模型如何？
　　importlibrariesimporttensorflowastffromtimeimportperfcounterdownloadcifar10datasetcifar10tf。keras。datasets。cifar10（trainimages，trainlabels），（testimages，testlabels）cifar10。loaddata（）trainsetcountlen（trainlabels）testsetcountlen（testlabels）setupstarttimet1startperfcounter（）normalizeimagestrainimagestrainimages255。0testimagestestimages255。0createMLmodelusingtensorflowprovidedResNet50model，notethe〔32，32，3〕shapebecausethatstheshapeofcifarmodeltf。keras。applications。ResNet50（includetopTrue，weightsNone，inputtensorNone，inputshape（32，32，3），poolingNone，classes10）CIFAR10labelshaveoneintegerforeachimage（between0and10）Wewanttoperformacrossentropywhichrequiresaonehotencodedversione。g：〔0。0，0。0，1。0，0。0，0。0。。。〕trainlabelstf。onehot（trainlabels。reshape（1），depth10，axis1）Dothesamethingforthetestlabelstestlabelstf。onehot（testlabels。reshape（1），depth10，axis1）compileMLmodel，usenonsparseversionherebecausethereisnosparsedata。model。compile（optimizeradam，losstf。keras。losses。CategoricalCrossentropy（），metrics〔accuracy〕）trainMLmodelmodel。fit（trainimages，trainlabels，epochs10）evaluateMLmodelontestsettestloss，testaccmodel。evaluate（testimages，testlabels，verbose2）setupstoptimet1stopperfcounter（）totaltimet1stopt1startprintresultsprint（）print（fTrainingsetcontained｛trainsetcount｝images）print（fTestingsetcontained｛testsetcount｝images）print（fModelachieved｛testacc：。2f｝testingaccuracy）print（fTrainingandtestingtook｛totaltime：。2f｝seconds）
　　测试再次开始，在RTX2080Ti运行新代码，表现非常不错。
　　训练了10个epoch，训练和测试共耗时418。73秒，GPU的利用率在65和75之间波动。
　　接下来，在M1MacMini上运行新代码。
　　看上去有点拉胯啊，M1MacMini训练和测试总耗时2286。16秒，是RTX2080TiGPU耗时的5。46倍。
　　理论上讲，M1的GPU性能是RTX2080TiGPU的3。84分之一，这么看，其实际性能还是略有欠缺。
　　通过Mac的活动监视器也能看到，CPU的使用率确实较低，GPU几乎没有怎么使用，看来还是Tensorflow对M1硬件资源的调度优化得不够好。
　　不过，最近，Tensorflow放出了对M1MetalGPU插件支持。
　　https：developer。apple。commetaltensorflowplugin
　　还给出了安装指导教程，感兴趣的朋友可以尝尝鲜（需安装TensorFlowv2。5或v2。6）。
　　友情提示，先看看TensorFlowmacOSGitHub仓库的issue的数量，劝退不
　　这么来看，M1确实可以训练深度学习模型，实际性能也勉强能用。
　　要是换上那个4倍加成的M1Max没准还真能和RTX2080TiGPU碰一碰。
　　但是还是那个问题：能用不代表好用。
　　为啥评测只有剪视频
　　M1一直以来都有一个被诟病的地方：生态不行。
　　推特上有大神留言：M1确实能用于数据科学，但恐怕你得花一个通宵装配置才能用。
　　其实，不仅仅是机器学习，很多大型游戏和工业软件目前都不兼容苹果的M1系列芯片。
　　在知乎上，就有人提出了质疑：为什么在宣传苹果的M1芯片的性能时，总是以视频剪辑为例呢？
　　排第一的回答就说得很有道理：他们惊叹M1的强大的时候，自然用自己最顺手的方式来说明M1强大。看起来是清一色的用视频来验证M1的强大，其实只是他们的声音大罢了。
　　而且，看完刚才那段用M1跑机器学习的体验，这个问题其实也就不难回答了。
　　写个文：用不着；
　　编个程：不会用。
　　当然，也有非专职博主做过Spring性能的测试，在转译模式下跑Java，性能也很不错。特别是对小内存的优化，以及几乎无敌的不发热和没噪声。
　　不过对于这一点，有网友表示：软件开发在Mac上是劣势，在M1上更是劣势中的劣势。
　　那这么看来，在生产力里面，可能也就只有视频既能体现出性能强劲，又方便好做了。
　　然而，网友吐槽说：M1也就用来剪点小片子玩玩还行了。
　　除此以外也一大堆插件只支持Intel，甚至连Mac都没有。
　　游戏呢，一直都不是Mac的重点，这次苹果就更直接了，一句都没提。以前好歹还放一个狂野飙车9呢。
　　既然苹果的态度都这么明显了，何必非要用MAC去自己折磨自己呢。
　　有网友就表示：既然我有钱16199买mbp，我自然也有windows主机。
　　挖矿这事吧，不提倡，而且就M1的表现来说，非常拉垮。不知道M1Max能不能一雪前耻。
　　话说回来，最常用的生产力难道不是word、ppt、keynote这些么，买一个M1的MacBook，续航长，屏幕好，速度快还便宜，多香。
　　参考资料：
　　文中引用了青空，HateLetter等人的回答，具体参见：
　　https：www。zhihu。comquestion460373656
　　https：www。zhihu。comquestion493188474
　　https：www。zhihu。comquestion493188575
　　https：appleinsider。comarticles211019m1proandm1maxgpuperformanceversusnvidiaandamd
　　https：developer。apple。commetaltensorflowplugin
　　https：medium。comanalyticsvidhyam1macminiscoreshigherthanmynvidiartx2080tiintensorflowspeedtest9f3db2b02d74
　　https：twitter。comtheshawwnstatus1449930512630525956？s21

投诉评论转载

中消协点名视频平台，不应该向VIP用户收取超前点播近期，视频平台的有关VIP服务和超前点播的机制引发了不少网友的不满，网站在已经购买了VIP的基础上再次收费，引起了消费者的不满。前段时间，腾讯视频就这个问题已经表示将要整改，将……巡回检查组冯森难以自证清白，以米振东为首的犯罪团伙曝光关于宋丽敏被杀，冯森一直坚称宋丽敏属于自杀，但自己没有打开执法记录仪，且拒绝提供执法记录仪。冯森要求再给48小时时间案，张友成决定48小时后对冯森按照销毁证据罪处理。话说……章子怡郑爽走下坡路墙倒众人推粉红色的乔治：章子怡因为《上阳赋》扮嫩、眼神空洞被群嘲，当然我也写文批判过章子怡，但仅限于对她在《上阳赋》中差强人意的演技的批评，不涉及其他。但是最近网上呈现出一窝……续写一生一世，周生辰护妻，低调间尽显霸气，她才是他的唯一周生辰与时宜之间的感情不需要再强调，但是总有人不识趣想挑战。周生辰虽然在时宜面前偶有羞萌，但。。。他是大佬啊，怎么可能真的羞萌呢？01hr被围观的周生辰第六十一集：……蔡徐坤专辑惹争议，已售8000万才出5首，新上线歌曲竟还有纯文紫依顶流蔡徐坤最近又惹非议了，或成为下一个饭圈典型案例。最近饭圈的一系列大动作整改，娱乐圈里几乎人人自危。热搜榜肉眼可见的，几乎是一片岁月静好，鲜少有娱乐新……苹果M1徒有其表？地表最强芯只能剪视频引知乎热议来源：网络编辑：好困小咸鱼【新智元导读】5nm工艺，570亿晶体管，70CPU性能提升，4倍GPU性能提升。号称史上最强芯片的M1Max，只能剪剪视频？最近，苹果开……峰爆视觉挺震撼，朱一龙有突破！但剧情细节经不起推敲这部电影刚开始看的时候，感觉挺震撼的，爆破、透水、地震、山体滑坡、火车脱轨灾难大片既视感。再加上主角朱一龙、黄志忠，配角张国立、张译、乔振宇、陈数、白客、乔欣等全明星阵容……剧本小钦带女朋友回家时间：暑假场景：大草原（草坪也行）人物：小钦，小米，班主任内容时长：60～90秒旁白：小钦是内蒙古人，大三暑假带女朋友小米回老家见父母。画面：小钦……年过半百的许晴，20岁的身材，22岁的公主心你看照片的女生是谁？这么好的身材，你能相信这是在外夜跑的52岁的许晴吗？这身材，这状态，这肤色只能说简直绝了，真的难以想象，可这就是事实。自幼是公主，长大至今仍是公……姐姐又下凡，孙艺珍有望出演三十九，没有男主角会比玄彬帅更新一下孙艺珍的消息，仙女的半个脚就要飘然落地了。她要再度下凡，粉丝们期盼已久的新剧，孙艺珍姐姐则是贴心地送来了好消息。积极讨论中的电视剧《三十九》似乎十拿九稳就将……变形金刚，时隔30年，成为了美国人对自己的自嘲上世纪80年代，人们的精神生活还比较匮乏，尤其处于成长期的孩子们，除了打打闹闹，弹弹球，做做游戏，感觉不到别的乐趣。好在随着电视文化的兴起，人们的平淡生活得到了调剂。虽然……中古远古史栗陆氏历史在继续，今天是连载的第19篇文章。上一篇我们讲到了中央氏的政权，今天我们主要讲一下栗陆氏的政权。栗陆氏，风姓，是大伏羲氏族风姓的一个分支，主要活动在今黄河以南开……

<<<<<<－>>>>>>

2000年赵丽蓉去世，经历两度丧夫女儿夭折，她如何活成喜剧女 1989年书法杂志刊登的书法作品真震撼，传统根基深厚戚冠军黄飞鸿嫡传弟子，曾被周星驰邀请出演功夫，71岁满身肌肉十年后再看画皮细节令人着迷，情爱纠葛，再刷三遍也不够扫黑风暴徐英子火了，早期言论被扒，高情商获网友认可张碧晨我不是小三，不要名分为华晨宇产子，又得到了什么？女儿们的恋爱3张豆豆被浪漫击中，金莎在演偶像剧，金晨最清醒名模吕燕在时尚圈17年，转型当设计师，告诉人们美不光是看脸蛋大学录取通知书有哪些作用？过来人说出了答案，别遗失了看图悟道之鸿雁队形搏击主席怒怼向佐打假拳碰到我你就惨了，但给向华强和发哥面子 2007年，袁泉夏雨复合后，高圆圆为何背上8年的插足骂名？岁布依族老中医讲述减肥秘方瘦得太快让小学计算机课堂充满活力原来我做不到周璇日记（周璇长子周民为什么要公开周璇日记？）借车借出4条人命！车主已崩溃，有车没车都看看！习大大此时访中东，谈的不止是经济南京做人流多少钱（南京医院做人流比较好的医院）家长怎样塑造孩子的性格公司放假通知公司法监事的相关规定是什么元宇宙房产需要研发技术而非传统的房产开发能力元宇宙建房子前男友放不下你的说说

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找