生活工程体验信仰哲学精神
投稿投诉
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

美国计划禁止云计算厂商为中国训练AI大模型,我的一点看法热文

6月10日 倾城傷投稿
  美国商务部长吉娜雷蒙多(GinaRaimondo)在2024年1月26日接受路透采访时宣布了限制外国客户、尤其是中国客户使用美国云计算厂商的服务训练AI大模型的计划。雷蒙多的原话是:“我们不能允许中国或者其他我们不希望的玩家使用我们的云服务训练他们的模型。我们引入了芯片出口禁令,但那些芯片正在被美国的云计算数据中心使用,所以我们需要考虑关闭这些渠道,以避免潜在的恶意行为。”(注:原文可参见1月27日的路透社电讯)
  毫无疑问,上述举措把美国对华科技制裁推到了一个新的高度,对中国人工智能产业的潜在破坏力很大。虽然我不是芯片或人工智能方面的专家,但幸运的是,我在这些产业有很多朋友。在得知这个消息之后,我马上征询了他们的看法,学到了很多东西。他们普遍认为,美国商务部的新举措从宏观角度看是可以理解的,但是为什么要在这个时间点推出,就有些耐人寻味了。
  过去一年多,中国的互联网大厂和科技公司自称在AI大模型领域取得了显著战绩,“与OpenAI的差距只有半年到一年”。就在前几天,周鸿祎还宣称“去年我们看大模型像原子弹,今年再看大模型像茶叶蛋”从资本市场炒作的角度看,上述说法很有道理(尤其是有利于大股东离婚减持);从技术研发的角度看就完全不是那么一回事了。事实上,中国科技行业对OpenAI的“赶超”,离不开下面三个因素的帮助:
  第一,对境外开源大模型的吸收借鉴。
  GPT3以上的版本是不开源的,但是国外并不缺乏开源大模型可供借鉴(抄袭),其中最受欢迎的就是Meta于2023年2月发布的LlaMA,以及7月发布的LLaMA2。LLaMA本来只是有条件地对学术界开源,但很快遭到大规模泄露,Meta索性将其后续版本做成了全面开源。
  LLaMA2有三个公开版本,分别拥有70亿个、130亿个和700亿个参数;Meta还宣布会在合适的时候公布更复杂的版本。虽然LLaMA2还是比不上GPT4,但是作为一个借鉴(抄袭)的原点已经足够了。众所周知,国内一部分创业公司(名字就不点了)的“自研大模型”就是拿LLaMA2套皮的,就连参数名称都懒得改。
  第二,通过租用GPT接口,对GPT模型参数进行“蒸馏”。
  一个月前,外电报道称字节跳动旗下产品疑似因为调用GPT接口训练自己的大模型而被封号。其实这种事情,所有人都在做,圈内俗称“蒸馏”。所谓“蒸馏”,就是反复与GPT进行海量对话,通过GPT返回的数据对自己的模型参数进行调节;简而言之,就是让GPT帮你训练自己的模型。
  只要有足够的人力、财力,任何公司都可以通过先抄LLaMA2、再租用GPT进行“蒸馏”的方法,在较短的时间内搞出一个像模像样的“自研大模型”,在测试中的表现甚至真能做到“与OpenAI只差半年到一年”(具体差多少取决于花了多少钱做蒸馏)。很可惜,通过这种方法搞出来的大模型永远无法赶超OpenAI,就像在考试时抄学霸试卷的学生永远不可能超过学霸对了,还得小心别被监考老师抓住。
  第三,租用Azure、AWS等海外云计算服务,解决算力瓶颈。
  从2022年开始,美国不断收紧对华芯片出口禁令。虽然英伟达多次推出了对华“特供版”GPU,但是美国商务部随即补上了漏洞,现在可供利用的漏洞已经很小了。公允地说,哪怕不考虑芯片禁令,中国公司也很难抢到足够的GPU,因为英伟达的高端GPU一直供不应求,亚马逊等北美大厂经常是“出了新型号先抢一万张”,来自中国的客户的优先级肯定不会太高。
  我们知道,AI大模型使用的算力分为“训练”和“推理”两种,前者要求明显更高。因此,中国科技公司普遍采取了“训练与推理分开”的模式,把一大块训练业务交给微软Azure、亚马逊AWS、谷歌GCP等北美云计算大厂去做,因为只有它们有足够的高端算力;至于推理,则可以全部放在国内(合规要求也必须在国内),甚至在硬件端搞一些“国产替代”。这个玩法,实际上是变相绕过芯片禁令,芯片虽然没进口到中国,相关算力却是中国公司在使用。美国监管当局肯定早已注意到了这里存在的漏洞,只是以前没管,现在决定出手管了。
  当然,美国商务部的提议会不会诉诸实践、合不合法(此处是指美国的国内法),是值得争议一番的。不过在中美科技竞争的大背景下,这个提议得到实施的概率很大,美国云计算厂商的大门早晚是要对中国客户关上的。真正需要回答的问题有两个:
  为什么美国要在这个时候推出新的禁令?
  那些认真想赶超GPT的国内厂商,接下来去哪里找算力?
  先说第一条。从商业或科技逻辑讲,美国商务部在此刻提议新的禁令,有点不太好理解:中国与美国在AI大模型方面的差距仍然很大,所谓“大模型从原子弹变成了茶叶蛋”纯粹是A股公司大股东为了减持而吹的牛逼,业内人士没人相信,美国人应该更不信。允许中国公司租用美国云计算资源,在短期内不会影响硅谷的科技霸权,反而会带来一笔不菲的收入。芯片禁令对中国AI研发的限制已经够大了,有必要更进一步、把事情做绝吗?微软、亚马逊这些云计算巨头为什么不阻止美国商务部把事情做绝呢?
  对于上面的疑问有两种解释路径。一种是政治解释:今年是大选年,美国两党在互相比较谁对中国更强硬,“战场州”的选民普遍对全球化没什么好感,此时加强对华科技禁令是一张比较好的牌。至于硅谷科技巨头,这几年一直是它们春风得意、收入和利润猛增的时刻,失去一点来自中国客户的云计算收入应该不是大问题,没人愿意为此事死磕。
  另一种则是科技解释:下一代AI大模型(GPT5及其竞争对手),需要的训练算力可能会升级到“万卡规模”乃至“N万卡规模”。因为在现有基础上进一步提升大模型的能力,必须“大力出奇迹”、从资源规模上想办法,就像当年的核武器从2万吨量级飙升到千万吨乃至1亿吨一样。如果中国公司打算追赶到这一步,那它们对美国云计算资源的需求就会上升一个数量级;换个角度讲,美国本土客户的需求也会上升一个数量级,导致微软、亚马逊手中的高端算力更加供不应求。
  因此,美国商务部此时提出对华云计算服务禁令,一方面是提前封死中国公司追赶的道路,另一方面也有助于把宝贵的算力资源留给美国本土公司使用。在市场经济环境下,价高者得,发生什么事情很难说;所以最佳竞争策略是把中国公司排除在市场经济之外。微软、亚马逊肯定也知道自己手里的算力会更加精贵、不缺客户,所以也没有动力提出反对。
  现在轮到第二个问题:对于那些真心想追上世界领先水平(而不是炒高股价、离婚减持)的中国科技公司而言,接下来要去哪里找算力呢?答案取决于它们愿意付出多高的代价,而且不仅是经济代价。哪怕美国商务部正式颁布并严格执行禁令,中国公司要通过注册海外分支机构、寻找海外合作伙伴的方式去变相购买美国云计算服务,应该也是有门路的。问题在于一旦被抓,后果可能很严重永远不要低估美国监管者下死手的力度。国内互联网大厂多是美国、香港上市公司,它们有没有胆子为了AI大模型冒如此巨大的风险呢?
  如果不考虑上述冒险做法,那就只有立足于发掘国内算力资源了。目前AI相关芯片领域所有的“国产替代”都集中在推理端,因为推理所需算力要求不高。在训练端,全世界都存在对英伟达(设计)台积电(制造)的替代需求,可是全世界都没做到(包括美国自己的科技大厂)。或许再过五年、十年,总归有人能拿出替代方案,但那时的世界又不一样了。上文提到过,目前国内自研AI大模型与GPT的差距还是明显的,而且GPT自身也在迅速迭代,训练算力的需求一时半会是下不来的。
  目前国内的几家主流大厂(大家都知道是哪几家),平均每家手头只有10002000张用于通用大模型训练的显卡,有的多些、有的少些。有人猜测,某些大厂可能在海外囤积了大批显卡;不过考虑到近年来英伟达显卡一直供不应求,就算“囤积”了,规模也不会太大。即将到来的GPT5时代,可能是一个“万卡规模”的时代,全国现有的符合要求的显卡加起来可能都满足不了哪怕一个自研大模型的训练需求。怎么办?我也很想知道。
  附带说一句,在2022年11月ChatGPT横空出世之前,中国科技公司囤积英伟达显卡的最强动力,竟然是为云游戏做准备当时很多互联网大厂是真心相信云游戏是未来、而且能迅速兑现的。无心插柳柳成荫,云游戏虽然一直没起来,为云游戏准备的显卡却成了中国AI大模型的救命稻草。
  真是令人啼笑皆非:过去三年,中国游戏行业遭受了来自四面八方的一轮又一轮的抨击,夹起尾巴做人,在社交媒体上动不动就能看到“游戏算科技吗”“游戏有什么技术含量”的说法。现在,居然是游戏行业要在拯救中国“硬科技”的过程中,发挥举足轻重的作用。我们所有人都欠游戏行业一个感谢。那些一贯轻视、侮辱、诋毁游戏的人,还欠游戏行业一个道歉。我等待着他们的道歉,我希望能听到他们的道歉!
投诉 评论 转载

海尔15连冠:品牌零售量的核心在“零售”热议聚热点网 中国企业的全球化已经来到“下半场”。在过去几十年,主线是“制造出海”。本土企业承接来自全球的订单,“中国制造”通过这种方式走向海外。而如今,新的主线是“品牌出海”。……美国计划禁止云计算厂商为中国训练AI大模型,我的一点看法热文 美国商务部长吉娜雷蒙多(GinaRaimondo)在2024年1月26日接受路透采访时宣布了限制外国客户、尤其是中国客户使用美国云计算厂商的服务训练AI大模型的计划。雷蒙多的原……今日辟谣(2024年1月19日)热议聚热点网 谣言:河南首个985院校落户洛阳?真相:近日,有网传消息称,“洛阳喜提985大学,国防科技大学洛阳校区,河南省首个985院校落户洛阳”,相关信息引发关注。对此,经记者向国……加强非遗保护,促进民心相通热闻聚热点网 近日,“丝路粤韵广东民族音乐会”在马来西亚举办,现场同时展示的还有广东剪纸、佛山木版年画、大吴泥塑等非物质文化遗产(简称“非遗”)。活动得到当地民众好评。中国与马来西亚在……舞动在自贸港的海滨风情旖旎风光展现美如画卷热文聚热点网 倘若你还未曾感受过自贸港的独特魅力,那么此时此刻,你必须让自己的脚步停下,打开这一篇画卷,一同走进自贸港的海滨风情,感受那份流淌在碧波之间的韵味。自贸港的海滨,是一首诗,……市场底信号若隐若现,回购潮又起,现多起“大手笔”案例热评聚热 近日,我国多部门再次强调提升上市公司质量和投资价值的重要性,有关领导在部署走访上市公司工作、推动上市公司高质量发展全国视频会议上指出,要加大对优质上市公司支持力度,以推动上市公……中国预制菜数字消费报告热博聚热点网 近年来,中国的预制菜行业取得了飞速发展,成为消费者生活中的重要一环。报告显示,预制菜行业在美国和日本等国家已经有着较长的发展历程,并且与中国市场进行比较,可以看出中国预制菜市场……【颜值公园的真实故事】网恋奔现后发现对方已有男友,何去何从? 在“颜值公园”的社交海洋中,我遇见了她。我们在艺术与旅行的话题下结缘,从深夜畅聊诗词歌赋到分享生活琐碎,那段时间仿佛是彼此生活中的一抹亮色。我们的线上感情如同璀璨星……雪后天气寒冷,如何防寒保健康?一文了解!热闻聚热点网 随着寒潮来袭,许多城市一夜之间银装素裹,仿佛进入了如梦如幻的世界中。想必现在许多人的朋友圈,都被那些美丽的雪景刷屏了吧!雪花纷纷扬扬地落下,宛如一幅绝美的画卷。然而,在这……日常养生养肝大法热闻聚热点网 就是闭眼睛人的神明,都可以从眼神耗出去。古代有一个养生大法:眼睛一闭,就养肝。因为“肝主藏血”,肝主目。比如眼睛干涩、眼睛迎风流泪,都是肝出现问题,迎风流泪属于肝的收敛功能不足……【歌词】说不清歌手:郭乔伊热评聚热点网 郭乔伊说不清词曲:浮克活在當下制作听说那一年有三百六十五天有五十二万五千六百分钟这每分钟世界怎么转怎么变又有多少种可能谁知道明天天气阴……凤凰与科学:揭秘神话中的飞行生物热传聚热点网 【产学研王教授视点】在古代的神话和传说中,凤凰是一种神奇的飞行生物,常被描绘为具有鲜艳羽毛、长尾巴和美丽羽冠的鸟类。从科学的角度来看,凤凰的描述似乎并不符合现实世界中的任何已知……
小学生写环保作文500字热文聚热点网 【歌词】记得曾经歌手:徐嘉翊热传聚热点网 【歌词】分手的记忆歌手:钟舒漫热博聚热点网 【歌词】慌乱中的美丽歌手:阿紫热议聚热点网 【歌词】自己演唱自己的歌歌手:王红梅热博聚热点网 【歌词】sinceyouvebeengone(baby,ba 【歌词】ItsinOurHands歌手:Bjork〔比约克〕 【歌词】那年我五岁歌手:汪峰热议聚热点网 【歌词】放下全世界歌手:沐尔热评聚热点网 【歌词】ProdigalSon歌手:KidRock热议聚热点 【歌词】爱还剩多少歌手:刘婕热传聚热点网 【歌词】EnGarde歌手:TenShekelShirt热议
肥胖儿童减肥的重点有哪些慢性鼻炎针灸怎么样?效果好吗?热传聚热点网 你有没有过很颓废的时刻?但请相信美好一直在月光下的村庄铁蛋到大同旅游有哪些可以买的东西图片曝光儿童摔跤,大人千万不要过度紧张枣点分梨鼠年盖姓女孩大气起名盖姓女孩名字三个字非凡的美丽当幸福来敲门比起成功,我更希望得到自己认可一加8T尝鲜ColorOS后,给老爸的新机有着落了

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找新乡渭南铜川松江山南雅安松原荃湾淮北昭通平凉鞍山赤峰苗栗保亭池州渝北株洲陇南濮阳三沙秀山密云鸡西