生活工程体验信仰哲学精神
快软网
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

大模型“淘金”的创业者,阵痛比红利来的还早?

2月2日 金钟寨投稿
  根据北京市经信局公布的数据,截止到2023年10月初,国内公开的AI大模型数量已经达到238个。
  尽管学术界对大模型的参数量并没有明确的标准,许多10亿级参数的模型并不能和GPT4相提并论,国内大模型的爆发式增长,无疑揭示了一个既定事实:和每一次风口出现时一样,总有人一窝蜂地涌入,试图在新一轮的创业潮中搏一个机会。
  就像创新工场董事长李开复的观点:AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命,它将比Windows、安卓要大10倍甚至更多,它会让每个应用改写,会重构人类的工作,会让有创意的那些人的聪明才智被放大10倍或者更多。。。。。。
  为了不错过“百年一见”的历史机遇,一场“百模大战”正在上演,可问题在于:当前的大模型战场,当真是属于创业者的机会吗?
  01“插件”更像是一种过渡
  大模型的爆火,属于多种因素叠加的结果,其中让大多数人印象深刻的标志性事件有两个:一个是ChatGPT的走红,月活用户量在两个月的时间里就超过一亿;另一个是英伟达CEO黄仁勋的比喻,认为“AI的iPhone时刻已经来临”。
  冷静下来思考,这两个事件都有着鲜明的移动互联网色彩,将月活视为一个产品成败的标准,将某个产品的爆炸性增长视为市场需求被激活的晴雨表。这样的逻辑是否合理还不得而知,但深深影响了大模型商业模式的构建。
  于是,很多大模型都在打造自己的“应用中心”。OpenAI上线了ChatGPT插件,付费用户可以调用插件解决某类需求,目前ChatGPT上已经有近1000个插件;国内的百度也在积极布局,发布文心一言插件生态平台“灵境矩阵”,并计划提供百亿流量、亿元基金等激励来扶持插件生态。
  个中缘由并不难理解。
  无论是站在移动互联网塔尖的苹果,还是出货量稳居前五的安卓厂商,无不构建了应用市场的变现模式,衍生出了广告排名、支付分成、游戏联运等多种盈利方式。甚至微信这样的超级APP,也通过小程序实现了类似的机制。
  就现阶段来看,像手机厂商一样经营“插件生态”,可能是大模型平台当下的最佳选项,而开发者同样乐见其成。
  就像移动互联网催生的流量红利,灌溉了大大小小的应用,倘若大模型可以沿着移动互联网的轨迹增长,大概率将带来了新一轮的红利。为大模型平台开发插件,可能会得到平台的流量倾斜,拿到大模型时代的门票,乃至通过“降维打击”的方式颠覆固有的市场格局。
  问题在于,大模型平台能否成为占领用户习惯的入口?在互联网和移动互联网时代,入口一词频频被提及,可以细分为内容、应用、操作系统、硬件四个维度,充当着用户获取信息、解决问题的第一触点。
  眼下的挑战在于,坊间普遍认为通用大模型会趋向寡头化,最终只剩下两到三家,开发者选择加入哪个大模型插件生态,就像是一场豪赌。毕竟ChatGPT的访问量已经连续三个月下滑,而且功能相似的聊天机器人应用仍层出不穷,在大多数用户的习惯养成前,无法断言哪个大模型会是最后的赢家。
  把视野再放大一些的话,聊天机器人可能并不是大模型的终极应用,更像是一个启蒙产品。
  比如华为已经将大模型和语音助手小艺融合,不排除越来越多的智能手机、智能音箱、智能家居类厂商有同样的计划,语音助手逐渐成为人们唤醒大模型的主流方式;再比如一些人鼓吹的Agent,即可以能自主理解、规划决策、执行复杂任务的智能体,自动帮主人处理一些繁琐的流程性工作。
  无论是哪一种情况,都意味着插件不过是一种过渡,用户需要的只是连接某个服务,不需要知道服务来自哪个插件。先调用某个插件才能获得某项能力的交互,注定是大模型初级阶段的产物。
  02垂直大模型是金矿吗?
  事实似乎也是如此。不管是ChatGPT还是同类产品,插件的主要贡献者集中在独立开发者和人数较少的小团队,那些手握上千万用户和海量数据的产品,好像对插件背后的机会窗口不太感兴趣。
  毕竟插件生态的主导者是通用大模型,插件的作用可以归类为AI的范畴,目的是为了扩展大模型的多元能力。借用百度集团资深副总裁何俊杰的观点:“如果说大模型是一颗聪明的大脑,那么插件就是大模型的手和脚。”
  典型的例子就是文档处理类的插件,调用大模型的能力对用户的文档进行处理,再基于文档完成摘要、问答、创作等任务。插件扮演的终归是工具的角色,而工具类产品的宿命普遍不太乐观:风口期收获了大把的流量,但大多数工具没能走通变现的路子,风口过后还要买流量来维持增长。
  有野心的开发者不甘心做插件,做通用大模型的“寄生品”,瞄准了更有吸引力的选择:
  一种是基于大模型的能力开发独立应用,或为自己的应用接入大模型厂商的API,进而提升产品的服务能力;另一种是在通用大模型或开源大模型的基础上,训练适用于垂直场景的模型。据说北京市已经有115个AI大模型,其中垂直大模型占到了103个。
  前者的挑战在于,目前的产品主要集中在对话型、绘画类产品上,且以ToC场景为主。只不过C端用户仍以闲聊、娱乐为主,尚未产生实实在在的生产力,导致付费意愿通常比较低。同时还存在产品同质化的现象,以闲聊类产品为例,早期的产品普遍基于公开语料,假如用户的提问难以产生有价值的数据,差异化也就无从谈起。
  ToB渐渐成了行业内心照不宣的选项。
  大模型的能力听起来很美好,大多数企业却用不起来,原因在于通用大模型无法很好地解决垂类问题。对于B端企业来说,可以将自己服务行业的专业知识灌输给大模型做进一步的训练与微调,训练完后在本地进行私有部署,再来解决对应垂类问题。
  这就为垂直大模型提供了充足的想象空间,也是创业者扎堆的赛道。B端企业的场景比较明确,并且积累了海量的数据,既能为大模型训练提供数据,还提供了大模型效果的检验场。
  相对不那么乐观的是,现阶段愿意为大模型付费的,还只有金融为首的个别场景,不少行业还在观望中。以金融大模型为例,目前发布了金融大模型的企业有蚂蚁集团、Bloomberg、MorganStanley、Lemonade、苏黎世保险、度小满、瑞穗金融集团等,要么手握海量金融数据,要么有自研大模型的背景,都不是靠一腔热血闯进市场的创业者。
  简而言之,大模型的想象空间越大,想要从中寻找机会的企业就越多,留给创业者的机会窗口并没有太多。况且还有一个无法规避的问题:在和大厂同台竞争的过程中,创业者有资本试错吗?通往大模型的远方有千万条路,也意味着会有千万个死胡同。
  03创业者“无法承受之痛”
  首当其冲的正是合规问题。国内在7月初出台了大模型备案要求,依靠API接口获取境外大模型能力的模式受到挑战,导致年初时就接入OpenAI做应用的团队,在不同程度上陷入了困境。
  比如某在线设计平台,曾是国内最早推出AI生图的产品之一,并围绕AI生图搭建了社区生态。但在9月初的时候,这家平台突然宣布“网站维护”,一直到一个多月后,依然是“网站升级中”的状态。而在每天都有新事物出现的大模型行业,早期的先发优势正不可避免地随着时间消亡。
  和过往几次“风口”最大的不同,在大模型的曙光面前,创业者很兴奋,监管却很理性,为了避免大模型市场重蹈野蛮生长的局面,避免大模型走向失控,相关政策和法规密集出台。
  就在不久前,科技部、工信部、教育部等10部门联合印发《科技伦理审查办法(试行)》,明确提到:算法、模型和系统的设计、实现、应用等遵守公平、公正、透明、可靠、可控等原则,符合国家有关要求,伦理风险评估审核和应急处置方案合理,用户权益保护措施全面得当等。
  几乎在同一时间,全国信息安全标准化技术委员会发布了《生成式人工智能服务安全基本要求》(征求意见稿),涉及语料安全、模型安全、安全措施、安全评估等多个方面。
  其中在语料安全要求中,不仅明确提出语料可溯源,包括开源语料和自采语料,还提出要建立语料来源黑名单,不使用黑名单来源的数据进行训练。“应对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5的,应将该来源加入黑名单。”
  也就是说,在监管趋严的背景下,等待开发者的不单单是备案问题,而是系统性的合规要求。无论是调用大模型API做创新的应用层开发者,还是想在垂直领域分一杯羹的垂类大模型,“蒙眼狂奔”的选项已经消失,必须要谨慎应对潜在的合规和安全风险。
  如果开发者基于某个不合规的通用大模型训练产品,为了满足合规需求而切换大模型的话,需要重新处理数据,因为不同大模型的训练数据不同,开发者需要重新对数据进行清洗、预处理和标注;需要基于新模型训练和调优,包括训练算法、超参数,以及反复的实验和调整;在模型部署和应用过程中,还要考虑不同的部署平台和框架
  垂直大模型大发展需要应对的潜在风险更多。就像《生成式人工智能服务安全基本要求》中提到的,预训练、优化训练等环节的输入端数据均纳入“训练语料”的范畴,过去靠采集境外数据进行训练的方案已经行不通,势必要花更多的精力进行数据采集、清洗、标注。数据影响着大模型的“智商”,同时也左右着垂直大模型的生死。
  相比于巨头们充沛的资源,大模型创业者面临的挑战将越来越多,现阶段是合规,下阶段可能就是盈利了。
  04写在最后
  用一句话形容大模型时代的创业者:表面上鲜花着锦,实际上烈火烹油,从抢跑到碰壁,不过才半年时间。
  也许大模型时代不缺少机会,但每一条赛道都不会是康庄大道,不缺少冲出一家家独角兽的机会,比例上注定是九死一生。结果大概率和一次次淘金热一样,淘到金子的人寥寥无几,卖水人悄悄发了财。
投诉 评论 转载

有钱!曝李春江隐形富豪,名下多套豪宅当包租公,别墅每晚都亮灯 2023年CBA最轰动的两件大事就是新疆队退赛以及上海江苏配合打假球事件,经过多方协调,最终新疆队还是顺利回到CBA联赛,中国篮球及时止损。而上海队和江苏队打假球的热度,甚至超……女孩被卡喉民警44秒施救:从施救到成功,仅用24秒热评聚热点 女孩被卡喉民警44秒施救:从施救到成功,仅用24秒5月2日傍晚,在北京热门景点王府井步行街,一名小女孩被食物卡住呼吸困难,幸好两名执勤民警及时帮助小女孩脱离险境。从接到求……贵州一饰品店涉抽奖骗局官方:关店整改立案调查热议聚热点网 央视网消息:据“多彩红花岗”微信公众号消息,遵义市红花岗区市场监督管理局10月14日发布情况说明:针对近日网络流传忠庄客运站内一饰品店涉“金镶玉”抽奖骗局一事,我局于2023年……俄称击毁乌军多种装备乌称巴赫穆特激战持续热闻聚热点网 俄罗斯国防部当地时间4月2日发布战报称,俄军在库皮扬斯克、顿涅茨克、扎波罗热和赫尔松等方向发动攻势,击毁了乌军多种装备。当地时间4月2日晚,俄罗斯方面表示,俄方军队已控制……Mysteel周报:钨价维持坚挺(4。285。5)热博聚热点 福建某大型钨企5月上半月现金长单采购价:APT18。05万元吨,较上次长单价上调5500元吨;江西钨业控股集团有限公司国标一级黑钨精矿2023年5月上半月指导价12。15万元标……好文:怎么做红烧鸡翅热闻聚热点网 之前宝宝辅食做过,只放酱油,添加点辣椒和冰糖,最简单的调味自己吃起来。ByYan105用料鸡翅中6个老抽适量料酒12勺红干椒4个盐少许冰糖适量清水适量食用油少……五一假游你会对新冠第二波做些什么热闻聚热点网 五一节日已经到来,很多人会选择出游,放松心情。然而普通人在出游的过程中,还是有许多事情需要注意和担心的,像新冠第二波来了普通人会怎么做?新冠虽然过去五个月了,我们在假日出……《星星说》金牛座5月运势:自我身份和关系发生改变的一个月热博 《星星说》金牛座5月运势:自我身份和关系发生改变的一个月作者:王祯的幻世界VogueHKMay20235月5号,我们迎来了满月食相,启动金牛座合作方面的事宜。……【歌词】美丽的回忆刘德华歌手:华人群星11热闻聚热点网 刘德华美丽的回忆(国)作曲:王锦林填词:刘伟编曲:蔡晓恩监制:李安修陈德建活在當下制作转眼间你又到这里我悄悄在回忆里等你多少回忆我在这静寂守……大模型“淘金”的创业者,阵痛比红利来的还早?热闻聚热点网 根据北京市经信局公布的数据,截止到2023年10月初,国内公开的AI大模型数量已经达到238个。尽管学术界对大模型的参数量并没有明确的标准,许多10亿级参数的模型并不能和……“阳过”之后,是否还需要接种新冠疫苗?海口接种门诊地址热传聚 问为什么还需要接种新冠疫苗?全国整体疫情局部零星散发状态,但新冠病毒并未消失,病毒在人群种的传播仍持续存在。不同人群免疫水平还仍存在差距。在此前疫情中,未感染且尚未……恒隆广场(恒隆广场将推行“天幕”系统)热博聚热点网 杭州恒隆广场,位于武林商圈的绝对核心地块,体育场路与延安路交汇处东南侧,北至体育场路,南接百井坊巷,西至打枝弄,东至杭州粮油商品贸易大厦、体育局宿舍、天水苑等。项目效果图……
投资,最难的事是什么?热博聚热点网 侵占罪原则是什么?热闻聚热点网 离婚案件判决中,孩子抚养费的数额是怎么确定的?热评聚热点网 离婚了我和小孩要迁户怎么办热文聚热点网 丧葬假几天?热议聚热点网 何谓变更单位怎么计算工龄热博聚热点网 【歌词】如果还有以后IfThereIsIf歌手:莫文蔚热评聚 超级游戏奖门人一共有多少集?热文聚热点网 离婚案件一直延期,对方不要怎么办热议聚热点网 中国有哪些基金会?热博聚热点网 东莞民事律师山东省夫妻间的债务债权处理热文聚热点网 江苏连续两操作!有意签场均35分超外,放弃潜力新星,只为省钱
女孩不顾父母反对怀孕嫁初恋,不料婚姻迅速破裂,随后悲剧又降临尊重产妇需求认识生产计划书一场53揪出伪强队!世界杯太冷,保送阿根廷,内马尔献礼梅老七茶叶发酵一年后能浇兰花吗茶叶发酵一年后能不能浇兰花农业供应链金融(农业供应链金融的模式和案例)企业做社交电商有什么好处?热议聚热点网 创业团队的项目管理如何面向开发人员优化故事里的人生(271喔,是这样子呀)吸油纸会使皮肤缺水吗吸油纸光滑的一面吸油吗童年的记忆农村土地使用证是小产权吗?轮回十年证实与证伪

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找新乡渭南铜川松江山南雅安松原荃湾淮北昭通平凉鞍山赤峰苗栗保亭池州渝北株洲陇南濮阳三沙秀山密云鸡西