生活工程体验信仰哲学精神
投稿投诉
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

横扫六大权威榜单,达摩院自家深度语言模型体系AliceMin

12月4日 萌嘟嘟投稿
  机器之心发布
  机器之心编辑部
  阿里巴巴达摩院宣布正式开源AliceMind,助推语言AI进入大工业时代。
  自然语言处理(NLP)被誉为AI皇冠上的明珠,传统NLP模型制作复杂,耗时耗力,且用途单一,难以复用,犹如手工作坊。而近几年兴起的预训练语言模型,正在改变局面,有望让语言AI走向可规模化复制的工业时代。因此,预训练精调已成为NLP任务的新范式。
  阿里巴巴达摩院作为最早投入预训练语言模型研究的团队之一,历经三年研发出深度语言模型体系AliceMind,在通用语言模型StructBERT的基础上,拓展到多语言、生成式、多模态、结构化、知识驱动等方向,能力全面。其中的模型先后登顶GLUE、CLUE、XTREME、VQAChallenge、DocVQA、MSMARCO在内的自然语言处理领域六大权威榜单,领先业界,相关工作论文被AINLP顶会接收,并在6月入选2021世界人工智能大会最高奖SAIL奖TOP30榜单。
  上周AliceMind再次登顶多模态权威榜单VQAChallenge2021视觉问答挑战赛,战胜了微软、Facebook等几十家国际顶尖团队,超越第二名1个点,将纪录从去年第一名的76。36显著提升到79。78,接近人类水平(80。78)。
  就在近日,阿里巴巴达摩院宣布正式开源AliceMind。达摩院相关负责人表示,希望通过开源来降低业界研究和创新应用的门槛,助推语言AI进入大工业时代。
  据介绍,达摩院深度语言模型体系AliceMind,包括通用语言模型StructBERT、多语言VECO、生成式PALM、多模态StructVBERT、结构化StructuralLM、知识驱动LatticeBERT、机器阅读理解UED、超大模型PLUG等,此次大部分已开源。此外,AliceMind之后将围绕预训练精调语言模型持续进行生态性的技术开源。
  AliceMind开源地址:https:github。comalibabaAliceMind
  AliceMind体验入口:https:nlp。aliyun。comportalalice
  AliceMind的创新之处
  1、通用语言模型StructBERT
  Google于2018年底推出的BERT模型是业界广泛使用的自然语言预训练模型,达摩院团队在BERT的基础上提出优化模型StructBERT,让机器更好地掌握人类语法,理解自然语言,2020年多次在自然语言处理领域顶级赛事GLUEBenchmark上夺冠。
  StructBERT通过在句子级别和词级别引入两个新的目标函数,好比给机器内置一个语法识别器,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。相关论文被ICLR2020接收。
  2、多语言语言模型VECO
  跨语言预训练初衷是为多种语言建立起一个统一联合的语义表示,AliceMind体系内的跨语言预训练模型VECO一经提出,便在国际权威多语言榜单XTREME排名第一,远超Facebook、Microsoft等业界代表性模型。VECO目前支持100种语言的理解和生成任务。
  VECO效果亮眼,主要是因为两项创新:一是其可以更加显式地进行跨语言信息的建模(图1);二是VECO在预训练的过程充分学习用于语言理解(NLU)和生成(NLG)任务,并让二者互相学习提高彼此(图2)。因此,VECO模型成为了多语言领域内的第一个同时在多语言理解(NLU)和语言生成(NLG)任务上均取得业内最佳效果的模型,相关论文被顶会ACL2021接收。
  图1
  图2
  3、生成式语言模型PALM
  PALM采用了与之前的生成模型不同的预训练方式,将预测后续文本作为其预训练目标,而非重构输入文本。PALM在一个模型中使用自编码方式来编码输入文本,同时使用自回归方式来生成后续文本。这种预测后续文本的预训练促使该模型提高对输入文本的理解能力,从而在下游的各个语言生成(NLG)任务上取得更好的效果。
  PALM在MARCONLG自然语言生成公开评测上取得了排行榜第一,同时在摘要生成标准数据集CNNDailyMail和Gigaword上也超过了现有的各个预训练生成语言模型。PALM可被用于问答生成、文本复述、回复生成、文本摘要、DatatoText等生成应用上。相关文章已被顶会ACL2020录用。
  4、多模态语言模型StructVBERT
  StructVBERT是在通用的StructBERT模型基础上,同时引入文本和图像模态,在统一的多模态语义空间进行联合建模,在单流架构的基础上同时引入图像文本描述数据和图像问答数据进行多任务预训练,并在多尺度的图像特征上进行分阶段预训练。此外,模型利用attentionmask矩阵控制实现双流架构,从而提升跨模态双流建模能力,结合单流、双流结构的优点进一步提升模型对文本和图像两个模态的理解能力。相关文章已被顶会ACL2021录用。
  5、结构化语言模型StructuralLM
  StructuralLM在语言模型StructBERT的基础上扩展到结构化语言模型,充分利用图片文档数据的2D位置信息,并引入box位置预测的预训练任务,帮助模型感知图片不同位置之间词语的关系,这对于理解真实场景中的图片文档十分重要。StructuralLM模型在DocVQA榜单上排名第一,同时在表单理解FUNSD数据集和文档图片分类RVLCDIP数据集上也超过现有的所有预训练模型。相关文章已被顶会ACL2021录用。
  6、机器阅读理解模型UED
  自最开始声名大噪的SQuAD榜单起,阿里围绕着机器阅读理解发展路线:单段落抽取多文档抽取检索多文档生成开放式阅读理解,拿下了一系列的榜单冠军:2018年在单段落机器阅读理解领域顶级赛事SQuAD上首次超出人类回答精准率;2018年在多文档机器阅读理解权威比赛TriviaQA和DuReader上双双刷新纪录,取得第一名;2019年在信息检索国际顶级评测TREC2019DeepLearningTrack上的段落检索和文档检索任务上均取得第一名;2019年在机器阅读理解顶级赛事MSMARCO的段落排序、多文档答案抽取以及多文档答案生成3个任务均取得第一名,并在多文档答案抽取任务上首次超越人类水平。
  相关论文已被AAAI2021接收。
  7、超大规模中文理解和生成统一模型PLUG
  PLUG是目前中文社区已开放API的最大规模的纯文本预训练语言模型,集语言理解与生成能力于一身。PLUG可为目标任务做针对性优化,通过利用下游训练数据精调模型使其在该特定任务上生成质量达到最优,弥补之前其它大规模生成模型fewshot推理的生成效果不足,适于应用在实际生成任务。同时,PLUG采用encoderdecoder的双向建模方式,因此,在传统的zeroshot生成的表现上,无论是生成的多样性,领域的广泛程度,还是生成长文本的表现,较此前的模型均有明显的优势。
  8。知识驱动的语言模型LatticeBERT
  LatticeBERT在预训练模型中训练中有效地融合了词典等知识,从而能够同时建模字和词的结构,来线性化地表示这种混合粒度的输入。第一步是将涵盖多粒度字词信息的中文文本用词格(Lattice)表示起来,再把这个词格线性化作为BERT的输入。LatticeBERT在2020年9月达到中文语义理解评估基准CLUE榜单的base模型中的第一名。
  霸榜背后,是AliceMind持续创新和进化。达摩院团队在BERT基础上提出优化模型StructBERT,2020年多次在NLP顶级赛事GLUEBenchmark上夺冠。该模型通过在句子和词级别引入两个新的目标函数,好比给AI装上语法识别器,在面对语法错乱时,AI依然能准确理解并给出正确回应,大大提高机器对语言的整体理解力,相关文章被NAACL2021录用。
  而此次在VQAChallenge2021登顶的多模态模型StrucVBERT,融合了通用模型StructBERT和结构化模型StructuralLM,同时引入文本和图像模态,利用更高效的视觉特征和创新的注意力机制在统一的多模态语义空间进行联合建模。
  AliceMind的应用情况
  AliceMind具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力,目前已成为阿里的语言技术底座,日均调用量超过50亿次,活跃场景超过200个,已在跨境电商、客服、广告等数十个核心业务应用落地。AliceMind已上线到内部平台,开箱即用,目前支持训练、精调、蒸馏、测试、部署五大功能,只需简单操作即可完成语言模型从训练到部署的完整链路。
  在阿里之外,AliceMind广泛运用于医疗、能源、金融等多个行业。其中,浙江电网公司以AliceMind为底座为员工构建智能化运维平台,应用于变压器检修、供电抢修等业务,已经开始在国家电网公司统一推广。
  阿里达摩院深度语言模型团队负责人黄松芳表示:预训练语言模型已成为NLP领域的基石和原材料,AliceMind开源将降低NLP领域研究和应用创新的门槛,助推行业从手工业时代走向大工业时代。
投诉 评论 转载

印尼过去一个月死亡病例全球最多(雅加达综合电)印度尼西亚过去一个月的新增冠病确诊病例数为全球第三高,新增死亡病例更是全球最多,这主要是因为德尔塔变种病毒传播加速。雅加达民众12日在烈日下排队等候施打科……首席被踢出群聊?中芯国际看不起国产光刻胶,实干家自信过了头中芯国际作为国内最有实力的芯片代工厂,这些年它的发展大家有目共睹。但同时它的管理上却出现了一些问题,就比如之前传出梁孟松要离开,再比如这次中芯国际负责人杨晓松,口出狂言引众怒一……毁三观!男教师10年性侵20名男学生细节太恶心又一起性侵事件在全网爆了!四川某中学男教师梁某利用其班主任、心理健康中心主任的身份,十年来竟然性侵了20多名男生。这起案件最早曝光是在4月30日,一篇发表在微信公众……人工智能AI正在迅速改变零售和批发行业,您需要注意一下?人工智能AI现在是火的一塌糊涂,今年人工智能AI画的画拍出天价,用人工智能分析梅派唱腔,甚至用于音乐教育2019年,人工智能在艺术领域吹起了一波波涟漪,相比较人工智能在艺术的领……法国本土健康通行证又来啦自8月9日起法国,法国进一步扩大健康通行证的使用范围,并进入严格实施阶段。今天就来盘点并解答一下健康通行证(Passsanitaire)的相关问题,快来了解一下吧!Les……小小方寸与伟人马克思文张华东今天是世界著名的思想家、政治学家、哲学家、经济学家、革命理论家、历史学家和社会学家卡尔马克思诞生纪念日,马克思全名为卡尔海因里希马克思(德语:KarlHeinri……关于外星人的8个冷知识,看完就能回母星了母星之光1。全世界有超过20,000人购买了外星人绑架险。某保险公司有有一个1刀的投保项目:每年交1刀,可确保你在未来数百万年间不会被外星人绑架。除非你真的愿意被外……横扫六大权威榜单,达摩院自家深度语言模型体系AliceMin机器之心发布机器之心编辑部阿里巴巴达摩院宣布正式开源AliceMind,助推语言AI进入大工业时代。自然语言处理(NLP)被誉为AI皇冠上的明珠,传统NLP模……美国记者我有些害怕去中国,但北京之行改变了我对中国的看法之前刊登在英国《地铁报》上的一篇文章火了,这篇文章的题目叫人民共和国的力量:站在中国科技革命前沿的视角,这篇文章是由一位来自美国的记者所写的,他说自己有些害怕去中国,但北京之行……低功率长续航,史上最强华为Mate40系列稳拿高销量华为于2020年10月底国内发布的华为Mate40系列,深受广大消费者们的喜爱。与此同时,华为不仅手机的呼声一路高涨,其他的华为智能产品,也因此迎来了购物狂潮,面对这样的趋势,……45122!苹果M1x功耗将Intel远远甩在后面日前,苹果的过渡产品M1X处理器出现在了一个网站的目录中。这也是苹果公司在推出桌面级SoCM1以来,第一次出现新处理器的消息。M1XSoC按照此目录,M1X处……苹果汽车遭斩首?高级副总裁跳槽福特,1年离职4位高管来源:Bloomberg编辑:好困【新智元导读】北京时间9月8日,福特宣布挖走了苹果汽车项目的负责人DougField!苹果汽车部门成立7年,结果在2021年不到1年的时……
浙江的纳税大户第一名不是阿里,是他!商会是什么商会做什么阳光下的阴影反歧视路漫漫中国学者引领的国产原创新药研究带来新成果苦相造句用苦相造句大全苏伊士运河搁浅货轮因潮汐脱困了,是月亮的功劳,而非挖掘机?有机大葱具有很高的营养价值吗面对癫痫病应该怎么办向日葵向着太阳?你错啦,人家不是一直向阳的兼收造句用兼收造句大全重启里的女人皮俑是什么女皮俑为什么救吴邪适可造句用适可造句大全

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找新乡渭南铜川松江山南雅安松原荃湾淮北昭通平凉鞍山赤峰苗栗保亭池州渝北株洲陇南濮阳三沙秀山密云鸡西