生活工程体验信仰哲学精神
快软网
精神世界
探索历史
哲学文学
艺术价值
信仰创造
境界审美
体验技术
技能工具
工程信息
医学生产
生活运用
操作能力

健澜科技腾讯AILAB辅助诊疗系统面临的三大技术挑战

11月19日 先锋客投稿
  腾讯AILab总监杨巍在会上发表了主题为人工智能辅助诊疗系统面临的三大技术挑战的演讲,介绍了腾讯在医疗AI方面的工作和思考,以下为演讲全文
  大家好,非常荣幸今天能有机会给大家汇报一下我们近期在医疗AI中的工作和思考。我是来自于腾讯AILab的杨巍。腾讯AILab是腾讯于2016年4月成立的企业级人工智能实验室,主要的研究方向是机器学习、计算机视觉、语音识别和自然语言处理。除了AI基础技术研究之外,我们还会结合腾讯内外的应用场景做一些应用研究,包括游戏AI、社交AI、内容AI等方向,同时希望把研究成果通过开放平台和腾讯云共享给所有的企业和相关用户。我们也会结合一些行业场景,进行AIX行业的应用研究,AI医疗是其中最重要的一个行业。
  AI技术应用到医疗行业,跟AI一样,其实并不是一个近期才有的新话题。早在1972年,利兹大学就开始研究将AI应用于胸部疼痛的辅助诊断系统。近年来,随着机器学习、深度学习的发展,2016、2017年谷歌公司和斯坦福大学也都公开发表过一些具有重要影响力的研究成果,再次掀起了人工智能在医疗领域的研究热潮。2017年8月,腾讯AILab联合腾讯觅影发布了一些医疗AI相关的产品。
  今天,我想谈的是人工智能辅助诊疗系统中三大技术难点。我们知道,医生在诊疗过程中有三个非常重要的能力。一是通过知识的学习和临床经验建立属于自己的医学知识;二是在对病人的诊断过程中一步步深入理解病情;三是收集到足够清晰的病情后做出诊断决策,判断是何种疾病。这三个能力对应着AI技术在辅诊中面临的三大挑战:医学图谱的建设、诊断模型的建设以及问诊模型的建设。
  第一大挑战是医学图谱的建设。医生会通过大量的医学资料(包括影像资料、一些相关的文本资料和其他的实验室检查检验数据资料等),去学习、理解并归纳,形成自己内化的知识和经验。那么AI应该怎样去做这件事呢?我们希望AI也能去学习、理解并归纳这些医学知识,从而建设出AI能够理解的知识图谱。
  知识图谱的构建,可以简单分成三个步骤。首先,获取源数据。这里的数据包括结构化数据、非结构化数据和半结构化数据。其次,有了数据之后,要进行实体识别,比如说在一段医学文本里要知道哪些是疾病的名称,哪些是药品的名称,哪些是症状的名称,这些相当于是在整个图谱中的一个个点。最后,有了这些实体之后还要识别它们之间的关系,关系识别就是给两个点之间建立一条边,这个边就表示这两个实体的关系。
  因此要构建医学知识图谱,最核心的技术是实体识别和关系识别。实体识别,其实是自然语言处理中一个研究了很长时间的经典问题,最早可以追溯到上个世纪90年代,当时还是基于词典或者pattern的方法,后来,随着机器学习和深度学习的发展,实体识别技术有了很大的发展,同时效果也取得了显著的提升。
  但是,我们在实际中发现直接把实体识别技术应用到医学文本中,会面临一系列的问题。第一个问题是缺少标注数据。机器学习技术依赖于大量的标注数据,而医学文本的标注往往依赖于医生的专业知识来参与标注,这就增加了获取标注数据的难度。第二个问题是目前文本挖掘都会面临的分词问题,通用的分词技术应用到医学领域中会存在很多相关的问题。
  对于这两个问题,我们的模型做了两方面的优化与改进。因为医学文本里有标注的文本少,没有标注的相对比较多,比如大量的病历和医学文献、文章等。所以针对第一个问题,我们通过在没有标注的医学文本里去学习一个大规模的语言模型这个模型可以理解为学习词与词之间的语义关系,从而一定程度上减少了对标注数据的数据量的要求。针对第二个问题,我们通过融合字和词的向量表示以及上面提到的语言模型来统一建模,从而减少分词错误造成的影响。优化后,相比传统的方法效果有了显著的提升。
  第二个关键技术是关系的识别。与实体识别类似,这也是一个比较经典的自然语言处理问题,面临的主要问题也是缺乏大规模的医学实体关系的标注数据。随着深度学习技术的发展,网络越来越复杂,参数越来越多,需要标注数据的规模也越来越大,这也是目前深度学习技术面临的一个通用问题。
  我们的解决思路是通过远程监督学习的方法来产生大量的自动标注数据,比如说经过少量的标注,能够知道疾病和症状的关系,把这个关系放在不同的医学文本中进行检索,假如一个句子里面同时出现疾病和症状,那么它的关系就是成立的,这样就构造了一个弱标注的样本集合,可以通过这个样本集去学习模型。大家一定会提出一个疑问,同时出现在一个句子里面的两个实体是不是一定就表达了这样的关系呢?答案显然是否定的,这个弱标注数据中一定存在噪声。具体来说,我们通过引入多示例学习的方法来减少噪声标注的问题。通过这两种技术的融合,我们在关系识别这个问题上,效果也比以前的传统方法有较大的提升。
  AI技术在辅诊中的第二大挑战是诊断模型。当医生得到病人的相关信息之后(包括病例和检查的信息等),他需要对病人可能患有的疾病进行判断,我们把这个过程叫做诊断模型。实际中,我们发现医生在诊断时通常依赖于两点,首先是基于自己所学习和掌握的相关知识的推理,其次是基于自己的临床经验,判断当前的病情跟以前了解的病情间是否有一定的关联。鉴于此,我们可以把医生基于知识的判断,建模成对于医学图谱的推理问题;而把医生对经验的理解,建模成对历史病例的一个检索过程。
  下面这张图概括了传统诊断模型的基本过程。左边是一个病人的病情,先抽取一些病症实体及其关系,然后进行图谱的相关推理,从而判断出最有可能患有的疾病。右边是一个基于病例的检索模型,通过把当前病情跟历史上已经确诊的病例作比对,并进行相似性计算,再结合相关的病症去进一步推理从而做出诊断结论。
  这里我们可以看到传统诊断模型有几个明显的问题:一是病情的描述多种多样,医生的语言表达习惯不同,对同一病情的描述有很大差别,传统方法很难穷举;二是传统模型在判别时是知识和经验分开建模,而医生很多时候既依赖于对知识的判断又依赖于对相似病例的联想推理;三是医生在做判断的时候,并不不仅仅依赖于病例的文本数据,还依赖于医学影像、实验室检查检验等不同形态的数据,传统模型无法解决这个问题。
  针对这三个问题,我们提出了一个融合多模态数据的深度诊断模型。如下图所示,解决思路可以概括为两点:首先,把文本、图像和检查检验等多模态数据输入到深度网络中进行统一编码,这样不管是文本数据还是其他模态的数据,都可以融入到模型里进行判断和决策。其次,我们一直在思考怎样把知识和经验更有效地融合在一起。目前的解决方法是,在建模文本信息时,除了当前病历的病史记录,我们还通过attention技术把医学图谱的信息融合到模型中,作为对疾病知识的补充。通过增加不同的模态数据表示以及融合知识和经验的建模以后,诊断效果有了一定的提升。
  AI技术在辅诊中的第三大挑战是问诊模型。前面的诊断模型有一个假设,即假设医生能够很好地搜集到关于病人的所有信息。其实医生怎么收集信息,收集什么样的信息,作出什么样的判断,是一个有意思的、值得研究的问题。它可以与围棋的博弈类比患者描述自己的基本信息相当于白子落子,医生得到信息后需要判断患者的病情,类似于围棋中黑子该落到哪里。而当患者进行了交互后,他要得到一个回应,这就类似于围棋中的一次博弈。整个问诊的过程就是一个序列决策的问题。
  既然问诊过程跟围棋相似,那么能否借用AI在围棋中的强化学习技术来做问诊呢?因为强化学习是在围棋AI里效果非常好的模型,所以我们也尝试通过强化学习来优化问诊模型。优化目标有两个,一是如何高效收集患者所有的病情信息,减少不必要的交互;二是如何让最终的病情判断的结果更加准确。下图是我们RL建模的大概情况,由于时间关系就不展开细说了。
  以上内容便是我们把AI技术应用在医疗辅助诊断中遇到的一些问题和解决思路。结合腾讯觅影平台,我们也发布了一些实际的产品:去年8月,我们将诊断模型用于食管癌筛查,去年10月和11月,将问诊模型用于疾病监控。另外,我们的医学图谱也将用于辅助医生的医疗科研项目,产品会在近期发布。
  医疗AI是需要产学研共同深耕的领域,腾讯AILab会继续深耕医疗场景算法的研究,同时也希望能继续促进医疗行业专家的跨学科交流。未来我们希望能够提供筛查、诊断、治疗、康复等全流程的医疗解决方案,更好地赋能医生、辅助医疗,从而实现我们的愿景MakeAIEverywhere。谢谢大家。
  杭州健澜科技有限公司AI辅助诊疗系统!
投诉 评论 转载

18世纪英国大风暴有多大?欧洲很少遭遇风灾,人们对风灾少有防御,殊不知,灾害会想尽办法把它的魔爪伸到世界的各个角落,就在1703年11月,风灾在人们毫无防备的情况下降临到了英国人头上。在大风暴到来……东西文化差异东西方文化差异在神话时代即已注定,西方神话有两大特点,一是乱伦,主神都是兄妹啥的结合,这可能是因为他们的神话产生于伦理建立之前吧。二是西方神话都是新一代比老一代厉害。中国正好相……国家先进功能纤维创新中心先进纤维新材料科技创新高质量发展论坛一年核生芽,二年长枝叶。从2019年6月获批成为全国第13个、江苏省首个国家级制造业创新中心以来,国家先进功能纤维创新中心(以下简称创新中心)从化纤油剂产业化、无锑纤维和阻燃纤……将军退休返乡当起树司令,18年种出205万兵76岁的老人身着迷彩肩抗一把铁锹忙碌地奔走在树木之间他便是河北省军区原副司令员共和国少将张连印还被网友亲切地称呼为麾下205万个环境卫……功率超尼米兹级,核航母动力支撑?玲珑一号项目,承载多少期待?图为玲龙一号反应堆结构图随着全中国第一个陆上商用小型化反应堆玲龙一号开始建造,这一反应堆承载着中国人民大量的期待:尽管玲龙一号反应堆的输出功率只有12。5万千瓦,但是这一……激光切割技术在PCB市场的应用前景可期随着国内制造业整体进行转型升级,在PCB线路板分割市场上,人们对PCB产品的质量也提出了更高的要求。传统的PCB分板设备主要通过走刀、铣刀、锣刀方式加工,存在着粉尘、毛刺、应力……健澜科技腾讯AILAB辅助诊疗系统面临的三大技术挑战腾讯AILab总监杨巍在会上发表了主题为人工智能辅助诊疗系统面临的三大技术挑战的演讲,介绍了腾讯在医疗AI方面的工作和思考,以下为演讲全文大家好,非常荣幸今天能有机会给大……速度的相对性与绝对性速度是运动的一种度量,其概念非常明确:物体单位时间通过的路程。由于运动路程对不同的观察者而言是不同的,因而速度通常是指相对速度。对于不同的参照物(或者观察者)而言,一个物……爱尔兰确诊总数破30万,免预约接种中心全面开放,民众积极响应爱尔兰今日新增1,427例,确诊总数突破30万里程碑。住院患者:164人,重症监护室:26人。目前还没有新冠肺炎确诊死亡人数的信息。HSE表示,目前的病例数字……哪些动物永远无法被人类驯服?为什么呢?人类永远无法驯服哪些动物?自然界的动物千奇百怪,而大自然则赋予了动物之间巧妙的关系,一些动物与人为善,一些人则视人为鱼肉,一些动物与人类千年未见。在历史上,不乏有些动物成……大竹县驷马村的来历一个很有故事的省级传统村落马车是我国古代常用的交通工具,两匹马并驾一车称为骈,三匹马并驾一车称为骖,四匹马并驾一车称为驷,是速度最快的车。驷马是指套着四匹马的车,由此衍生出君子……沪宜公路一环卫车冲上水泥隔离墩车上人员及时逃生前天上午9时许,嘉定区沪宜公路靠近大碾路发生一起交通事故:一辆环卫车冲上道路中央的水泥隔离墩。所幸的是,事发后,车上人员及时逃生,事故并未造成人员伤亡。据了解,当时一辆环……
事业单位练习题公基行测判断推理联合国史上罕见一幕,中方弃权拒绝参与投票,60国站在美国对立太阳照在若尔盖草原油价金属等大宗商品涨不停,看看美元贬值和CPI,大通胀到来了高杏欣帮美国破解北斗系统,如今却想回国发展下场如何?冲向外太空!人类定居月球任务开启,未来登陆火星史上最大新造船订单100!全让韩国给拿走了中国距离最近的两座省会,高铁直达1小时,关系比省内城市还好东方航空首架C919进入总装阶段,中国商飞迎来新的里程碑洪水车子淹了保险赔吗9月16日发生了什么大事件?计量经济学用统计学模型研究经济学
摇呼啦圈瘦腰吗广汽本田9月热销61,442辆,环比增长44。7热议聚热点网 为什么要读书?读什么样的书?读书的意义是什么?刑事诉讼简易程序是怎样的可乐鸡翅有什么危害有这些害处一张照片鼠年柳姓的女孩名字柳姓女生洋气名字大全我的小学生活堵截造句用堵截造句大全非法回收厨余垃圾对环境有哪些影响移步裙她的一生5月29日开播单亲妈妈用爱撑起一片天

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找新乡渭南铜川松江山南雅安松原荃湾淮北昭通平凉鞍山赤峰苗栗保亭池州渝北株洲陇南濮阳三沙秀山密云鸡西