MEDIQA评测医学放射报告摘要
-
MEDIQA 2021评测以生物医学文本摘要(Radiology Report Summarization)为主题,由NAACL的BioNLP研讨会组织开展。在医学语言理解和知识图谱领域深耕已久的百度以主指标ROUGE-2超出第二名近3个百分点的绝对优势夺冠,同时包揽全部9项测试指标的第一名。据了解,本次评测吸引了来自IBM研究院、卡内基梅隆大学、斯坦福大学、阿里巴巴、腾讯等全球知名企业和机构参与。在众多实力选手中脱颖而出,再次彰显百度不俗的AI技术实力
MEDIQA(Medical NLP & QA)是近年来国际生物医学语言处理(BioNLP)研讨会设立的技术评测。BioNLP研讨会是生物医学自然语言处理领域最权威的国际研讨会之一,从2002年至今已成功举办20届,受到全球广泛关注。今年以生物医学文本摘要为主题的MEDIQA 2021评测,下设医学问题摘要、答案摘要和医学放射报告摘要三种任务
其中,医学放射报告是指临床放射性检查后形成的影像报告,通常包括患者和检查的基本信息、影像表现和诊断印象这三部分。诊断印象可以为后续的医疗决策提供重要依据,是放射报告中最为关键的部分。在传统的诊疗流程里,诊断印象由放射科医生根据读片后的影像表现人工总结形成,耗时耗力。而放射报告的自动摘要则是根据影像表现并结合患者的基本信息,自动生成诊断印象,可以极大地解放人力,提升医疗智能化水平。除了任务形式的新颖性之外,本届MEDIQA放射报告摘要任务还有一大特点:测试数据与训练数据来自于不同的医疗机构,在患者分布、行文风格等方面都存在巨大的差异。这无疑对参评系统的迁移和泛化能力提出了进一步挑战。
提升AI模型文本摘要能力,推动解决基层医疗难题
自然语言处理及知识图谱作为从医学报告等文本中摘取有用信息的关键技术,已经成为学术界深入研究的热点和难点。为了提升模型的文本摘要能力,同时提升其迁移和泛化能力,百度团队在参赛系统的设计上进行了多种创新。
从系统架构上来看,百度采用编码器-解码器框架,通过“预训练-微调”范式,实现生成式文本摘要。在预训练阶段,以文本摘要生成为预训练目标,最大化模型的文本摘要能力。在微调之后,进一步利用不同源数据对模型进行领域适配,提升其对新数据的迁移和泛化能力。此外,百度借助模型集成、文本规范化等技术,进一步提升摘要生成的质量。
最终,百度以绝对优势超越其他参赛机构获得冠军,充分证明了其在生物医学语言理解及知识图谱领域深厚的技术积累和领先的技术实力,更进一步体现了AI在临床医疗领域。