DDW 2018 | 人工智能辅助结肠息肉检测脚步近了

2018-06-06 10:14 来源：丁香园作者：yuanwang322

美国时间2018年6月2日-5日，美国消化疾病周（DDW2018）在波托马克河畔的首都华盛顿哥伦比亚特区举行。本次会议由美国肝病研究学会（AASLD）、美国胃肠病学会（AGA）、美国胃肠内镜学会（ASGE）和美国消化道外科学会（SSAT）四大学会联合主办，是国际消化系统疾病领域规模最大、学术水平最高的会议及展览会。

聚焦 DDW 2018，点此进入专题页面

美国加州大学尔湾分校胃肠病学和肝病学系的Priyam V. Tripathi在DDW 2018会议上分享了和同事共同进行的一项最新研究，高水平的结肠镜专家可以在人工智能的辅助下比没有辅助时识别出多于20%的结肠息肉。

研究概要

·机器学习模型的速度可达每秒98帧，达到了进行肠镜操作时实时图像的处理速度要求

·机器学习模型可以达到98%的敏感性和93%的特异性，低假阳性率（ 7%），高阴性预测值（99.5%）

·机器学习模型检测出了专家所识别的所有息肉，并且帮助发现了另外的20%的息肉

·未来随机的临床验证试验会进一步帮助明确机器学习模型是否可以提高息肉识别率

假设：人工智能辅助检测提高腺瘤检测率

提高腺瘤检测率（ADR）可以显著降低结直肠癌风险。而机器学习（ML）作为一种人工智能的方法，有辅助息肉检测提高ADR的潜能。于是，研究者通过8641张息肉和正常结肠的图像训练了一个卷积神经网络（convolutional neural network）机器学习模型，这个模型达到了AUC （ROC曲线下的面积）0.99，息肉识别准确性96%，并且它的处理速度也超过了实时图像所需的速度。在这种情况下，研究者假设这种模型会增加肠镜专家在回顾结肠镜图像视频时的息肉检出率。

证实：人工智能辅助检测效果不次于专家

在研究中，4名结肠镜专家（ADR≥50％）观看9个结肠镜检查视频，来识别出视频中的所有息肉。他们所看的是一个从头到尾（start-to-end frames）连续的视频，其中他们达成共识所检测出的被认为是息肉。机器学习模型所识别的息肉的定义是，在大于连续8帧（250毫秒），ML的预测值大于95% （ML认为它是息肉的可能性大于>95%时）。一位资深专家（ADR = 50％，> 20K 结肠镜）来回顾机器学习模型所分析的肠镜视频，并给出每一个息肉是真的息肉的可能性（置信水平）高低（图1）。研究还比较了机器学习模型自身以及机器学习模型辅助专家读片两种情况下，所识别出来的息肉数和非息肉数。

图片 1.png

图 1 机器学习分析结肠镜视频的代表性帧镜头

结果显示，在9个结肠镜录像中，专家识别出了36个息肉，机器学习模型识别出了45个息肉，在这45个息肉中只有28个被最初做肠镜的医生切除（图2）。机器学习模型没有遗漏掉任何一个息肉。在机器学习模型辅助下发现的另外9个息肉中，有3个是息肉的可能性较大，6个较低（图1）。 ML识别息肉的敏感性和特异性分别是0.98和0.93 （卡方检验， P <0.00001）。假阴性的结果主要是在较远的或视野边缘的息肉，假阳性结果主要是塌陷的黏膜、碎片、吸引痕迹和息肉切除部位。

图片 2.png

图 2 结肠镜切除的息肉情况，以及有或无人工智能辅助视频分析的息肉情况

启发：人工智能在结肠镜检查辅助诊断中的应用，脚步近了

研究者训练的ML模型识别出了所有专家检测到的所有息肉，并辅助发现了另外9个息肉。在进行实时结肠镜检查时，该模型可能会促使检查更仔细，帮助发现更多的息肉。当然研究也存在一定的局限性，比如，所用于研究的肠镜视频总数小，机器学习模型所检测的视频，只有一位专家进行回顾分析，可行性研究仅局限于视频回顾分析等。在未来的研究中，可进一步检验人工智能机器学习模型，来测试ADR提高以及降低腺瘤漏检率的有效性。

据研究者介绍，人工智能已经在结肠镜的检查中应用，主要是检查肠道准备够不够彻底，以及监测示踪剂在肠道的放置和排出。这项研究的发表是不是意味着人工智能可以在结肠镜检查中发挥更多的诊断辅助作用呢？研究者对此深信不疑，那看到这篇研究的你呢？

聚焦 DDW 2018，点此进入专题页面

丁香智汇尾巴.gif