AI比医生厉害？BMJ发文担忧AI的表现被 “夸大”

2020-03-31 11:16　来源: 站长资源平台　浏览（629）人

分享按钮

编者按：本文来自微信公众号“学术头条”（ID:SciTouTiao），作者：何静，36氪经授权发布。

社会的数字化意味着我们正在以前所未有的速度积累者数据，医疗方面也不例外。据IBM 估计，每个人一生中大约会积累 100 万兆字节的数据，全球医疗保健数据的总量每隔几年就会翻一番。

为了处理这些大数据，越来越多的临床医生与计算机科学家和其他相关学科合作，利用人工智能 (AI) 技术来帮助检测有噪音的信号。最近的一项预测显示，医疗人工智能市场的价值从 2018 年的 20 亿美元将增长到 2025 年的 36 亿美元，复合的年增长率将达到 50%。

AI 是一个创新和快速发展的领域，具有改善患者护理和减轻医疗服务沉重负担的潜力。深度学习是人工智能的一个分支，在医学成像领域表现出了特别的前景。随着越来越多的研究成果的发表，各界对医学成像等领域的深度学习研究兴趣日益浓厚。

AI超越医生了吗？
近一两年，我们常看到一些媒体新闻出现诸如“研究发现，谷歌人工智能比医生早一年发现肺癌” 以及 “人工智能比医生更擅长诊断皮肤癌” 这样的标题。媒体的宣传极大增加了公众和商业对 AI+ 医疗的兴趣，也催化技术加快实施。但实际上，这些标题背后的研究方法和偏倚风险尚未得到详细的检验。但《英国医学杂志》(BMJ) 的研究人员最近警告说，“许多研究和媒体声称人工智能在解释医学图像方面达到与人类专家一样的水平，甚至比专家还好，但实际上 AI 的质量很差，而且被夸大了，这对患者的安全构成了风险。”
为了进一步研究这个问题，伦敦帝国理工学院的研究人员回顾了过去 10 年发表的研究结果，系统地检查研究设计、报告标准、偏倚风险，并将深度学习算法在医学成像方面的表现与临床专家进行比较。他们的数据来源于 Medline、Embase、Cochrane 中央对照试验注册簿和世界卫生组织 2010 年至 2019 年 6 月的试验注册簿，包括了 7334 份研究记录和 968 个试验注册。他们通过采用随机试验登记和非随机研究方法，以公认的报告标准为衡量，对深度学习算法在医学影像像中的表现与多个临床专家进行比较。
所谓的随机试验是对研究对象进行随机化分组，设置对照组，以及应用盲法，让研究者和受试者双方均无法知晓分组结果。而 CONSORT（临床试验报告统一标准）是随机对照试验的报告标准，包括了各组受试者例数、接受已分配治疗的例数等，有助于帮助医务人员了解试验背景、目的、干预措施、随机方法和统计分析。而非随机试验则是将研究对象的分组按照研究者或患者意愿进行分组，在本试验中采用 TRIPOD 作为报告标准。
在随机临床试验中，研究人员发现了仅有 10 项有关深度学习的记录，其中有 2 项已经发表，分别是眼科和放射科，其余 8 项正在或即将招募临床患者进行试验。

【版权与免责声明】如发现内容存在版权问题，烦请提供相关信息发邮件至 kefu@2898.com ，我们将及时沟通与处理。本站内容除了2898站长资源平台（ www.2898.com ）原创外，其它均为网友转载内容，涉及言论、版权与本站无关。