在医疗AI迅猛发展的背景下,我们面临着如何正确测试这些新技术的巨大挑战。虽然许多医疗AI设备已经获得了批准,但它们的安全性和有效性测试却未必令人满意。最新的《自然》杂志文章揭示了当前监管标准和临床验证中的诸多问题,这些问题直接影响到患者的生命安全。
·“正确地测试用于医疗环境的人工智能系统是一个复杂的多阶段过程。尽管研究人员知道人工智能干预的理想临床试验应该是什么样子,但在实践中,测试这些技术是具有挑战性的。”人工智能(AI)被认为有助于提高诊断和治疗的效率。当地时间2024年8月21日,《自然》(Nature)杂志发布的一篇文章显示,美国食品药品监督管理局(FDA)等监管机构已批准数百种用于医院或诊所的人工智能医疗设备,但在2020年至2022年间,仅有65项人工智能干预的随机对照试验发表。“正确地测试用于医疗环境的人工智能系统是一个复杂的多阶段过程。”文章写道,“尽管研究人员知道人工智能干预的理想临床试验应该是什么样子,但在实践中,测试这些技术是具有挑战性的。”文章介绍,基于人工智能的医疗应用程序通常被药品监管机构(包括美国FDA和英国药品和保健产品监管机构)视为医疗器械。因此,审查和授权使用它们的标准往往不如药物严格。只有一小部分高风险的设备需要临床试验数据才能获批。“很多人认为这个标准太低了。”文章写道,美国宾夕法尼亚大学(the University of Pennsylvania)的重症监护医生加里·韦斯曼(Gary Weissman)审查FDA批准的AI设备时,发现10个设备中只有3个设备在授权书中引用了已发表的数据,只有4个提到了安全性评估,没有一个包括偏倚评估。“令人担忧的是,这些设备真的影响临床护理,而这关乎病人的生命。”他说。“一种完美的算法可能失败,因为人类行为具有可变性——无论是医疗专业人员还是接受治疗的人。”文章写道。首先,人工智能系统的正确运行取决于医疗保健专业人员与算法的互动程度。美国梅奥诊所(Mayo Clinic)测试了自己开发的检测低射血分数心脏病的算法,这个工具可以标记那些疑似心力衰竭的高危人群,他们往往没有被诊断出来。临床试验表明,该算法确实提高了诊断率,但初级医疗保健人员希望得到进一步的指导,以了解如何与患者谈论算法的发现。也就是说,人工智能应用程序若广泛推广,应当包含与患者沟通的重要信息的要点,以节省医生在临床上的沟通时间。另一方面,临床医生接触到大量人工智能生成的警告时,可能产生“警报疲劳”,即当临床医生接触大量AI生成的警告时,他们可能会对这些警告变得麻木,从而无法迅速反应。其次,AI临床测试的结果难以在不同人群中推广。英国伯明翰大学(University of Birmingham)人工智能和数字健康技术的临床科学家刘晓轩说:“一个众所周知的事实是,人工智能算法在处理与训练数据不同的数据时非常脆弱。只有当临床试验参与者代表了该工具将要用于的人群时,才能安全地推断结果。”此外,那些基于拥有大量资源的医院的数据进行训练的算法,在资源较少的环境中应用时可能表现不佳。文章举例,谷歌健康开发的用于检测糖尿病视网膜病变的算法,在泰国诊所使用时性能显著下降。一项观察性研究显示,泰国诊所的照明条件导致低质量的眼睛图像,从而导致该算法有效性降低。还有一个问题是患者同意。据文章介绍,目前,大多数医疗人工智能工具都帮助医疗保健专业人员进行筛查、诊断或治疗规划,但患者可能不知道这些技术正在接受测试或经常用于他们的护理中,目前没有任何国家要求提供商披露这一点。随着越来越多的人工智能工具和公司进入市场,探索在医学领域使用和评估人工智能系统的方法迫在眉睫。健康人工智能联盟(the Coalition for Health AI)提议建立一个健康人工智能保证实验室网络。该实验室将使用一套商定的原则,以集中的方式评估模型。其成员,医疗人工智能专家肖娜·奥弗加德(Shauna Overgaard)说:“对大型组织来说,这(指自己测试医疗人工智能工具)已经很困难了;对小型组织来说,难度会大得多。”对此,美国杜克健康创新研究所(Duke Institute for Health Innovation)的临床数据科学家马克·森达克(Mark Sendak)持反对意见:“每个环境都需要有自己的内部能力和基础设施来进行测试,这种集中的方法并不理想。”他所在的健康人工智能伙伴关系组织则提倡为任何能够在当地测试人工智能模型的组织培养能力并提供技术援助。
面对医疗AI设备测试中的诸多挑战,我们必须重新审视当前的监管标准,并探索更为有效的评估方法。随着技术的不断进步,建立更加严格的测试和监管体系将是保障医疗安全的关键。只有这样,医疗AI才能真正发挥其应有的作用,为患者提供更安全、更有效的治疗方案。
最新发现
相关资讯
医疗AI安全性测试难题:监管标准与临床验证的挑战
尽管数百种医疗AI设备已获批,但如何有效测试其安全性和有效性仍面临挑战。美国FDA等监管机构的标准不如药物严格,导致许多设备缺乏充分的临床数据支持。本文探讨了这些问题以及如何提升医疗AI的测试和监管方法。
2025-04-24 10:39:23
5G与AI推动通信行业增长点:2024半年报分析
2024年上半年,通信行业A股公司财报亮点纷呈。5G和AI技术成为增长新动力,中际旭创、海能达等公司业绩大幅提升,海外业务和新兴市场成为主要推动力。
2025-04-24 10:19:13
北京人工智能标准化研究院揭牌!助力AI技术标准化与产业创新
北京人工智能标准化研究院于25日在北京经济技术开发区正式揭牌,标志着国内首家人工智能标准化研究机构的成立。研究院将专注于人工智能前沿技术、行业应用及风险治理,推动全链条标准化,支持企业智能化转型和行
2025-04-24 09:59:04
360儿童手表AI答错引发热议,专家建议人工审核提升内容准确性
360儿童手表因AI回答错误引发广泛关注,周鸿祎已承诺整改并升级为人工智能大模型。专家指出,传统搜索引擎的问题以及AI内容审核的挑战,建议加强人工审查以确保内容准确。
2025-04-24 09:38:57
科技巨头为何押注小模型?大模型退潮背后的原因解析
近期,微软和英伟达推出了Phi-3 5-mini-instruct和Mistral-NeMo-Minitron8B等小型语言模型。科技巨头纷纷转向小模型,引发了对大模型的重新审视。本文探讨了小模型崛起的原因及其对人工智能行业的影响。
2025-04-21 17:05:50
洋葱学园AI智能学伴:中型厂商如何入局大模型
洋葱学园宣布与火山引擎、英特尔合作,共同推出AI智能学伴,推进“AI陪伴青少年成长计划”。该产品以教育为核心,结合大模型技术解决学习陪伴问题,并关注学生心理健康。
2025-04-21 16:45:44
今日热榜
AI应用不断深化板块景气度持续提升
2025-04-10 10:05:06首部《中国通用人工智能发展报告》蓝皮书发布
2024-12-20 13:34:15通用人工智能,是个啥智能?
2025-01-06 17:44:07你会给AI署名吗?
2025-01-15 09:28:08同济大学人工智能通识课这样开!
2025-01-08 17:36:26AI搜索第一股再获支持,IDC报告显示360AI搜索多项指标引领行业
2025-01-21 16:20:25业界竞逐AI规模应用契机
2025-01-22 13:40:25早安!世界丨俄罗斯洲际导弹试射疑失败;日本推出人工智能相亲系统
2025-02-20 13:48:57世界互联网大会举办人工智能国际标准研讨会
2025-02-21 13:52:06腾讯杰出科学家刘威:生成式AI在数字世界中可以预测未来
2025-02-24 12:53:36热门推荐