人类病理学家接受过广泛的培训,能够检测一名患者的组织样本何时错误地出现在另一名患者的显微镜载玻片上(这一问题称为组织污染)。但西北医学的一项新研究报告称,这种污染很容易混淆人工智能(AI)模型,这些模型通常是在原始的模拟环境中进行训练的。
“我们训练人工智能在一个非常干净的人工环境中区分‘A’和‘B’,但在现实生活中,人工智能会看到各种它没有训练过的材料。当它看到时,可能会发生错误,”西北大学范伯格医学院围产期病理学主任、围产期病理学和尸检助理教授、通讯作者 Jeffery Goldstein 博士说。
“我们的研究结果提醒我们,在实验室中运行得非常好的人工智能可能会在现实世界中遭遇失败。患者应该继续期待人类专家是活检和其他组织样本诊断的最终决定者。病理学家人工智能公司担心计算机会抢走我们的工作,但现在还没有。”
在这项新研究中,科学家训练了三个人工智能模型来扫描胎盘组织的显微镜载玻片,以(1)检测血管损伤;(2)估计胎龄;(3)对宏观病变进行分类。他们训练了第四个人工智能模型来检测从针吸活检收集的组织中的前列腺癌。当模型准备好后,科学家们将每个模型暴露于从其他幻灯片中随机取样的一小部分污染组织(例如膀胱、血液等)。最后,他们测试了人工智能的反应。
研究发现,四种人工智能模型都过于关注组织污染,导致在诊断或检测血管损伤、胎龄、病变和前列腺癌时出现错误。
研究结果发表在本月早些时候的《现代病理学》杂志上。它标志着第一项研究组织污染如何影响机器学习模型的研究。