人工智能最令人印象深刻的用途依赖于良好的数据——而且是大量的数据。例如,聊天机器人可以从数百万个充满文本的网页中学习对话。自动驾驶汽车根据数百万次公路旅行记录的传感器数据学习驾驶。
然而,对于技术性很强的任务,例如理解医学图像,很难找到好的数据集。在一项新的研究中,斯坦福大学医学院的研究人员在来自令人惊讶的来源 Twitter(现在称为 X)的高质量、带注释的医学图像宝库上训练了一种人工智能驱动的算法。
新算法处理了超过 200,000 张病理图像,通常是用染料染色的细胞或组织的高分辨率视图,以及来自 X 的讨论,能够读取多种疾病的图像,例如黑色素瘤、乳腺癌或癌症寄生虫感染。然后,它可以根据图像或文本搜索检索相似的图像。该算法本身并不是为了提供诊断,而是作为临床医生和学生的强大参考工具。
“主要应用是帮助人类病理学家寻找类似的病例作为参考,”生物医学数据科学助理教授、该研究的资深作者 James Zou 博士说,该研究于 8 月 17 日发表在《自然医学》杂志上。
不是普通的推文
“推特上实际上分享了很多高质量的医学知识,这可能会让一些人感到惊讶,”邹说。事实上,社交媒体平台已成为病理学家分享有趣图像的热门论坛,以至于社区广泛采用了一组 32 个主题标签来识别亚专业。