人工智能的合成数据在机器人辅助手术中优于真实数据
虽然人工智能继续改变医疗保健,但这项技术有一个致命弱点:训练人工智能系统执行特定任务需要大量的带注释的数据,而工程师有时只是没有或无法获得这些数据。在一个完美的世界里,研究人员将能够在需要时以数字方式生成他们需要的确切数据,从而解锁人工智能的新功能。
然而,在现实中,即使以数字方式生成这些数据也很棘手,因为现实世界的数据,尤其是在医学领域,是复杂和多方面的。但解决方案正在酝酿中。怀廷工程学院计算传感和机器人实验室的研究人员已经创建了软件,以逼真地模拟开发人工智能算法所需的数据,这些算法在手术中执行重要任务,例如X射线图像分析。
这项于20月<>日发表在《自然机器智能》上的研究发现,使用名为SyntheX的新系统构建的算法的性能与在多个应用中基于真实数据构建的算法一样好,甚至更好,包括使机器人能够在手术过程中检测手术器械。
“我们表明,生成现实的合成数据是开发人工智能模型的可行资源,并且比收集真实的临床数据更可行,后者可能很难获得,或者在某些情况下根本不存在,”计算机科学助理教授Mathias Unberath说。
以X射线引导手术为例。假设您想开发一种新的手术机器人和相关算法,使其能够在手术过程中将器械放置在正确的位置。只有一个障碍:所需的训练数据集 - 在这种情况下,高度特定的X射线图像 - 不存在。
答案是什么?研究人员说,通过模拟生成所需的数据。在这项研究中,该团队着手模拟X射线图像,这些图像将反映真实患者接受这种机器人辅助手术时拍摄的图像。为了做到这一点,研究人员利用了复杂的计算机模拟功能,类似于《模拟人生》或《我的世界》等流行模拟视频游戏中的模拟。
为了准确评估基于模拟的AI算法与基于真实数据的AI算法的叠加程度,研究人员进行了一项史无前例的研究,他们在现实和模拟平台中创建了相同的X射线图像数据集。
首先,他们拍摄了一系列真实的X射线和CT扫描,这些扫描是使用外科C型臂X射线系统从尸体上获得的。接下来,他们生成了“合成”X射线图像,精确地再现了现实世界的实验。然后,真实数据集和模拟数据集都用于开发和训练新的人工智能算法,这些算法能够对真实的 X 射线图像进行具有临床意义的预测:髋关节成像分析、机器人手术器械检测和 COVID 诊断。当一切都说完了,团队发现在模拟数据上训练的算法和在真实数据上训练的算法一样。
“传统上,在合成数据上训练的模型在真实的临床数据上效果不佳,但SyntheX并非如此,”Unberath说。“我们证明了仅使用模拟X射线训练的模型可以应用于诊所的真实X射线,而不会损失任何性能。
该团队表示,该系统似乎是第一个证明现实模拟对于开发X射线图像分析模型既方便又有价值的系统之一,这为各种新算法铺平了道路。
“健康数据,尤其是手术数据,是一项挑战,合成数据可以产生巨大影响。与获取真实的患者数据相比,生成大规模模拟数据更灵活,高效,更便宜,并且避免了隐私问题,“主要作者Cong Gao补充道,他是Unberath实验室的前研究生,现在是Intuitive Surgical的图像算法工程师。
该团队计划使SyntheX成为数据模拟的开源工具,以便其他研究人员可以获得所需的数据集。
“如果你需要来自尸体或诊所的真实数据,世界上只有极少数大学可以进行这项研究。我们的系统允许研究人员仅使用模拟和模拟数据开发有意义的算法,这意味着更多的人可以在这个领域做出有意义的贡献和创新,“Unberath说。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。