数据不能出医院，AI怎么联合诊断？

2026-06-03

388

利用人工智能（AI）去分析CT扫描或X光片来诊断肺部疾病时，AI必须先在后台“吞下”海量的医学图像进行深度学习，才能炼就一双火眼金睛。然而，现实中的科学家们面临着一个巨大的“数据饥饿”困境：患者的医疗数据极度敏感，法律严格禁止医疗机构之间直接共享患者的原始图像。结果，每家医院都成了一座座封闭的“数据孤岛”，谁的数据都不够用，严重制约了医疗AI的进化。

为了打破这一僵局，谷歌在2016年提出了大名鼎鼎的“联邦学习（Federated Learning）”框架。它的核心思想是“数据不出门，参数到处跑”-各大医院不需要把患者的隐私照片传给别人，而是在本地电脑上各自训练AI模型，然后只把训练出来的“模型参数（权重）”传给中央服务器进行聚合，拼凑出一个高分的大模型。

但这套理想的框架在实际落地到医院时，却存在严重的问题。不同医院的硬件设备（显卡好坏）、网络带宽、以及患者群体（数据异构性）千差万别。传统的群聊式联邦学习中，只要有一家医院网络卡顿，或者某家医院这轮训练出来的模型质量退步了，系统依然会死板地等待并全盘接收所有人的数据，造成了通信延迟和算力浪费。

针对这一行业痛点，这篇研究为医疗AI量身定制了一套“动态融合联邦学习（DF_FL）”系统，给传统联邦学习装上了“智能过滤器”和“动态秒表”，实现了速度与准确率的双重飞跃。

这套AI诊断网络是如何既保护隐私、又算得飞快？研究团队在论文中公开了系统的两级核心架构：

客户端（医院端，Client）：不仅包含传统的本地数据采集和模型训练器（Model trainer），核心创新在于加入了一个“本地模型评估器（Local model assessor）”。就像一个严格的本地质检员，负责给每一轮训练出来的AI打分。

中央服务器（Central server）：由任务创建器（Job creator）发起任务，并由“聚合调度器（Aggregation scheduler）”掌控全局的融合节奏。

在这个网络中，传统的“盲目无条件上传”被彻底废除。系统在运行过程中引入了两个巧妙的决策点：客户端自主决定是否加入，以及服务端动态限时筛选。

为了看清一度电、一个数据包如何在无形中完成博弈的，可以跟随论文中的流程图体验一次 “数据冲刺”：

第一步：每家医院在本地训练完一轮后，本地评估器会立刻将新模型与上一轮的版本进行PK。如果发现这一轮由于数据噪音等原因，新模型的效果反而变差了，客户端就会主动向服务器发送一个“申请：本轮挂机跳过”，绝不上传垃圾参数去污染大模型。

第二步：服务器会实时记录所有医院在上一轮的平均训练时间，并据此动态更新这一轮的“倒计时秒表（WaitingTime）”。如果某家医院因为突然断网、或者电脑死机，未能在规定时间内交卷，聚合调度器就会将其“踢出本轮群聊”，直接用已收到的优秀参数进行模型融合。

这一套机制完美解决了传统联邦学习中“木桶效应”的问题，再也不用因为某一个“差生”掉队而拖慢全班的融合进度。

为了检验这套“动态分身术”在现实医学界是否真的管用，研究团队收集了包含746张CT图像和2960张X光片在内的真实新冠肺炎诊断数据集，在GhostNet、ResNet50和ResNet101三种主流深度学习网络上进行了一场测试：

（1）全部18组对比实验中，动态融合联邦学习（DF_FL）在高达14组实验中都取得了显著高于传统经典联邦学习的诊断准确率。证明过滤掉退步节点后，全局大模型变得更加纯净。

（2）面对复杂的巨型网络ResNet101时，传统的联邦学习由于每轮都要死板地传输庞大的矩阵权重，累计上传时间相当长。使用中国团队开发的动态融合（DF_FL）后，大量冗余和延迟轮次被精准过滤，总上传次数大幅缩减，累计通信时间为传统方法的 1/16！

（3）研究人员在第4组实验中引入了恶意的“干扰数据”-故意把部分健康的图像标注为新冠阳性。结果发现，传统联邦学习的准确率曲线瞬间出现了大幅锯齿状震荡（见 Fig. 4 与 Fig. 5 的第4组曲线），而动态融合系统凭着强大的容错和识别机制，依然走出了稳如泰山的超高表现。

作者简介：张卫山，中国石油大学（华东）计算机科学与技术学院教授、博士生导师，人工智能系系主任。长期从事联邦学习、区块链、可信人工智能与大数据智能处理研究。

ORCID：0000-0001-9800-1068

DOI：10.1109/JIOT.2021.3056185