数据不能出医院,AI怎么联合诊断?

2026-06-03 28

42.png


利用人工智能(AI)去分析CT扫描或X光片来诊断肺部疾病时,AI必须先在后台“吞下”海量的医学图像进行深度学习,才能炼就一双火眼金睛。然而,现实中的科学家们面临着一个巨大的“数据饥饿”困境:患者的医疗数据极度敏感,法律严格禁止医疗机构之间直接共享患者的原始图像。结果,每家医院都成了一座座封闭的“数据孤岛”,谁的数据都不够用,严重制约了医疗AI的进化。

为了打破这一僵局,谷歌在2016年提出了大名鼎鼎的“联邦学习(Federated Learning)”框架。它的核心思想是“数据不出门,参数到处跑”-各大医院不需要把患者的隐私照片传给别人,而是在本地电脑上各自训练AI模型,然后只把训练出来的“模型参数(权重)”传给中央服务器进行聚合,拼凑出一个高分的大模型。


但这套理想的框架在实际落地到医院时,却存在严重的问题。不同医院的硬件设备(显卡好坏)、网络带宽、以及患者群体(数据异构性)千差万别。传统的群聊式联邦学习中,只要有一家医院网络卡顿,或者某家医院这轮训练出来的模型质量退步了,系统依然会死板地等待并全盘接收所有人的数据,造成了通信延迟和算力浪费


43.png


针对这一行业痛点,这篇研究为医疗AI量身定制了一套“动态融合联邦学习(DF_FL)”系统,给传统联邦学习装上了“智能过滤器”和“动态秒表”,实现了速度与准确率的双重飞跃。


这套AI诊断网络是如何既保护隐私、又算得飞快?研究团队在论文中公开了系统的两级核心架构:


客户端(医院端,Client:不仅包含传统的本地数据采集和模型训练器(Model trainer),核心创新在于加入了一个“本地模型评估器(Local model assessor)”。就像一个严格的本地质检员,负责给每一轮训练出来的AI打分。

中央服务器(Central server:由任务创建器(Job creator)发起任务,并由“聚合调度器(Aggregation scheduler)”掌控全局的融合节奏。

在这个网络中,传统的“盲目无条件上传”被彻底废除。系统在运行过程中引入了两个巧妙的决策点:客户端自主决定是否加入,以及服务端动态限时筛选


为了看清一度电、一个数据包如何在无形中完成博弈的,可以跟随论文中的流程图体验一次 “数据冲刺”:


44.png

45.png


第一步:每家医院在本地训练完一轮后,本地评估器会立刻将新模型与上一轮的版本进行PK。如果发现这一轮由于数据噪音等原因,新模型的效果反而变差了,客户端就会主动向服务器发送一个“申请:本轮挂机跳过”,绝不上传垃圾参数去污染大模型。

第二步:服务器会实时记录所有医院在上一轮的平均训练时间,并据此动态更新这一轮的“倒计时秒表(WaitingTime)”。如果某家医院因为突然断网、或者电脑死机,未能在规定时间内交卷,聚合调度器就会将其“踢出本轮群聊”,直接用已收到的优秀参数进行模型融合。

这一套机制完美解决了传统联邦学习中“木桶效应”的问题,再也不用因为某一个“差生”掉队而拖慢全班的融合进度。


为了检验这套“动态分身术”在现实医学界是否真的管用,研究团队收集了包含746张CT图像和2960张X光片在内的真实新冠肺炎诊断数据集,在GhostNet、ResNet50和ResNet101三种主流深度学习网络上进行了一场测试:

(1)全部18组对比实验中,动态融合联邦学习(DF_FL)在高达14组实验中都取得了显著高于传统经典联邦学习的诊断准确率。证明过滤掉退步节点后,全局大模型变得更加纯净。


46.png


(2)面对复杂的巨型网络ResNet101时,传统的联邦学习由于每轮都要死板地传输庞大的矩阵权重,累计上传时间相当长。使用中国团队开发的动态融合(DF_FL)后,大量冗余和延迟轮次被精准过滤,总上传次数大幅缩减,累计通信时间为传统方法的 1/16


47.png

48.png


(3)研究人员在第4组实验中引入了恶意的“干扰数据”-故意把部分健康的图像标注为新冠阳性。结果发现,传统联邦学习的准确率曲线瞬间出现了大幅锯齿状震荡(见 Fig. 4 与 Fig. 5 的第4组曲线),而动态融合系统凭着强大的容错和识别机制,依然走出了稳如泰山的超高表现。


作者简介:张卫山,中国石油大学(华东)计算机科学与技术学院教授、博士生导师,人工智能系系主任。长期从事联邦学习、区块链、可信人工智能与大数据智能处理研究。


ORCID0000-0001-9800-1068


DOI:10.1109/JIOT.2021.3056185

会议官网

扫码关注艾思科蓝订阅号 回复“0”即可领取该资料

去登录