我们非常重视您的个人隐私,当您访问我们的网站时,请同意使用所有cookie。有关个人数据处理的更多信息可访问《隐私政策》

2025-02-27

兰卫医学病理数字切片标准集项目通过验收,引领病理AI数据新基建

分享


       蛇年新春伊始,由兰卫医学作为主申报方、朗珈软件和中国信通院上海工创中心共同承担的上海市经信委人工智能专题专项——基于病理数字切片标注的单病种智能初筛机器人诊断标准数据集(简称“数字切片标准集”)项目,历时两年正式通过上海市经信委验收。


       项目由兰卫医学首席病理专家朱虹光教授领衔、联动上海市7家三级医院,构建覆盖六大癌种、共计27119例肿瘤样本的病理全数字切片(WSI,Whole Slide Imaging)标注数据集。这一里程碑式的成果标志着我国病理AI行业出现了真正的“数据资源”新型基础设施,大规模、标准化、高质量的病理图像标注数据,不仅为病理AI模型研发及调优提供了有力支撑,更有望缩短人工智能产品的研发周期,加速其从实验室走向临床应用的进程,从而在提升我国整体病理诊断水平方面发挥重要的推动作用,为广大患者带来更精准、高效的诊断服务,助力国内病理人工智能产业高质量发展!

0f8ee3758243a975b90d9d1fee4a589.jpg


PART 01 困境与破局:项目诞生背景


       据统计,我国病理医生严重短缺,医患比例远低于国际平均水平,这使得病理诊断工作面临巨大压力。病理人工智能诊断工具被视为解决这一问题的关键突破口,在为病理医生提供初筛服务、提升诊断效率方面具有巨大价值。


       然而,目前行业面临一个重要挑战:缺乏可共享、可重复使用的标准化数据集,用于病理人工智能模型的研发、训练、验证和优化。同时,人工智能医疗器械数据集的管理与评价尚未建立专业标准,缺乏专用的可操作的方法体系。


PART 02 标准与质量:项目实施流程


b7a858a7c360e9aec68785e99d400eb.png


       为此,兰卫医学和朗珈软件在上海市经信委专项支持及中国信通院上海工创中心的指导下,参考推荐性国家标准(GB/T)和推荐性医药行业标准(YY/T),建立了一套符合医学数据库建设要求的严格项目管理体系。项目按照WHO病种目录制定了完整的病理数字切片标注数据库建库标准,包括病例入排标准、制片标准、扫描标准和标注标准等。


       为确保数据质量,项目组织了上海7家三级医院的7位病理主任医师和45位病理医生,经过标准化培训后,通过准入考核和专家评分,正式参与标注工作。标注采用“一标二审三仲裁”的高标准操作流程,并采用透彻未来的AI工具进行标注和验证,最终完成了27119例病理数字切片的标注工作。朱虹光教授指出,这一严格的质控流程虽然要求高,但显著提升了标注结果的准确性,每例病理切片图像的标注都经过经验丰富的病理医生确认并审核,确保了数据集的高质量和可靠性。


       值得一提的是,所有病例不仅标注了肿瘤组织,还针对性地对每张切片上的正常组织进行了标准化标注。内部测试和验证表明,同时使用标注肿瘤组织和正常组织的数字切片进行强监督学习的效果显著优于仅使用肿瘤标注的弱监督学习,进一步提升了数据集的实用性和研究价值。


PART 03 发布与应用:数据价值挖掘


       后续该数据集将通过兰卫医学的“LPD(Labway Pathimages Dataset)病理数字切片标注标准集服务平台”进行对外发布。兰卫医学和朗珈软件诚邀各类产业合作伙伴一起,共同发掘“数字切片标准集”数据在医教研的多种应用可能,例如模型训练和验证、病理数字图书馆、HE和空间转录组的图像对照研究等方向。在模型训练和验证方面,利用该数据集能够训练出特异性敏感性更高的病理AI模型,并在未来数据集不断扩展过程中降低过拟合风险、提升模型的泛化性能;病理数字图书馆的建设及与病理报告系统的结合,这些标注数据可作为珍贵的教学资源,帮助医学生和年轻医生更好地学习病理诊断知识;在HE和空间转录组的图像对照研究中,通过将组织形态学与基因表达数据相结合,有望揭示疾病发生发展的更深层次机制。期待行业生态伙伴能与我们一起创造数智化时代高质量数据集更全面的医疗价值!


0d2abfa1e7f7e553ec83eeb5c2d2663.png


       随着人工智能技术的不断进步,我们有理由相信病理AI将在未来的医疗领域发挥更加重要的作用,兰卫医学和朗珈软件将始终站在行业前沿,携手构建更加完善的AI医疗生态系统,推动病理诊断智能化应用和精准医学的创新发展,为人类健康事业贡献更多智慧和力量!



附:

鸣谢项目参与单位复旦大学附属中山医院

上海市老年医学中心

复旦大学附属华东医院

复旦大学附属闵行医院

复旦大学附属上海市第五人民医院

复旦大学附属浦东医院

上海交通大学医学院附属同仁医院

北京透彻未来科技有限公司


附:

项目依据标准YY-T 1833.2-2022 《人工智能医疗器械 质量要求与评价 第2部分:数据集通用要求》

YY-T 1833.3-2022 《人工智能医疗器械 质量要求与评价 第3部分:数据标注通用要求》

《人工智能医疗器械软件注册指导原则》 (2022年)

GB/T 39725-2020 《信息安全技术 健康医疗数据安全指南》