近日,南京信息工程大学—中大医院智慧医疗研究院徐军教授团队成员李瑾博士和王向学博士,分别在Nature合作系列权威期刊《npj Digital Medicine》(中科院一区,Top期刊,影响因子IF=15.357)和《npj Precision Oncology》(影响因子IF=10.092)发表两篇论文。
论文一
题为“Generating synthetic mixed-type longitudinal electronic health records for artificial intelligent applications”的研究论文,我院李瑾老师为第一作者。论文链接:https://www.nature.com/articles/s41746-023-00834-7
论文二
题为“CT radiomic signature predicts survival and chemotherapy benefit in stage I and II HPV-associated oropharyngeal carcinoma”的研究论文,我院王向学老师为参与作者,合作单位为美国凯斯西储大学、埃默里大学、佐治亚理工大学和范德堡大学医学院。论文链接:https://www.nature.com/articles/s41698-023-00404-w
文章内容简介
论文一
研究背景:以电子病历(EHR)为代表的患者健康数据是一种在医疗领域广泛存在的数据类型,其蕴含的巨大价值推动了近年来计算健康信息学研究的突破性进展。然而,对患者数据的隐私保护需求限制了医疗机构的数据共享,导致研究人员难以获取临床数据的访问权限。生成数据(Synthetic data)是一种有效的替代方案,高质量的生成数据能够保留原始数据分布中的特征信息,并可用于下游临床数据挖掘任务。然而,当前面向电子病历的数据生成模型存在局限性,现有方法往往只针对单一数据类型,无法建模高维、复杂临床数据间的相关性。
研究方法:为解决上述问题,本研究基于生成对抗网络(GAN)提出了一种能够同时生成连续型和离散型时序电子病历的数据生成模型,该模型在生成具有异质性、高维度患者时序特征的同时,能够捕捉特征间的潜在关联信息。该模型首先基于多重损失约束下(变分下界、对比学习损失等)的对偶变分自编码器,将存在于不同特征类型变量域的数据,映射至具有统一高阶特征表示的潜空间中;进而,通过耦合循环生成器捕获连续型和离散型时序数据之间的动态关联。
研究结果:本研究验证了所提出的数据生成模型在三个重症监护数据库上的效果(MIMIC-III,eICU,HiRID)。研究结果表明,本研究所提出的时序电子病历数据生成方法在生成数据的真实性、相关性、可用性及隐私性等方面均取得了良好表现。
结论与展望:针对临床电子病历数据收集过程中出现的成本高、周期长等困难,本研究提出的数据生成模型通过提供具有高质量、多类型的生成时序电子数据,帮助研究人员在满足患者数据隐私保护的前提下,更高效地开发医学人工智能模型。未来的研究可进一步拓展数据生成方法适用范围,以适应临床实践中所出现的多种数据模态的需求,从而提升医学人工智能在临床实践中的应用价值。
作者介绍
李瑾,女,浙江大学生物医学工程专业博士,博士期间赴英国牛津大学IBME研究院联合培养。2022年9月起就职于南京信息工程大学。主要研究方向为电子病历数据的二次利用、临床智能辅助决策系统开发等。以第一作者身份在npj Digital Medicine、Artificial Intelligence in Medicine 等领域内Top期刊上发表论文多篇。参与完成国家自然科学基金、国家重点研发计划、英国国家卫生研究院NIHR等科研课题数项。谷歌学术主页:https://scholar.google.com.hk/citations?user=DiFoVRIAAAAJ&hl=zh-CN&oi=sra;ResearchGate主页:https://www.researchgate.net/profile/Li-Jin-38
论文二
研究背景:过去几十年中,人乳头瘤病毒(HPV)相关口咽癌(OPSCC)的发病率显著增加。患有HPV相关OPSCC的患者表现出比患有独立于HPV的OPSCC的患者更好的化疗放疗治疗反应和预后,后者的肿瘤更常与酒精和烟草使用有关。先前的研究表明,与单独放疗相比,同时使用化疗和放疗作为最终治疗方案可以降低高风险口咽癌的局部和区域性复发率。然而,化疗的加入可能会导致治疗相关毒性增加,这对于低风险HPV相关口咽癌患者是一个特别关注的问题。放射组学旨在识别与肿瘤表型和预后相关的微小基于图像的属性,不仅有助于在放射图像识别疾病的存在,而且有助于识别与疾病结果和治疗反应相关的特征。然而,至今还没有一种方法可用于评估这些方法在HPV相关OPSCC患者的化疗效益预测方面的实用性。
研究方法:为解决上述问题,本研究开发了一种预后和预测影像组学图像标记(pRiS),pRiS采用了治疗前CT扫描中原发性咽喉肿瘤内外的定量纹理特征,以预测生存和化疗效益。使用来自4个中心总计491名患者,分别接受放射治疗+化疗或仅放射治疗,我们的目标是调查pRiS(a)是否对AJCC I期和II期HPV相关OPSCC患者的生存具有预测价值,以及(b)是否与化疗效益相关。pRiS在特征提取之前将所有CT图像重新采样为等向性体素大小为1mm,进而提取灰度级强度特征、灰度共生矩阵(GLCM)、Haralick特征、Laws能量、基于Gabor小波的特征和强度梯度方向特征(CoLlAGe)。为了研究pRiS是否为个性化预测OS和DFS增加了增量预后价值,本文通过将pRiS与预后临床因素相结合构建了一个综合放射性标志物计分表(Mrad+c),并将其与临床计分表(Mc)进行比较。
研究结果:本研究发现化疗与放疗联合治疗对于高pRiS患者的总生存期有所改善,而对于低pRiS患者,化疗并没有改善总生存期,这表明这些患者没有从化疗中获得额外的益处,可以考虑减弱治疗。所提出的放射图像特征标记对于I和II期HPV相关口咽癌患者的患者生存和化疗效益具有预测作用。
结论与展望:本研究的创新之处在于:(a) pRiS不仅被证明对OPSCC患者的预后具有预测作用,而且对化疗的附加益处也具有预测作用;(b)相比于分析不同HNSCC亚型的患者,pRiS专门研究了AJCC第8版I和II期HPV相关OPSCC患者中化疗的作用。本研究的发现可以指导未来的研究设计更强大的预测性生物标志物,以实现HPV相关OPSCC的精准治疗。
作者介绍
王向学,男,南京信息工程大学人工智能学院副教授,凯斯西储大学(美国)生物医学工程专业博士。主要研究方向为计算病理、多模态医学数据融合预测癌症预后及治疗响应。以第一作者身份在Science Advances、Lancet Ebiomedicine、Clinical Cancer Research等顶级期刊上发表论文,总引用1000余次。谷歌学术主页:https://scholar.google.com/citations?user=M-h-Qc0AAAAJ&hl=en;中文主页:https://faculty.nuist.edu.cn/wangxiangxue/zh_CN/index.htm