目的
构建和验证针对中青年肝癌患者根治术后不同时期复发的预测模型,为临床提供更有效的术后监测和干预策略。
方法
选取2017 年1 月至2021 年12 月青岛市第八人民医院接受根治术治疗的341 例原发性肝细胞癌(PHC)作为研究对象,按照一定的纳入和排除标准筛选病例,并收集详细的临床资料。采用逻辑回归(LR)、决策树(DT)、支持向量机(SVM)、随机森林(RF)和极端梯度提升算法(XGBoost)五种机器学习算法构建预测模型,将所有患者分为训练集和验证集,训练集数据通过五折交叉验证的方式训练、优化各模型。采用测试集数据对各模型的预测性能进行评估,评价方法采用受试者工作特征曲线(ROC)进行,统计各模型预测近期复发、远期复发的曲线下面积(AUC)、敏感度、特异度及约登指数。
结果
341 例PHC 患者中,共有173例(50.73%)出现了术后复发,其中78 例(22.87%)为近期复发,95 例(27.86%)为远期复发。近期复发者、远期复发者的中性粒细胞与淋巴细胞比值(NLR)、血小板与淋巴细胞比值(PLR)、丙氨酸转氨酶、天冬氨酸转氨酶、总胆红素、甲胎蛋白水平分别明显高于近期未复发者、远期未复发者,同时近期复发者与近期未复发者、远期复发者与远期未复发者在合并门静脉癌栓、肿瘤包膜完整性、BCLC 分期和肿瘤分化程度等方面均存在显著差异(P<0.05)。模型预测结果显示,XGBoost 算法在预测近期复发(AUC=0.989)和远期复发(AUC=0.983)方面表现出最佳性能,其次是RF(AUC分别为0.926、0.939)和SVM 算法(AUC 分别为0.914、0.904)。
结论
LR、DT、SVM、RF 和XGBoost均能够较好预测中青年肝癌患者根治术后不同时期复发的可能性。其中RF、SVM 和XGBoost 模型的预测性能相对较好,尤其是XGBoost 模型展现出较高的预测准确性。另外,NLR、PLR、相关肝功能指标以及门静脉癌栓、肿瘤包膜完整性、BCLC 分期以及肿瘤分化程度可能是影响复发的预测因素。