目的 比较随机森林模型和Logistic回归模型在体检人群高尿酸血症预测中的应用效果。方法 选取2 754例体检个体作为研究对象,运用随机森林模型和Logistic回归模型建立高尿酸血症预测模型,采用受试者工作特征曲线下面积评价两种模型的预测效能。 结果 随机森林模型特征变量的重要性分析结果显示,排名前5位的变量依次是血肌酐、三酰甘油、腰围、体质指数、尿素氮;随机森林预测模型的曲线下面积为0.759(95% CI:0.746~0.772),灵敏度为97.2%,特异度为54.5%。Logistic回归分析结果显示,性别、腰围、体质指数、三酰甘油、血肌酐是高尿酸血症发生的影响因素(均P<0.05);Logistic回归预测模型的曲线下面积为0.658(95% CI:0.647~0.669),灵敏度为87.7%,特异度为43.9%。随机森林预测模型曲线下面积优于Logistic回归模型(P<0.05)。结论 Logistic回归模型可直观解释变量对疾病发生的风险度;而随机森林模型对高尿酸血症预测效果较好,可获得各个因素的重要性评分,可以作为Logistic回归预测模型的补充。