在做生信文章分析时,各种数据,各种分析,繁复纷杂,今天我们带大家轻松做一次ROC分析,跟着我一起,往下看:
在生信分析中,ROC分析主要针对存在一组真实的连续型数值数据设定阈值的不同对响应变量(二分类)的影响(真阳性率、假阳性率),它常用于 模型的构建过程中对结果预测的性能的一个评估,我们主要分为两类
一类是:时间依赖性ROC,比如 预后模型中,1、3、5年的ROC曲线
一类是:诊断性的ROC,比如 某基因的表达与癌与癌旁的分类性能
ROC分析常用名词解释:
ROC: receiver operating characteristic,ROC曲线
AUC: area under the ROC curve,曲线下面积
pAUC: partial area under the ROC curve 部分曲线下面积
CI: confidence interval 置信区间
SP: specificity 特异度
SE: sensitivity 灵敏度
数据输入也非常简单,首先我们需要了解 我们绘制的是 诊断类的ROC(标准ROC),还是 时间依赖性ROC.
当绘制未时间依赖性ROC时,我们需要准备 三列数据,一列是 时间,一列是 状态(比如死亡,复发,响应等),一列是 目标值(比如 预后评分、基因表达等)
当绘制的是 标准ROC时,我们需要准备两列数据,一列是 状态(比如:死亡、复发、药物响应、癌与癌旁等),一列是 目标值,比如诊断评分、基因表达等
提交之后即可获得图片结果
方法学写作示例:
关注并在评论区留言“我要生信分析工具”免费领取生信分析工具!