Determine the optimal cut-point for continuous variables in survival analysis

临床研究中,多数情况下,连续指标与结局的关联不是线性关系,比如血压与心血管疾病发生的关系,可能在血压在升高到一定值后心血管事件发生突然升高,另外连续指标在临床应用时不如分类指标方便,因此临床应用相关指标时总会想办法找到一个正常范围或截断值。对于一般的二分类结局指标,可以用ROC曲线去实现(Youden Index/Cut-Off determination),但对于生存类型的数据,寻找截断值比较困难。下面介绍几种方法。

X-Tile method

x-tile 基本信息

一款为连续变量找cut-off的小软件x-tile,是耶鲁大学开发的单一功能小软件,并且于2004发在了clinical cancer research上。下载安装且不需要特殊设置。

软件打开后界面是很简单:左上角是官网,中间的声明中提示不要用于商业用途。可以操作的只有左下角 Analyze 和右下角 Exit。点击 Analyze后,界面同样极简,此时只能点击左上角 fileopen,弹出对话框。 导入数据 .txt 或是 .xpf 格式。

x-tile的使用说明书可以通过 file - Users Manual 路径找到,或者在文件夹 c:\program files\x-tile\ 中也可以找到。

x-tile的示例数据在文件夹:c:\program files\x-tile\X-tile Sample Data

一旦导入数据,便会在数据所在目录产生一个以 x-tile 开始命名的文件夹,里边包含两个文件:

  • .xpf: 包含xml格式的数据,也就是该软件将你的数据转化成了 xml 格式。在重新分析该数据时,可以直接输入该文件。
  • .set: 包含如何使 x-tile 产生plot的信息。

x-tile 分析属性设置

将文件导入x-tile后,就可以开始对后续的分析属性进行设置了。

  • Min Pop Size: 可作为临床亚群最小的病人数目。

  • Min Event No: 可视为有统计意义的亚群中所需的最小事件数目(如死亡)。

  • Min. Pop. Pct: 总人数中可视为临床有效亚人群的比例。

  • Min Middle Pop Pct: 总人数中可视为临床有效中间亚人群的比例。

  • Random Pop No: 用来做蒙特卡洛p值模拟的随机人群数目。

  • Alpha: 统计显著的临界值。默认0.05。

  • Training to Validation Set Size Ratio: 训练集和验证集的比例。默认1:1。

  • Display Uncorrected P-values: 显示未经矫正的P值。

  • Monte Carlo Simulations:为了避免多个截断值选择问题,x-tile用蒙特卡洛模拟来矫正p值。

    • 交叉验证

    • p值矫正:找到合适的截断值,然后和成千上百的随机人群比较生存差异。

x-tile 分析参数设置

点击 Show X-tile Setup,然后出现一个数据界面。界面最左侧显示列名,选中列名,将在中间显示每列的具体内容。点击右侧的 load 按钮,则选择选中的列作为参数。

更多的详细内容,参见user manual

x-tile 分析结果

x-tile产生的结果包括好几部分,如果在热图中点击左键,则会显示最适合的截断值。注意,x-tile只会对 marker 1 产生plot。

Maxstat

Another method to determine the cut-offs in survival analysis

http://r-addict.com/2016/11/21/Optimal-Cutpoint-maxstat.html

https://github.com/kassambara/survminer/issues/41

CHENYUAN

CHENYUAN
Pursuing the dream and the best future

CHENYUAN Blog Homepage

因为不想遗忘! 在这个信息大爆炸的年代,最重要的是对知识的消化-吸收-重铸。每天学了很多东西,但是理解的多少,以及能够运用多少是日后成功的关键。作为一个PhD,大脑中充斥了太多的东西,同时随着年龄的增长,难免会忘掉很多事情。所以只是为了在众多教程中写一个自己用到的,与自己...… Continue reading