利用GGPLOT或晶格中的surv对象
题
任何人都知道如何在进行生存分析中利用GGPLOT或格子?做一个格子或类似刻面的生存图会很不错。
因此,最终我玩了一场比赛,并找到了一个针对Kaplan-Meier情节的解决方案。对于将列表元素输入数据框架的凌乱代码,我深表歉意,但我无法以另一种方式弄清楚。
注意:它仅适用于两个层层。如果有人知道我如何使用 x<-length(stratum)
要这样做,请告诉我(在Stata中,我可以将其附加到宏观上,在R中的工作方式)。
ggkm<-function(time,event,stratum) {
m2s<-Surv(time,as.numeric(event))
fit <- survfit(m2s ~ stratum)
f$time <- fit$time
f$surv <- fit$surv
f$strata <- c(rep(names(fit$strata[1]),fit$strata[1]),
rep(names(fit$strata[2]),fit$strata[2]))
f$upper <- fit$upper
f$lower <- fit$lower
r <- ggplot (f, aes(x=time, y=surv, fill=strata, group=strata))
+geom_line()+geom_ribbon(aes(ymin=lower,ymax=upper),alpha=0.3)
return(r)
}
解决方案
我一直在使用以下代码 lattice
. 。第一个功能绘制一组的KM曲线,通常将用作 panel.group
功能,第二次添加了整个面板的日志级测试p值:
km.panel <- function(x,y,type,mark.time=T,...){
na.part <- is.na(x)|is.na(y)
x <- x[!na.part]
y <- y[!na.part]
if (length(x)==0) return()
fit <- survfit(Surv(x,y)~1)
if (mark.time){
cens <- which(fit$time %in% x[y==0])
panel.xyplot(fit$time[cens], fit$surv[cens], type="p",...)
}
panel.xyplot(c(0,fit$time), c(1,fit$surv),type="s",...)
}
logrank.panel <- function(x,y,subscripts,groups,...){
lr <- survdiff(Surv(x,y)~groups[subscripts])
otmp <- lr$obs
etmp <- lr$exp
df <- (sum(1 * (etmp > 0))) - 1
p <- 1 - pchisq(lr$chisq, df)
p.text <- paste("p=", signif(p, 2))
grid.text(p.text, 0.95, 0.05, just=c("right","bottom"))
panel.superpose(x=x,y=y,subscripts=subscripts,groups=groups,...)
}
审查指标必须为0-1才能使此代码工作。用法将符合以下几行:
library(survival)
library(lattice)
library(grid)
data(colon) #built-in example data set
xyplot(status~time, data=colon, groups=rx, panel.groups=km.panel, panel=logrank.panel)
如果您只使用'面板=面板。
其他提示
我开始几乎完全按照您在更新的答案中使用的方法。但是,关于幸存的事物令人讨厌的是,它仅标志着更改,而不是每个勾号 - %,3-88%。如果您将其馈入GGPLOT,则您的线条将从0到3倾斜,而不是保持平坦并在3下直接下降。这可能取决于您的应用程序和假设,但这不是经典的KM图。这就是我处理各种阶层的方式:
groupvec <- c()
for(i in seq_along(x$strata)){
groupvec <- append(groupvec, rep(x = names(x$strata[i]), times = x$strata[i]))
}
f$strata <- groupvec
对于它的价值,这就是我最终做到的事情 - 但这也不是真正的km情节,因为我没有计算出KM估计本身本身(尽管我没有审查,所以这是等效的。 .. 我相信)。
survcurv <- function(surv.time, group = NA) {
#Must be able to coerce surv.time and group to vectors
if(!is.vector(as.vector(surv.time)) | !is.vector(as.vector(group))) {stop("surv.time and group must be coercible to vectors.")}
#Make sure that the surv.time is numeric
if(!is.numeric(surv.time)) {stop("Survival times must be numeric.")}
#Group can be just about anything, but must be the same length as surv.time
if(length(surv.time) != length(group)) {stop("The vectors passed to the surv.time and group arguments must be of equal length.")}
#What is the maximum number of ticks recorded?
max.time <- max(surv.time)
#What is the number of groups in the data?
n.groups <- length(unique(group))
#Use the number of ticks (plus one for t = 0) times the number of groups to
#create an empty skeleton of the results.
curves <- data.frame(tick = rep(0:max.time, n.groups), group = NA, surv.prop = NA)
#Add the group names - R will reuse the vector so that equal numbers of rows
#are labeled with each group.
curves$group <- unique(group)
#For each row, calculate the number of survivors in group[i] at tick[i]
for(i in seq_len(nrow(curves))){
curves$surv.prop[i] <- sum(surv.time[group %in% curves$group[i]] > curves$tick[i]) /
length(surv.time[group %in% curves$group[i]])
}
#Return the results, ordered by group and tick - easier for humans to read.
return(curves[order(curves$group, curves$tick), ])
}
不隶属于 StackOverflow