Выберите столбцы для тепловой карты в R
Вопрос
Мне снова нужна твоя помощь :)
Я написал сценарий R, который генерирует тепловую карту из заданного файла TXT или XLS, снятого вкладками. На данный момент я удаляю все столбцы, которые я не хочу иметь в тепловой карте вручную в файле XLS. Теперь я хочу автоматизировать его, но я не знаю, как :(
Все интересные столбцы начинаются одинаково во всех файлах XLS, за которым следует отдельное имя:
XLS-FILE 1: L1_TPM_XXXX L2_TPM_XXXX L3_TPM_XXXX
xls-file 2: L1_TPM_XXXX L2_TPM_XXXX L3_TPM_XXXX L4_TPM_XXXX L5_TPM_XXXX
Есть идеи, как выбрать эти столбцы?
Благодарю вас в ожидании, Филипп
Решение
Вы можете использовать (если вы прочитали свои данные в Data.Frame df
):
df <- df[,grep("^L[[:digit:]]+_tpm.*",colnames(df))]
Или вы можете явно написать нужные столбцы:
df <- df[,c("L1_tpm_xxxx","L2_tpm_xxxx","L3_tpm_xxxx")]
так далее...
Следующее ссылка на сайт довольно полезен ;-)
Другие советы
Если вы думаете, что позиции столбца будут исправлены на листах Excel, самое простое решение - просто использовать индексы столбцов. Например, если вы используете read.table для импорта текстового файла, ограниченного вкладками в качестве data.frame, а затем решите, что вы предпочитаете сохранить только первые два столбца, вы можете сделать что-то вроде этого:
data <- read.table("path_to_file.txt", header=T, sep="\t")
data <- data[,1:2]