Como dividir colunas desiguais em R
-
10-12-2019 - |
Pergunta
Eu tenho um conjunto de dados que deveria conter 14 colunas, mas quando eu o leio em R ele se apresenta como duas colunas, com as últimas colunas sendo lidas como uma, e são todas separadas por "."
Eu li usando:
dat <- read.table ("/data/GER.female.RAWMACH", cabeçalho = F, sep = " ")
Abaixo forneci a saída:
cabeça (dat)
V1
CARACTERÍSTICA
CASO
CASO
CASO
CASO
CASO
CASO
V2 Marcador .......... ALELES..FREQ1 .... RSQR ... EFFEFT1..O ...... STDERR..waldchisq.pvalue ..... lrchisq.lrpval.ncases .NControls
rs7 TA .9104 .0001 -3,944 0,019 19,634 0,0403 0,8408 0,0403 0,8409 260 446
rs6 AC 0,9114 0,0002 -2,552 0,078 14,349 0,0316 0,8589 0,0316 0,8589 260 446
RS9 CT .8444 .0001 2.772 15.985 15.076 0,0338 0,8541 0,0338 0,8542 260 446
RS5 GA .9164 .0001 -3.683 0,025 18.039 0,0417 0,8382 0,0417 0,8383 260 446
rs2 T C 0,5168 0,0001 -2,466 0,085 10,811 0,0520 0,8195 0,0520 0,8196 260 446
rs1 T G 0,8229 0,0002 -1,727 0,178 12,241 0,0199 0,8878 0,0199 0,8878 260 446
Eu tentei algumas coisas (reescrever a tabela, colsplit) sem sucesso.o que estou perdendo?
Agradeço qualquer sugestão que você possa ter!
Solução
Você pensou que tinha um arquivo separado por tabulações, mas não era.Você também TEM um cabeçalho.Basta usar o separador de espaço em branco padrão, eliminando o sep="\t"
e configuração header=TRUE
.
Outras dicas
É difícil dizer com certeza sem mais informações, mas estou bastante confiante de que a melhor maneira de resolver isso será carregando a tabela corretamente.A menos que a estrutura real dos dados que você está carregando esteja no formato que você está obtendo, você está carregando errado;veja a documentação para read.table
e métodos relacionados, em particular o sep
e header
argumentos.Suponho que isso resolverá seu problema com a importação de dados sem exigir uma limpeza posterior.