Como dividir colunas desiguais em R

https://stackoverflow.com//questions/9638131

10-12-2019
|

Pergunta

Eu tenho um conjunto de dados que deveria conter 14 colunas, mas quando eu o leio em R ele se apresenta como duas colunas, com as últimas colunas sendo lidas como uma, e são todas separadas por "."

Eu li usando:

dat <- read.table ("/data/GER.female.RAWMACH", cabeçalho = F, sep = " ")

Abaixo forneci a saída:

cabeça (dat)

V1
CARACTERÍSTICA
CASO
CASO
CASO
CASO
CASO
CASO

V2 Marcador .......... ALELES..FREQ1 .... RSQR ... EFFEFT1..O ...... STDERR..waldchisq.pvalue ..... lrchisq.lrpval.ncases .NControls
rs7 TA .9104 .0001 -3,944 0,019 19,634 0,0403 0,8408 0,0403 0,8409 260 446

rs6 AC 0,9114 0,0002 -2,552 0,078 14,349 0,0316 0,8589 0,0316 0,8589 260 446

RS9 CT .8444 .0001 2.772 15.985 15.076 0,0338 0,8541 0,0338 0,8542 260 446

RS5 GA .9164 .0001 -3.683 0,025 18.039 0,0417 0,8382 0,0417 0,8383 260 446

rs2 T C 0,5168 0,0001 -2,466 0,085 10,811 0,0520 0,8195 0,0520 0,8196 260 446

rs1 T G 0,8229 0,0002 -1,727 0,178 12,241 0,0199 0,8878 0,0199 0,8878 260 446

Eu tentei algumas coisas (reescrever a tabela, colsplit) sem sucesso.o que estou perdendo?

Agradeço qualquer sugestão que você possa ter!

Solução

Você pensou que tinha um arquivo separado por tabulações, mas não era.Você também TEM um cabeçalho.Basta usar o separador de espaço em branco padrão, eliminando o sep="\t" e configuração header=TRUE.

Outras dicas

É difícil dizer com certeza sem mais informações, mas estou bastante confiante de que a melhor maneira de resolver isso será carregando a tabela corretamente.A menos que a estrutura real dos dados que você está carregando esteja no formato que você está obtendo, você está carregando errado;veja a documentação para read.table e métodos relacionados, em particular o sep e header argumentos.Suponho que isso resolverá seu problema com a importação de dados sem exigir uma limpeza posterior.

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow