Pergunta

Eu tenho um conjunto de dados que deveria conter 14 colunas, mas quando eu o leio em R ele se apresenta como duas colunas, com as últimas colunas sendo lidas como uma, e são todas separadas por "."

Eu li usando:

dat <- read.table ("/data/GER.female.RAWMACH", cabeçalho = F, sep = " ")

Abaixo forneci a saída:

cabeça (dat)

V1
CARACTERÍSTICA
CASO
CASO
CASO
CASO
CASO
CASO

V2 Marcador .......... ALELES..FREQ1 .... RSQR ... EFFEFT1..O ...... STDERR..waldchisq.pvalue ..... lrchisq.lrpval.ncases .NControls
rs7 TA .9104 .0001 -3,944 0,019 19,634 0,0403 0,8408 0,0403 0,8409 260 446

rs6 AC 0,9114 0,0002 -2,552 0,078 14,349 0,0316 0,8589 0,0316 0,8589 260 446

RS9 CT .8444 .0001 2.772 15.985 15.076 0,0338 0,8541 0,0338 0,8542 260 446

RS5 GA .9164 .0001 -3.683 0,025 18.039 0,0417 0,8382 0,0417 0,8383 260 446

rs2 T C 0,5168 0,0001 -2,466 0,085 10,811 0,0520 0,8195 0,0520 0,8196 260 446

rs1 T G 0,8229 0,0002 -1,727 0,178 12,241 0,0199 0,8878 0,0199 0,8878 260 446

Eu tentei algumas coisas (reescrever a tabela, colsplit) sem sucesso.o que estou perdendo?

Agradeço qualquer sugestão que você possa ter!

Foi útil?

Solução

Você pensou que tinha um arquivo separado por tabulações, mas não era.Você também TEM um cabeçalho.Basta usar o separador de espaço em branco padrão, eliminando o sep="\t" e configuração header=TRUE.

Outras dicas

É difícil dizer com certeza sem mais informações, mas estou bastante confiante de que a melhor maneira de resolver isso será carregando a tabela corretamente.A menos que a estrutura real dos dados que você está carregando esteja no formato que você está obtendo, você está carregando errado;veja a documentação para read.table e métodos relacionados, em particular o sep e header argumentos.Suponho que isso resolverá seu problema com a importação de dados sem exigir uma limpeza posterior.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top