Comment diviser des colonnes inégales dans R
-
10-12-2019 - |
Question
J'ai un ensemble de données qui devrait contenir 14 colonnes, mais lorsque je le lis dans R, il se présente sous la forme de deux colonnes, ces dernières colonnes étant lues comme une seule, et sont toutes séparées par "."
J'ai lu en utilisant :
dat <- read.table ("/data/GER.female.RAWMACH", en-tête = F, sep = " ")
Ci-dessous, j'ai fourni le résultat :
tête (dat)
V1
TRAIT
CAS
CAS
CAS
CAS
CAS
CAS
V2 marqueur .......... allèles..freq1 ... .NControls
rs7 T A .9104 .0001 -3.944 0.019 19.634 0.0403 0.8408 0.0403 0.8409 260 446
rs6 AC .9114 .0002 -2.552 0.078 14.349 0.0316 0.8589 0.0316 0.8589 260 446
rs9 C T .8444 .0001 2.772 15.985 15.076 0.0338 0.8541 0.0338 0.8542 260 446
rs5 G A .9164 .0001 -3.683 0.025 18.039 0.0417 0.8382 0.0417 0.8383 260 446
rs2 T C .5168 .0001 -2.466 0.085 10.811 0.0520 0.8195 0.0520 0.8196 260 446
rs1 T G .8229 .0002 -1.727 0.178 12.241 0.0199 0.8878 0.0199 0.8878 260 446
J'ai essayé quelques choses (réécriture de la table, colsplit) sans succès.Qu'est-ce que je rate?
J'apprécie toutes les suggestions que vous pourriez avoir!
La solution
Vous pensiez avoir un fichier séparé par des tabulations, mais ce n'était pas le cas.Vous avez également un en-tête.Utilisez simplement le séparateur d'espaces blancs par défaut en supprimant le sep="\t"
et réglage header=TRUE
.
Autres conseils
C'est difficile à dire avec certitude sans plus d'informations, mais je suis convaincu que la meilleure façon de résoudre ce problème sera de charger correctement la table en premier lieu.À moins que la structure réelle des données que vous chargez ne soit sous la forme que vous obtenez, vous la chargez mal ;regardez la documentation pour read.table
et les méthodes associées, en particulier le sep
et header
arguments.Je suppose que cela résoudra votre problème d'importation de données sans nécessiter de nettoyage après coup.