En R, comment puis-je prendre un sous-ensemble de colonnes d'une trame de données, puis d'éliminer les doublons?
-
02-10-2019 - |
Question
Imaginez que j'ai une trame de données avec des données comme ceci:
A | B | C
---+---+---
1 | 2 | a
1 | 2 | b
5 | 5 | a
5 | 5 | b
je veux prendre seulement les colonnes A et B, et je veux supprimer toutes les lignes qui sont devenus des doublons à la suite de l'élimination de toutes les autres colonnes (qui est, colonne C). Donc, mon résultat desied pour le tableau ci-dessus serait:
A | B
---+---
1 | 2
5 | 5
Quelle est la meilleure façon de le faire?
La solution
Si votre data.frame est appelée df, faites ceci:
unique(df[, c("A", "B")])
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow