En R, comment puis-je prendre un sous-ensemble de colonnes d'une trame de données, puis d'éliminer les doublons?

https://stackoverflow.com/questions/3693043

duplicates
r
dataframe
subset

02-10-2019
|

Question

Imaginez que j'ai une trame de données avec des données comme ceci:

 A | B | C
---+---+---
 1 | 2 | a
 1 | 2 | b
 5 | 5 | a
 5 | 5 | b

je veux prendre seulement les colonnes A et B, et je veux supprimer toutes les lignes qui sont devenus des doublons à la suite de l'élimination de toutes les autres colonnes (qui est, colonne C). Donc, mon résultat desied pour le tableau ci-dessus serait:

 A | B
---+---
 1 | 2 
 5 | 5

Quelle est la meilleure façon de le faire?

La solution

Si votre data.frame est appelée df, faites ceci:

unique(df[, c("A", "B")])

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow