In R, wie kann ich eine Teilmenge der Spalten eines Datenrahmens nehmen und dann doppelte Zeilen beseitigen?

https://stackoverflow.com/questions/3693043

duplicates
r
dataframe
subset

02-10-2019
|

Frage

Stellen Sie sich vor ich einen Datenrahmen mit Daten wie folgt aussehen:

 A | B | C
---+---+---
 1 | 2 | a
 1 | 2 | b
 5 | 5 | a
 5 | 5 | b

Ich möchte die Spalten A und B nur nehmen, und ich möchte alle Zeilen entfernen, die Duplikate als Ergebnis haben sich alle anderen Spalten zu eliminieren (das heißt, Spalte C). Also mein desied Ergebnis für die Tabelle würde oben sein:

 A | B
---+---
 1 | 2 
 5 | 5

Was ist der beste Weg, dies zu tun?

Lösung

Wenn Ihr data.frame df genannt wird, dann tun:

unique(df[, c("A", "B")])

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow