In R, wie kann ich eine Teilmenge der Spalten eines Datenrahmens nehmen und dann doppelte Zeilen beseitigen?

StackOverflow https://stackoverflow.com/questions/3693043

Frage

Stellen Sie sich vor ich einen Datenrahmen mit Daten wie folgt aussehen:

 A | B | C
---+---+---
 1 | 2 | a
 1 | 2 | b
 5 | 5 | a
 5 | 5 | b

Ich möchte die Spalten A und B nur nehmen, und ich möchte alle Zeilen entfernen, die Duplikate als Ergebnis haben sich alle anderen Spalten zu eliminieren (das heißt, Spalte C). Also mein desied Ergebnis für die Tabelle würde oben sein:

 A | B
---+---
 1 | 2 
 5 | 5 

Was ist der beste Weg, dies zu tun?

War es hilfreich?

Lösung

Wenn Ihr data.frame df genannt wird, dann tun:

unique(df[, c("A", "B")])
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top