In R, wie kann ich eine Teilmenge der Spalten eines Datenrahmens nehmen und dann doppelte Zeilen beseitigen?
-
02-10-2019 - |
Frage
Stellen Sie sich vor ich einen Datenrahmen mit Daten wie folgt aussehen:
A | B | C
---+---+---
1 | 2 | a
1 | 2 | b
5 | 5 | a
5 | 5 | b
Ich möchte die Spalten A und B nur nehmen, und ich möchte alle Zeilen entfernen, die Duplikate als Ergebnis haben sich alle anderen Spalten zu eliminieren (das heißt, Spalte C). Also mein desied Ergebnis für die Tabelle würde oben sein:
A | B
---+---
1 | 2
5 | 5
Was ist der beste Weg, dies zu tun?
Lösung
Wenn Ihr data.frame df genannt wird, dann tun:
unique(df[, c("A", "B")])
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow