In R, come posso prendere un sottoinsieme di colonne di un frame di dati e quindi eliminare le righe duplicate?
-
02-10-2019 - |
Domanda
Immaginate Ho un frame di dati con i dati in questo modo:
A | B | C
---+---+---
1 | 2 | a
1 | 2 | b
5 | 5 | a
5 | 5 | b
voglio prendere solo le colonne A e B, e voglio rimuovere eventuali righe che sono diventati duplicati come risultato di eliminare tutte le altre colonne (cioè, colonna C). Quindi il mio risultato desied per la tabella di cui sopra sarebbe:
A | B
---+---
1 | 2
5 | 5
Qual è il modo migliore per fare questo?
Soluzione
Se il data.frame si chiama df, quindi fare questo:
unique(df[, c("A", "B")])
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow