In R, come posso prendere un sottoinsieme di colonne di un frame di dati e quindi eliminare le righe duplicate?

https://stackoverflow.com/questions/3693043

duplicates
r
dataframe
subset

02-10-2019
|

Domanda

Immaginate Ho un frame di dati con i dati in questo modo:

 A | B | C
---+---+---
 1 | 2 | a
 1 | 2 | b
 5 | 5 | a
 5 | 5 | b

voglio prendere solo le colonne A e B, e voglio rimuovere eventuali righe che sono diventati duplicati come risultato di eliminare tutte le altre colonne (cioè, colonna C). Quindi il mio risultato desied per la tabella di cui sopra sarebbe:

 A | B
---+---
 1 | 2 
 5 | 5

Qual è il modo migliore per fare questo?

Soluzione

Se il data.frame si chiama df, quindi fare questo:

unique(df[, c("A", "B")])

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow