In R, come posso prendere un sottoinsieme di colonne di un frame di dati e quindi eliminare le righe duplicate?

StackOverflow https://stackoverflow.com/questions/3693043

Domanda

Immaginate Ho un frame di dati con i dati in questo modo:

 A | B | C
---+---+---
 1 | 2 | a
 1 | 2 | b
 5 | 5 | a
 5 | 5 | b

voglio prendere solo le colonne A e B, e voglio rimuovere eventuali righe che sono diventati duplicati come risultato di eliminare tutte le altre colonne (cioè, colonna C). Quindi il mio risultato desied per la tabella di cui sopra sarebbe:

 A | B
---+---
 1 | 2 
 5 | 5 

Qual è il modo migliore per fare questo?

È stato utile?

Soluzione

Se il data.frame si chiama df, quindi fare questo:

unique(df[, c("A", "B")])
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top