Domanda

Come faccio a scegliere le chiavi giuste per data.table oggetti?

Le considerazioni sono simili a quelle per RDBMS? La mia prima ipotesi è stata quella di dare un'occhiata a qualche documentazione su indici e chiavi per RDBMS. Google ha inventato questo utile stackoverflow domanda relativo a Oracle.

Le considerazioni da quella risposta si applicano a data.Tables? Forse ad eccezione di coloro che si riferiscono alle dichiarazioni di tipo di aggiornamento, inserire o eliminare? Immagino che il nostro data.tables Gli oggetti non saranno davvero usati in quel modo.

Sto cercando di mettere la testa su queste cose usando la documentazione ed esempi, ma non ho visto alcuna discussione sulla selezione chiave.

PS: grazie a @crayola puntato me verso il data.table pacchetto in primo luogo!

È stato utile?

Soluzione

Non sono sicuro che questa sia una risposta molto utile, ma dal momento che mi menziono nella domanda dirò comunque cosa penso. Ma ricorda che sono un po 'un data.table Newbie me stesso.

Personalmente utilizzo le chiavi solo quando c'è un chiaro vantaggio per questo, ad esempio unendo i dati o dove sembra chiaro che farlo accelererà le cose (ad esempio sottolineare ripetutamente su una variabile). Ma per quanto ne sappia, a volte non c'è vero bisogno di definire le chiavi; Il pacchetto è già più veloce di data.frame senza chiavi.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top