Domanda teorica: Data.Table vs Data.Frame con big data
-
31-10-2019 - |
Domanda
So che posso leggere in modo molto grande csv
file molto più veloce con fread
usando il data.table
biblioteca che con read.csv
Questo legge un file come a data.frame
. Tuttavia, dplyr
può eseguire solo operazioni su data.frame
.
Le mie domande sono:
- Perchè era
dplyr
Costruito per funzionare con il più lento delle due strutture di dati? - Quando si lavora con i big data è una buona pratica leggere come
data.table
Quindi converti indata.frame
per esibirsidplyr
operazioni? - C'è un'altra strategia che mi manca?
Nessuna soluzione corretta
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a datascience.stackexchange