Question théorique: data.able vs data.frame avec les mégadonnées
-
31-10-2019 - |
Question
Je sais que je peux lire dans un très grand csv
déposer beaucoup plus vite avec fread
en utilisant le data.table
bibliothèque qu'avec read.csv
qui lit un fichier en tant que data.frame
. Cependant, dplyr
ne peut effectuer que des opérations sur data.frame
.
Mes questions sont:
- Pourquoi était
dplyr
Construit pour fonctionner avec le plus lent des deux structures de données? - Lorsque vous travaillez avec les mégadonnées, c'est une bonne pratique de lire comme
data.table
puis convertissez-vous àdata.frame
pour jouerdplyr
opérations? - Y a-t-il une autre stratégie qui me manque?
Pas de solution correcte
Licencié sous: CC-BY-SA avec attribution
Non affilié à datascience.stackexchange