gunzip un flux de fichiers en R?

https://stackoverflow.com/questions/3128422

30-09-2019
|

Question

Je suis en train de créer un R StackOverflow. La sortie est gzip. Par exemple:

readLines("http://api.stackoverflow.com/0.9/stats/", warn=F)
[1] "\037‹\b"                                                                                                                                                                                                                                                                                         
[2] "\030\002úØÛy°óé½\036„iµXäË–[<üt—Zu[\\VmÎHî=ÜÛÝ¹×ýz’Í.äûû÷>ý´\a\177Ýh÷\017îÝÛÙwßÚáÿþ«¼þý\027ÅrÝæÔlgüÀëA±\017›ìŽï{M¤û.\020\037�Ë\"¿’\006³ì\032„Úß9¸ÿ`¼ç÷³*~ÿKêˆð¡\006v¦ð²ýô£�ñÃ�ì+ôU�_\026æ»½�]êt¼·?ÞûÈ4ù%\016~S0^>àe¶ÀG\037½n³éÛôKêç¼¬®‚\016Êê¢úý×u‰fó¶]=º{·aÎšŽ—y{·©î\026‹‹»h5^-/‚W1 |9[UÅ²õ^§�Ç"
[3] ":¬´¿1M\177ð\"0íö¹ñ…YÞLëbÕ*!~â\027\036§çU�®êê¢ÎˆµhòýæÅ´Zn\036S¶Z•ùv[§óm´î�"                                                                                                                                                                                                                      
[4] "Í™tËª^d¥£·üÂ?¾ÿ\033'¿$ù\177"

Y at-il un bon moyen de gunzip cela en R, à court d'écrire la sortie vers un fichier, gunzip'ing, et en les lisant dans?

La solution

Vous pouvez faire:

conn <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
data <- readLines(conn)

Autres conseils

Essayez:

p <- gzcon(url("http://api.stackoverflow.com/0.9/stats/"))
readLines(p)

Idéalement nous devrions dire au serveur que nous pouvons gérer le contenu gzip, savoir des en-têtes HTTP que le contenu est réellement codé gzip puis décompressez que si elle est. La bibliothèque Rbordage peut faire ceci:

library(Rcurl)
getURL("http://api.stackoverflow.com/0.9/stats/",
       .opts=list(encoding="identity,gzip")

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow