Question

Cette question a moins à voir avec le code réel, et plus à voir avec les méthodes sous-jacentes.

« patron » Mon mon pseudointernship a demandé que je lui écrire un script qui racler une liste de liens d'un utilisateur de tweet (la liste est « tour une fois par semaine, et il est toujours le même utilisateur) puis publier ladite liste au compte Tumblr de la société.

À l'heure actuelle, je pense à cette structure: La base sera un script bash que les premiers appels un script qui utilise l'API de Twitter pour trouver le poste donné un hashtag et analyser la liste (candidats actuels pour les langues étant Perl, PHP et Ruby, sans ordre particulier). Ensuite, le script enregistre la liste analysable (avec quelques balises) dans un fichier texte, d'où un autre script qui utilise l'API Tumblr formate la liste et l'afficher.

Est-ce une façon raisonnable d'aller sur le faire? Jusqu'à présent, dans la planification que je suis seulement à obtenir le poste Twitter, mais je suis déjà coincé entre l'utilisation de l'API pour récupérer le poste ou tout simplement saisir les aliments qu'ils fournissent et essayer de l'analyser. Je sais que ce n'est pas vraiment un grand projet, mais il est certainement le plus grand que j'ai jamais commencé, donc je suis paralysés par la peur quand il s'agit de prendre des décisions!

Était-ce utile?

La solution

D'après votre description, il n'y a aucune raison que vous ne devriez pas être en mesure de le faire en un seul script, ce qui simplifierait les choses moins qu'il y ait une bonne raison pour transporter les données entre deux scripts. Et avant de vous l'ouverture de connexions manuellement, il y a des bibliothèques écrites pour de nombreuses langues pour les deux Tumblr et Twitter qui peuvent rendre votre travail beaucoup plus facile. Vous devriez certainement essayer de ne pas analyser le flux RSS -. Ils fournissent une API pour une raison *

Je personnellement aller avec Python, car il est rapide de se lever et en cours d'exécution et a de grandes bibliothèques pour de telles choses. Mais si vous n'êtes pas au courant, il existe des bibliothèques disponibles pour Ruby ou Perl trop (PHP moins). Juste Google "bibliothèque {plate-forme} {} langue" - une recherche rapide m'a donné python-tumblr , WWW: Tumblr et rubis tumblr, ainsi que python-twitter , net :: Twitter , et un bijou Ruby " twitter ».

Chacune de ces bibliothèques devrait le rendre facile de se connecter à Twitter pour tirer vers le bas les tweets pour un utilisateur particulier ou hashtag via l'API. Vous pouvez alors l'étape à travers eux, l'analyse syntaxique au besoin, puis utiliser la bibliothèque Tumblr pour les publier sur Tumblr dans le format que vous voulez.

peut le faire manuellement - ouverture et connexions de lecture ou, pire encore, grattage écran, mais il n'y a vraiment aucun sens à faire que si vous avez une bonne bibliothèque disponible - que vous faites - et il est plus sujettes à des problèmes, bizarreries, et les insectes qui passent inaperçus. Et comme je l'ai dit, à moins qu'il ya une bonne raison d'utiliser le script bash intermédiaire, il serait beaucoup plus facile de garder les données dans un seul script, dans un tableau ou une autre structure de données. Si vous avez besoin dans un fichier aussi, vous pouvez simplement écrire quand vous avez terminé, du même script.

  

* La complication possible est ici si vous devez vous authentifier auprès   Twitter - que je ne pense pas que vous faites,   si vous êtes juste un calendrier utilisateur   - ils discontinuera l'authentification de base très bientôt, donc vous   doivent mettre en place un compte OAuth (voir    "Qu'est-ce que OAuth" sur au   dev.twitter.com). Ce n'est pas vraiment une   problème, mais rend les choses un peu plus   compliqué. L'API doit encore être   plus facile que l'analyse du flux RSS.

Autres conseils

Votre approche semble appropriée.

  • Utiliser user_timeline twitter api chercher tous les tweets postés par un utilisateur.
  • Parse la liste fetcned (peuvent utiliser des expressions régulières) pour extraire des liens de tweets et de les stocker dans un fichier externe.
  • Publier ces liens à l'aide de compte tumblr api d'écriture tumblr.

Vous pouvez également suivre la dernière id tweet tiré par les cheveux de Twitter afin que vous puissiez poursuivre l'extraction de cet identifiant tweet.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top