Question

Dans le prolongement de notre grande liste des jeux de données accessibles au public , je voudrais savoir s'il y a une liste des ensembles de données de réseaux sociaux accessibles au public / API rampants. Il serait très bien si à côté d'un lien vers l'ensemble de données / API, les caractéristiques des données disponibles ont été ajoutées. Ces informations devraient être, et ne se limite pas à:

  • le nom du réseau social;
  • quel type d'informations utilisateur, il fournit (postes, profil, réseau d'amitié, ...);
  • si elle permet de ramper son contenu via une API (et notez: 10 / min, 1k / mois, ...);
  • si elle fournit simplement un aperçu de l'ensemble des données.

Toutes les suggestions et autres caractéristiques à ajouter sont très bienvenus.

Était-ce utile?

La solution

Quelques mots sur les API des réseaux sociaux. Il y a un an, j'ai écrit un examen des API de réseaux sociaux populaires pour les chercheurs. Malheureusement, il est en russe. Voici un résumé:

Twitter ( https://dev.twitter.com/docs/api/1.1 )

  • presque toutes les données sur tweets / textes et utilisateurs est disponible;
  • manque de données socio-démographiques;
  • grande API streaming: utile pour le traitement de texte en temps réel;
  • beaucoup d'emballages pour les langues programmant;
  • obtenir la structure du réseau (connexions) est possible, mais le temps coûteux (1 demande par 1 minute).

Facebook ( https://developers.facebook.com/docs/reference/api / )

  • limites de fréquence: environ 1 requête par seconde;
  • bien documenté, présent bac à sable;
  • FQL (type SQL) et API «régulière repos» Graphique;
  • données d'amitié et de caractéristiques socio-démographiques présente;
  • un grand nombre de données est au-delà de horizon des événements : seuls amis et des amis de données d'amis est plus ou moins complète, presque rien ne pouvait être objet d'une enquête sur l'utilisateur aléatoire;
  • quelques bugs étranges de l'API, et ressemble soins personne ne à son sujet (par exemple, certaines caractéristiques disponibles par le biais FQL, mais pas par synonyme API graphique).

Instagram ( http://instagram.com/developer/ )

    taux
  • limites: 5000 demandes par heure;
  • API en temps réel (comme le streaming API pour Twitter, mais avec des photos) - connexion est un peu délicat: callbacks sont utilisés;
  • manque de données socio-démographiques;
  • les photos, les filtres de données disponibles;
  • imperfections inattendues (par exemple, il est possible de recueillir seulement 150 commentaires à poste / photo).

Foursquare ( https://developer.foursquare.com/overview/ )

    taux
  • limites: 5000 demandes par heure;
  • royaume des données géosocial:)
  • tout à fait fermé de recherches en raison des questions de confidentialité. Pour recueillir des données checkins un besoin de construire analyseur composite travailler avec 4sq, bit.ly et API twitter à la fois;
  • encore une fois:. Absence de données sociodémographique

Google + ( https://developers.google.com/+/api/latest / )

  • à environ 5 demandes par seconde (essayez de vérifier);
  • méthodes principales: les activités et les gens;
  • comme sur Facebook, beaucoup de données personnelles pour l'utilisateur aléatoire est caché;
  • manque de données de connexions utilisateur.

Et hors compétition: I réseaux sociaux pour en revue les lecteurs russes et réseau # 1 est ici vk.com . Il est traduit en plusieurs langues, mais populaire seulement en Russie et d'autres pays de la CEI. API docs lien: http://vk.com/dev/ . Et de mon point de vue, il est le meilleur choix pour la recherche sur les médias sociaux homebrew. Au moins, en Russie. Ce pourquoi:

  • limites de fréquence: 3 Demandes par seconde;
  • texte public et des données médias disponibles;
  • données disponibles sociodémographique: pour le niveau de disponibilité de l'utilisateur aléatoire est d'environ 60 à 70%;
  • les connexions entre les utilisateurs sont également disponibles: presque toutes les données amitiés pour l'utilisateur aléatoire est disponible;
  • quelques méthodes spéciales:. Par exemple, il existe une méthode pour obtenir le statut en ligne / hors ligne pour l'utilisateur exact en temps réel, et on pourrait construire le calendrier pour son public

Autres conseils

Il est pas un réseau social en tant que tel, mais StackExchange publier leur vidage de base de données complète périodiquement:

Vous pouvez extraire des informations sociales en analysant les utilisateurs poser et à répondre à l'autre. Une bonne chose est que, puisque les messages sont marqués, vous pouvez analyser les sous-communautés facilement.

Une bonne liste des ensembles de données de réseaux sociaux accessibles au public sont disponibles sur le site Web du projet d'analyse du réseau Stanford:

jeux de données SNAP

Le site contient des données sur les réseaux sociaux internet (Facebook, Twitter, Google Plus), les réseaux de citations des revues universitaires, des réseaux co-achat d'Amazon et plusieurs autres types de réseaux. Ils ont réalisé, undirected et graphiques bipartites et tous les ensembles de données sont des instantanés qui peuvent être téléchargés sous forme compressée.

Un exemple de l'Allemagne. Xing un site similaire à linkedin mais limité aux pays Germanophone

Lien vers ce centre de développeur: https://dev.xing.com/overview

Permet d'accéder à:. Les profils utilisateur, les conversations entre les utilisateurs (limité à l'utilisateur lui-même), Publicitages Job, Contacts et contacts des contacts, des nouvelles du réseau et une api de géolocalisation

Oui, il a un api, mais je ne trouve pas d'informations sur le taux. Mais il me semble que certaines informations sont limitées au consentement de l'utilisateur.

Dépôt du réseau ( http://networkrepository.com ) a des tonnes de réseaux sociaux, des graphiques web, bio et réseaux cérébraux , etc. le meilleur de tous, ils ont aussi des outils d'analyse visuelle interactive pour comparer / explorer les différents réseaux sociaux.

Une petite collection de ces liens se trouve à . Beaucoup d'entre eux sont des graphiques sociaux.

texte thaï de différentes plates-formes de médias sociaux + étiquettes de sentiment (positif, neutre, négatif) .

Licencié sous: CC-BY-SA avec attribution
scroll top