Domanda

Come estensione alla nostra grande lista di pubblicamente set di dati disponibili , mi piacerebbe sapere se c'è qualsiasi elenco di set di dati di social network a disposizione del pubblico / strisciare API. Sarebbe molto bello se a fianco con un link per il set di dati / API, sono state aggiunte caratteristiche dei dati disponibili. Tali informazioni dovrebbero essere, e non limitati a:

  • il nome del social network;
  • che tipo di informazioni sugli utenti fornisce (messaggi, profilo, rete di amicizia, ...);
  • se si consente per la scansione dei suoi contenuti tramite un API (e rate: 10 / min, 1k / mese, ...);
  • se si fornisce semplicemente una fotografia di tutto il set di dati.

Tutti i suggerimenti e le ulteriori caratteristiche da aggiungere sono i benvenuti.

È stato utile?

Soluzione

Un paio di parole su reti sociali API. Circa un anno fa ho scritto una recensione di API popolari sociali reti per i ricercatori. Purtroppo, è in russo. Ecco un riassunto:

Twitter ( https://dev.twitter.com/docs/api/1.1 )

  • quasi tutti i dati circa tweets / testi e gli utenti è disponibile;
  • mancanza di dati socio-demografici;
  • grande in streaming API: utile per l'elaborazione del testo in tempo reale;
  • un sacco di wrapper per programing lingue;
  • ottenendo la struttura di rete (collegamenti) è possibile, ma il tempo-costoso (1 richiesta per 1 minuto).

Facebook ( https://developers.facebook.com/docs/reference/api / )

  • limiti di frequenza: circa 1 richiesta per secondo;
  • ben documentato, sandbox presenti;
  • FQL (SQL-like) e «regolare turismo» Graph API;
  • Dati amicizia e le caratteristiche socio-demografiche presenti;
  • un sacco di dati è al di là di Event Horizon : solo amici e amici di dati gli amici è più o meno completa, quasi nulla potrebbero essere indagati circa utente casuale;
  • alcuni bug API strane, e si presenta come nessuno si preoccupa di esso (ad esempio, alcune funzioni disponibili attraverso FQL, ma non attraverso Graph API sinonimo).

Instagram ( http://instagram.com/developer/ )

  • limiti di frequenza: 5000 richieste per ora;
  • in tempo reale API (come lo streaming API per Twitter, ma con foto) - il collegamento ad essa è un po 'difficile: si utilizzano callback;
  • mancanza di dati socio-demografici;
  • le foto, i filtri dei dati disponibili;
  • imperfezioni impreviste (ad esempio, è possibile raccogliere solo 150 Commenti Per inserire / foto).

Foursquare ( https://developer.foursquare.com/overview/ )

  • limiti di frequenza: 5000 richieste per ora;
  • regno dei dati geosocial:)
  • abbastanza chiusa dalle ricerche a causa di problemi di privacy. Per raccogliere i dati checkins una necessità di costruire parser composito lavorare con 4SQ, bit.ly e le API di Twitter in una sola volta;
  • di nuovo:. Mancanza di dati socio-demografici

Google + ( https://developers.google.com/+/api/latest / )

  • circa 5 richieste al secondo (provate a verificare);
  • metodi principali: le attività e le persone;
  • come su Facebook, un sacco di dati personali per l'utente casuale è nascosto;
  • mancanza di dati connessioni utente.

e out-of-concorso: ho rivisto i social network per i lettori russi, e # 1 rete qui è vk.com . E 'tradotto in molte lingue, ma popolare solo in Russia e in altri paesi della CSI. docs API dei collegamenti: http://vk.com/dev/ . E dal mio punto di vista, è la scelta migliore per la ricerca social media homebrew. Almeno, in Russia. Ecco perché:

  • limiti di frequenza: 3 Richieste al secondo;
  • testo pubblico e dei media dei dati disponibili;
  • i dati socio-demografici disponibili: per il livello disponibilità utente casuale è di circa il 60-70%;
  • connessioni tra gli utenti sono anche disponibili: quasi tutte le amicizie dei dati per l'utente casuale è disponibile;
  • alcuni metodi speciali:. Ad esempio, v'è un metodo per ottenere online / offline per l'utente esatto in tempo reale, e si potrebbe costruire pianificazione per il suo pubblico

Altri suggerimenti

Non è un social network per sé, ma StackExchange pubblicare il loro intero dump del database periodicamente:

È possibile estrarre alcune informazioni sociali analizzando quali gli utenti chiedere e rispondere a vicenda. Una cosa bella è che, poiché i messaggi vengono contrassegnati, è possibile analizzare sotto-comunità con facilità.

Un elenco di buon set di dati accessibili al pubblico di social network si possono trovare sul sito web di analisi Progetto Stanford rete:

SNAP dataset

Il sito contiene dati internet social network (Facebook, Twitter, Google Plus), reti di citazione per riviste accademiche, reti di co-acquisto da Amazon e molti altri tipi di reti. Hanno diretto, non orientato, e grafi bipartiti e tutti i set sono istantanee che può essere scaricato in forma compressa.

Un esempio dalla Germania:. Xing un sito simile a LinkedIn, ma limitato ai paesi di lingua tedesca

Link di essa la Centrale sviluppatori: https://dev.xing.com/overview

Consente di accedere a:. Profili utente, conversazioni tra gli utenti (limitati per l'utente stesso), advertisings lavoro, Contatti e contatti di contatti, le notizie dalla rete e alcuni geolocalizzazione API

Sì, ha un'API, ma non ho trovato informazioni circa la velocità. Ma a me sembra, che alcune informazioni è limitata al consenso dell'utente.

Rete Repository ( http://networkrepository.com ) ha tonnellate di social network, grafici web, bio e reti del cervello , ecc Meglio di tutti, hanno anche strumenti di analisi visuali interattivi per confrontare / esplorare i vari social network.

Una piccola collezione di tali collegamenti sono disponibili all'indirizzo qui . Molti di loro sono grafi sociali.

Thai testo da diverse piattaforme di social media + etichette sentimento (positivo, neutro, negativo) .

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top