set di dati pubblicamente disponibili di social network / API
-
16-10-2019 - |
Domanda
Come estensione alla nostra grande lista di pubblicamente set di dati disponibili , mi piacerebbe sapere se c'è qualsiasi elenco di set di dati di social network a disposizione del pubblico / strisciare API. Sarebbe molto bello se a fianco con un link per il set di dati / API, sono state aggiunte caratteristiche dei dati disponibili. Tali informazioni dovrebbero essere, e non limitati a:
- il nome del social network;
- che tipo di informazioni sugli utenti fornisce (messaggi, profilo, rete di amicizia, ...);
- se si consente per la scansione dei suoi contenuti tramite un API (e rate: 10 / min, 1k / mese, ...);
- se si fornisce semplicemente una fotografia di tutto il set di dati.
Tutti i suggerimenti e le ulteriori caratteristiche da aggiungere sono i benvenuti.
Soluzione
Un paio di parole su reti sociali API. Circa un anno fa ho scritto una recensione di API popolari sociali reti per i ricercatori. Purtroppo, è in russo. Ecco un riassunto:
Twitter ( https://dev.twitter.com/docs/api/1.1 )
- quasi tutti i dati circa tweets / testi e gli utenti è disponibile;
- mancanza di dati socio-demografici;
- grande in streaming API: utile per l'elaborazione del testo in tempo reale;
- un sacco di wrapper per programing lingue;
- ottenendo la struttura di rete (collegamenti) è possibile, ma il tempo-costoso (1 richiesta per 1 minuto).
Facebook ( https://developers.facebook.com/docs/reference/api / )
- limiti di frequenza: circa 1 richiesta per secondo;
- ben documentato, sandbox presenti;
- FQL (SQL-like) e «regolare turismo» Graph API;
- Dati amicizia e le caratteristiche socio-demografiche presenti;
- un sacco di dati è al di là di Event Horizon : solo amici e amici di dati gli amici è più o meno completa, quasi nulla potrebbero essere indagati circa utente casuale;
- alcuni bug API strane, e si presenta come nessuno si preoccupa di esso (ad esempio, alcune funzioni disponibili attraverso FQL, ma non attraverso Graph API sinonimo).
Instagram ( http://instagram.com/developer/ )
- limiti di frequenza: 5000 richieste per ora;
- in tempo reale API (come lo streaming API per Twitter, ma con foto) - il collegamento ad essa è un po 'difficile: si utilizzano callback;
- mancanza di dati socio-demografici;
- le foto, i filtri dei dati disponibili;
- imperfezioni impreviste (ad esempio, è possibile raccogliere solo 150 Commenti Per inserire / foto).
Foursquare ( https://developer.foursquare.com/overview/ )
- limiti di frequenza: 5000 richieste per ora;
- regno dei dati geosocial:)
- abbastanza chiusa dalle ricerche a causa di problemi di privacy. Per raccogliere i dati checkins una necessità di costruire parser composito lavorare con 4SQ, bit.ly e le API di Twitter in una sola volta;
- di nuovo:. Mancanza di dati socio-demografici
Google + ( https://developers.google.com/+/api/latest / )
- circa 5 richieste al secondo (provate a verificare);
- metodi principali: le attività e le persone;
- come su Facebook, un sacco di dati personali per l'utente casuale è nascosto;
- mancanza di dati connessioni utente.
e out-of-concorso: ho rivisto i social network per i lettori russi, e # 1 rete qui è vk.com . E 'tradotto in molte lingue, ma popolare solo in Russia e in altri paesi della CSI. docs API dei collegamenti: http://vk.com/dev/ . E dal mio punto di vista, è la scelta migliore per la ricerca social media homebrew. Almeno, in Russia. Ecco perché:
- limiti di frequenza: 3 Richieste al secondo;
- testo pubblico e dei media dei dati disponibili;
- i dati socio-demografici disponibili: per il livello disponibilità utente casuale è di circa il 60-70%;
- connessioni tra gli utenti sono anche disponibili: quasi tutte le amicizie dei dati per l'utente casuale è disponibile;
- alcuni metodi speciali:. Ad esempio, v'è un metodo per ottenere online / offline per l'utente esatto in tempo reale, e si potrebbe costruire pianificazione per il suo pubblico
Altri suggerimenti
Non è un social network per sé, ma StackExchange pubblicare il loro intero dump del database periodicamente:
- dati StackExchange discarica ospitati sul archive.org
- messaggio che descrive lo schema del dump del database
È possibile estrarre alcune informazioni sociali analizzando quali gli utenti chiedere e rispondere a vicenda. Una cosa bella è che, poiché i messaggi vengono contrassegnati, è possibile analizzare sotto-comunità con facilità.
Un elenco di buon set di dati accessibili al pubblico di social network si possono trovare sul sito web di analisi Progetto Stanford rete:
Il sito contiene dati internet social network (Facebook, Twitter, Google Plus), reti di citazione per riviste accademiche, reti di co-acquisto da Amazon e molti altri tipi di reti. Hanno diretto, non orientato, e grafi bipartiti e tutti i set sono istantanee che può essere scaricato in forma compressa.
Un esempio dalla Germania:. Xing un sito simile a LinkedIn, ma limitato ai paesi di lingua tedesca
Link di essa la Centrale sviluppatori: https://dev.xing.com/overview
Consente di accedere a:. Profili utente, conversazioni tra gli utenti (limitati per l'utente stesso), advertisings lavoro, Contatti e contatti di contatti, le notizie dalla rete e alcuni geolocalizzazione API
Sì, ha un'API, ma non ho trovato informazioni circa la velocità. Ma a me sembra, che alcune informazioni è limitata al consenso dell'utente.
Rete Repository ( http://networkrepository.com ) ha tonnellate di social network, grafici web, bio e reti del cervello , ecc Meglio di tutti, hanno anche strumenti di analisi visuali interattivi per confrontare / esplorare i vari social network.
Una piccola collezione di tali collegamenti sono disponibili all'indirizzo qui . Molti di loro sono grafi sociali.
Thai testo da diverse piattaforme di social media + etichette sentimento (positivo, neutro, negativo) .