Twitter Data Mining: gradi di separazione
-
16-09-2019 - |
Domanda
Cosa pronti disponibili algoritmi potrei usare per i dati miniera di twitter per scoprire i gradi di separazione tra 2 persone su Twitter.
Come cambia quando il grafico sociale continua a cambiare e aggiornare costantemente.
E poi, c'è qualche discarica di Twitter dati del grafico sociale che ho potuto usare, piuttosto che fare così tante chiamate API per ricominciare.
Soluzione
Non c'era una società che offre un dump del grafico sociale, ma è stata presa verso il basso e non è più disponibile. Come già realizzato -. È un po 'difficile, come sta cambiando tutto il tempo
Mi consiglia di controllare i loro metodi social_graph API in quanto danno la più informazioni con le chiamate API meno.
Altri suggerimenti
Qual è il Data Mining mangimi e posso avere accesso ad esso?
Il Data Mining feed è una versione ampliata della nostra / status / public_timeline metodo API REST. Esso restituisce 600 ultimi stati pubbliche, memorizzati nella cache per un minuto alla volta. Si può richiedere fino a una volta al minuto per ottenere un campione rappresentativo degli stati pubblici su Twitter. Offriamo questo gratuitamente (e senza qualità del servizio garantisce) per i ricercatori e hobbisti. Tutto quello che chiediamo è che si fornisce una breve descrizione della vostra ricerca o di progetto e l'indirizzo IP (es) sarete richiedendo l'alimentazione da; basta compilare questo modulo. Si noti che l'alimentazione di data mining non è destinato a fornire un flusso contiguo di tutti gli aggiornamenti pubblici su Twitter; vedi sopra per ulteriori informazioni sulla prossima soluzione di "firehose".
e anche vedere: Streaming documentazione API
Ci potrebbero essere altri modi di farlo, ma ho appena trascorso gli ultimi 10 minuti cercando di fare qualcosa di simile e inciampato su questo Q.
mi piacerebbe utilizzare un non orientato (e ponderata - come io voglio guardare posizione troppo) graph - utilizzare JGraphT o simile in py; JGraphT è basato su Java, ma comprende diverse algos già scritte.
È quindi possibile utilizzare un algoritmo chiamato BellmanFord; prende un valore intero e cerca il grafico per il percorso più breve con valore intero, e solo valore intero, a differenza di Dijkstra.
http://en.wikipedia.org/wiki/Bellman%E2% 80% 93Ford_algorithm
L'ho usato di recente in un progetto per il routing di volo, l'iterazione fino a trovare il percorso più breve con la più breve 'luppolo' (bordi).