Quale tecnologia stack Big Data è più adatto per la lavorazione di tweets, estrazione / URL espansione e spingendo (solo) i nuovi collegamenti nel sistema di terze parti?

datascience.stackexchange https://datascience.stackexchange.com/questions/76

Domanda

(Nota: Tirato a questa domanda dalla lista di domande in Area51 , ma crede che la domanda si spiega da sé. detto questo, credo ottengo l'intento generale della domanda, e di conseguenza probabilmente in grado di mettere in campo tutte le domande sulla questione che potrebbe pop-up.)

tecnologia stack Quale Big Data è più adatto per la lavorazione di tweets, estrazione / URL espansione e spingendo (solo) nuovi collegamenti nel sistema di terze parti?

È stato utile?

Soluzione

Apache Kafka come archivio di messaggi e qualsiasi soluzione di elaborazione flusso di vostra scelta come Apache Camel o Twitter Tempesta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top