Welcher Big -Data -Technologie -Stack eignet sich am besten für die Verarbeitung von Tweets, das Extrahieren/Erweiterung von URLs und das Schieben (nur) neue Links in das Drittanbietersystem?

datascience.stackexchange https://datascience.stackexchange.com/questions/76

Frage

(Hinweis: Zieh diese Frage aus dem Liste der Fragen in Bereich51, aber glauben Sie, dass die Frage selbsterklärend ist. Trotzdem, glauben Sie, ich bekomme die allgemeine Absicht der Frage und in der Lage, Fragen zu der Frage zu stellen, die möglicherweise auftauchen könnten.)

Welcher Big -Data -Technologie -Stack eignet sich am besten für die Verarbeitung von Tweets, das Extrahieren/Erweiterung von URLs und das Schieben (nur) neue Links in das Drittanbietersystem?

War es hilfreich?

Lösung

Ich würde vorschlagen Apache Kafka als Message Store und jede Stream -Verarbeitungslösung Ihrer Wahl wie Apache Kamel oder Twitter -Sturm

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top