哪个大数据技术堆栈最适合处理推文,提取/扩展URL以及将(仅)推向第三方系统?

datascience.stackexchange https://datascience.stackexchange.com/questions/76

(注意:从 区域51中的问题列表, ,但是相信这个问题是自我解释的。也就是说,相信我有一个问题的总体意图,因此很可能能够在可能弹出的问题上提出任何问题。)

哪个大数据技术堆栈最适合处理推文,提取/扩展URL以及将(仅)推向第三方系统?

有帮助吗?

解决方案

我建议 Apache Kafka 作为消息商店和您选择的任何流处理解决方案 Apache骆驼 或者 Twitter风暴

许可以下: CC-BY-SA归因
scroll top