在这个用例中,我需要监视 Twitter 流中是否有带有某些主题标签的推文,然后将这些推文拉出来并存储它们。我正在使用 Twitter4J 和 Twitter Streaming API。用于监控的主题标签经常更改,因此我想每 10 分钟左右刷新一次过滤器。当我刷新时,我只是从数据层中提取所有新的哈希标签并将它们传递给过滤器查询。我的两个问题:

  • 每 10 分钟停止连接并刷新(就 Twitter 速率限制等而言)有什么问题吗?

  • 有什么办法可以防止我丢失在短暂刷新暂停期间发布的推文吗?

提前致谢。

有帮助吗?

解决方案

重新连接的频率不应超过每十分钟一次,否则可能会受到速率限制。您可以在断开旧连接之前建立新连接,这有助于避免数据丢失。请注意,您一次可能只有一个未完成的连接。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top