新的数据的科学论坛,第一次海报在这里!

这可能是一种特定的问题(希望不要太多,因此),而是一个我想像其他人可能会感兴趣。

我在寻找一种方法,基本上查询审查与这样的事情:

Give me a collection of all of the public repositories that have more than 10 stars, at
least two forks, and more than three committers.

其结果可能采取的任何可行的形式:返回一个转储、网址的网页,等等。它更有可能将包括信息从10,000repos或什么大。

是这类的事情可能使用API或一些其它的预先建立的方式,或要我们建立了自己的定义解决方案,我试图把每一页?如果是,如何可行的是,这如何可能的,我的方法吗?

有帮助吗?

解决方案

我的理解有限,基于简单浏览 但API 文件编制,目前还没有 单API请求 支持 所有 您列出的标准 在一次.然而,我认为你可以使用以下顺序,以便实现我们的目标从你的实例(至少,我会用这种方法):

1) 请求 信息在所有的公共仓库(API返回 摘要陈述 只): https://developer.github.com/v3/repos/#list-all-public-repositories;

2) 循环 通过该列表中的所有公共仓库的检索步骤1中,请求人力资源,并保存它作为新的(具体)名单(这将返回 详细的陈述, 换句话说,所有属性): https://developer.github.com/v3/repos/#get;

3) 循环 通过详细列出的所有储存库、过滤相应的领域,通过您的标准。对你的例子请求时,你会感兴趣的下列属性的 对象: stargazers_count, forks_count.在以过滤器的储存库的数量的提交者,可以使用一个单独的API: https://developer.github.com/v3/repos/#list-contributors.

更新或评论人们更加熟悉。API欢迎!

许可以下: CC-BY-SA归因
scroll top