越来越想库的信息通过不同的标准
-
16-10-2019 - |
题
新的数据的科学论坛,第一次海报在这里!
这可能是一种特定的问题(希望不要太多,因此),而是一个我想像其他人可能会感兴趣。
我在寻找一种方法,基本上查询审查与这样的事情:
Give me a collection of all of the public repositories that have more than 10 stars, at
least two forks, and more than three committers.
其结果可能采取的任何可行的形式:返回一个转储、网址的网页,等等。它更有可能将包括信息从10,000repos或什么大。
是这类的事情可能使用API或一些其它的预先建立的方式,或要我们建立了自己的定义解决方案,我试图把每一页?如果是,如何可行的是,这如何可能的,我的方法吗?
解决方案
我的理解有限,基于简单浏览 但API 文件编制,目前还没有 单API请求 支持 所有 您列出的标准 在一次.然而,我认为你可以使用以下顺序,以便实现我们的目标从你的实例(至少,我会用这种方法):
1) 请求 信息在所有的公共仓库(API返回 摘要陈述 只): https://developer.github.com/v3/repos/#list-all-public-repositories;
2) 循环 通过该列表中的所有公共仓库的检索步骤1中,请求人力资源,并保存它作为新的(具体)名单(这将返回 详细的陈述, 换句话说,所有属性): https://developer.github.com/v3/repos/#get;
3) 循环 通过详细列出的所有储存库、过滤相应的领域,通过您的标准。对你的例子请求时,你会感兴趣的下列属性的 父 对象: stargazers_count, forks_count.在以过滤器的储存库的数量的提交者,可以使用一个单独的API: https://developer.github.com/v3/repos/#list-contributors.
更新或评论人们更加熟悉。API欢迎!