问题陈述: 我想创建一个离线数据库来查找在美国销售的n个最有用的书籍的价格/信息(其中n大概是300万左右)。

<强>问题: 所以,我的问题是(我也对这里的其他方法持开放态度),我试图弄清楚如何使用亚马逊AWS下载正在销售的n个最高销售书籍的列表以及关于该书的一些信息(即标题,价格等......)。

到目前为止我做了什么: 首先,这样的事情已经存在(asellertool.com),然而,我认为这将是一个有趣的项目,坦率地说,我们还不够认真,需要支付30美元/月的订阅费。

现在,如果您想要查找一些项目,AWS很棒(而且很简单),但我似乎无法弄清楚如何枚举销售排名。 最初,我希望通过ISBN列举亚马逊所有的书籍。但那也没有。然后我想我可以找到所有ISBN号的列表,但这也是一个死胡同。最后我想我可以创建自己的ISBN编号列表,但是当我做了一些信封计算的后面时,我认为它更好,因为我的解决方案需要大约一年的时间才能通过10个数字空间中的三分之一100 /第二个(无论如何都是矫枉过正的。)

所以,我回到了销售排名,目前看起来似乎也是一个死胡同。所以,如果你有任何想法,我将不胜感激。

有帮助吗?

解决方案

亚马逊有一个您可以使用的数据Feed服务,其中包含基于顶级类别的所有产品的GZipped xml文件。它每天更新一次,总计大约20GB / 110GB的压缩/未压缩数据。由于您只需要书籍,因此更多的是4GB / 31GB。唯一的问题是我不确定谁能够使用这个以及获取帐户所涉及的内容。据我所知,他们没有在他们的网站上列出任何有关此内容的信息,所以你很可能需要联系那里的人来了解更多信息。我们在工作中使用它来处理我们用它们做的事情,这是我必须做的一些最疯狂的xml处理。

其他提示

Amazon E-Commerce Service部分查看 AWS Zone

我想知道您要使用哪一个亚马逊AWS服务?或者你不知道?

为什么需要离线数据库?为什么不对您需要的所有内容发出请求并进行临时缓存?

我也不是程序员,但好奇又便宜。 Asellerstool可能很棒,但是 如果不是亚马逊免费数据库,它们就不会出现。好吧,我想没有人关心 用过的书价?

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top