我要建一个Lifestreaming应用程序,将涉及拉下大量的饲料,为许多用户使用,及进行数据挖掘和计算机学习算法的结果。再负载平衡的和可扩展的托管听起来像一个适合的系统,最终可能被移动了大量的数据,但它缺乏cron的工作是一个麻烦。我会更好使用Django在一个共同loc和处理我自己的DB扩?

有帮助吗?

解决方案

虽然我不能直接回答你的问题,我的体验的建筑 Microupdater (新闻聚合器收集了几百饲料AppEngine)可以给你一个小小的洞察力。

  • 取饲料。获取大量的饲料cron工作(这是唯一的解决办法,直到SDK1.2.5)不是有效的和可扩展,它有下限的工作频率(说1分钟,所以你只能获取至多60饲料,每小时).和最新的SDK1.2.5, 。API, 我们尚未实现。最好的有前途的办法是 Pubsubhubbub发送的, ,其中你提供一个回调网址和喧哗会通知你的新条目 实时间.并且有是一个 演示执行情况 在AppEngine,你可以玩.

  • 分析供稿。你可能已经知道,分析供稿是cpu密集型的。我用 普遍料分析器 马克朝圣者,在解析大的饲料(说一个公共谷歌阅读器的主题),AppEngine可能无法处理所有条目。我的仪表板有很多这些CPU限的警告。但它可能导致在我无能优化的代码。

完全说,AppEngine还不是一个理想的平台,为生命之源应用程序,但那可以改变未来。

其他提示

当他们提供付费计划时可能会发生变化,但就目前而言,App Engine并不适合CPU密集型应用。它旨在扩展以处理大量请求,而不一定是每个请求的大量计算。我通过相当小的计算遇到了这个问题,我担心随着数据集的增长,我可能不得不开始寻找其他地方。

(这显然已经很老了,只是因为它在相关的Google查询中仍然很高......)

我刚刚开始使用AppEngine,并没有将它用于大量的外部请求。但我知道上面的信息可能现在的效果要差很多,甚至可能都没有。他们自2008年9月起放松了极限 - 查看Aral Balkan的博客,了解他对此有关的初步投诉,以及后来的发展。

如果你的应用程序完全依赖Django,那么App Engine是一个不错的选择。但是,如果您需要添加C-enhanced库,那么您就是一条小溪。 App Engine不支持PIL或ReportLab之类的东西,它们使用C来加快处理时间。我只是提到这一点,因为从长远来看,你可能想用C来加速你的一些例程。

如果您决定使用co-loc,请查看WebFaction.com。他们有很棒的Django / Python支持,他们使用前面提到的lirbaries没有问题。

查看切片主机 :他们销售基于xen的虚拟化服务器实例每月20美元起......

  

我们和你一样。超卖,   表现不佳,古老的主持人   公司。我们把事情带进了我们的   自己的手。我们建了一家托管公司   对于了解他们的东西的人。给   我们一个盒子,给我们带宽,给我们   表现,我们开始工作。快速   机器,RAID-10驱动器,第1层   带宽和root访问权限。管理   使用自定义的Xen VPS后端   确保您的资源   保护和保证。

非常适合启动项目并将其扩展,而不会产生托管提供商或colo的成本。

没有。如果你需要放下很多东西,App Engine就不会那么好用了。您可以在进行离线预处理后将数据放入商店中作为前端使用它,但是在没有做一些真的疯狂的情况下,您在每次请求的〜1秒钟内做不了多少工作的东西。

您自己的托管服务可能会更好。

提取Feed或进行计算不会有问题。但是你很快就要为你的账户付款了。 App引擎包括Django,除了你需要为模型部分使用一些适配器。它肯定会让您免于维护问题。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top