我们在 Glassfish 应用服务器群集上运行基于Java EE的Web应用程序。传入流量主要是基于XML的应用程序资源表示的RESTful请求,但可能有5%的流量可能用于基于JSON或XHTML / CSS的表示。

我们现在正在研究负载平衡解决方案,以便在群集中的Glassfish实例之间分配传入流量。我们还在研究如何使用memcached卸载集群,memcached是一个内存中的分布式哈希映射,其键是REST资源名称(例如,“/ user / bob”,“/ group / jazzlovers”),其中值是相应的XML表示。

一种听起来很有希望的方法是用一块石头杀死两只鸟并使用轻巧,快速的 nginx HTTP服务器/反向代理。 Nginx将通过首先在memcached中查找其URI来处理每个传入请求,以查看是否已存在未过期的XML表示。如果没有,nginx会将请求发送到其中一个Glassfish实例。 nginx memcached模块在这篇简短的文章中有所描述

使用这种方式对nginx和memcached的总体印象是什么,你对它们有多开心?您认为哪些资源最有助于了解它们?如果你尝试了它们并且它们不适合你的目的,为什么不呢,你用了什么呢?

注意:这是一个相关问题

更新:我后来问过同一问题 ServerFault.com。那里的答案主要是建议nginx的替代方案(有帮助,但间接)。

有帮助吗?

解决方案

假设您有一组应用服务器上游向用户提供数据。

upstream webservices {
    server 10.0.0.1:80;
    server 10.0.0.2:80;
    server 10.0.0.3:80;
}
server {
    ... default nginx stuff ...
    location /dynamic_content {
          memcached_pass localhost:11211;
          default_type   text/html;
          error_page     404 502 = @dynamic_content_cache_miss;
          set $memcached_key $uri;
    }
    location @dynamic_content_cache_miss {
          proxy_pass http://webservices;
    }

上述nginx.conf片段的作用是引导来自 http://example.com/dynamic/ <的所有流量。 / a> *直接到memcached服务器。如果memcache有内容,您的上游服务器将看不到任何流量。

如果缓存命中失败并出现404或502错误(无法在缓存中或无法访问内存缓存),则nginx会将请求传递给上游服务器。由于上游定义中有三个服务器,因此您也可以获得透明的负载平衡代理。

现在唯一需要注意的是,您必须确保后端应用程序服务器将数据保存在memcache中。我使用nginx + memcached + web.py来创建简单的小系统,在相对适中的硬件上每分钟处理数千个请求。

应用程序服务器的一般伪代码对于web.py

是这样的
class some_page:
     def GET(self):
         output = 'Do normal page generation stuff'
         web_url = web.url().encode('ASCII')
         cache.set(web_url, str(output), seconds_to_cache_content)
         return output

上面web.py / pseudo代码中需要记住的重要事项是,来自memcached通过nginx的内容根本无法更改。 nginx使用简单的字符串而不是unicode。如果你在memcached中存储unicode输出,你将在缓存内容的开头和结尾处获得至少奇怪的字符。

我将nginx和memcached用于体育相关的网站,在那里我们获得了大量的流量脉冲,只持续了几个小时。没有nginx和memcached,我无法得到。在实施上述变更后,我们上一次大型七月体育赛事期间的服务器负载从70%下降到0.6%。我不能推荐它。

scroll top