-
29-09-2020 - |
题
现在几个月,我们的一台服务器上的PLE已徘徊在200万秒内。如果从日常到一天略有不同,但那里很稳定。
在上周末,我们向服务器添加了12 GB的虚拟RAM和1个虚拟CPU核心。我们没有更改SQL Server中的最大used ram以匹配新的RAM,也不会将新的CPU核心分配给SQL Server。
自这样做,我们的PLE疯狂地波动,每10-30分钟越来越多地介于50到400万秒之间。这些变化不是缓慢的上升或下降。指标直接从非常低到非常高,反之亦然在不到一分钟内。
我们的整体等待时间为服务器很好。闩锁是正常的。缓冲区和计划缓存大小没有更改。似乎没有任何一致的特定查询或查询类型的任何一致模式,排出资源。
我从来没有见过Ple之前这样做。有人可以指出我可能缺少的东西或需要深入了解?
评论的附加信息:
- 我们总共5次CPU,但仅使用3(我们使用3使用3)。
- 我们的总存储器是49gb,SQL的最大值是28GB。
- 我们使用带有x64操作系统的VMware(Windows 2008)。
- 在服务器上有14个用户数据库,主要是250gb左右。
- 缓冲区缓存命中率已达到98 +%,因为这一切都开始。
- 服务器电源计划设置为平衡(不高性能);但是,几年没有改变。有了这一说,我完全同意它应该是高性能。
- 既不是SQL Server错误也不是Windows事件日志显示出普通的任何东西。
- 服务器上的活动在过去几周内没有改变。
- 服务器是numa识别。
MAXDOP
为4,成本阈值为10.
解决方案
我们将存储器从28GB(原始量)撞到40GB,为OS和其他过程留下8GB内存。后来一切都恢复正常,保持稳定。我们的一个DBA推测,SQL Server对其确实可用的内存有多混淆。我已经检查过的总服务器内存,之后,数字是一致的,我在服务器属性中看到,但我发现难以反对
的断言不隶属于 dba.stackexchange