COUCBASE:在群集模式下运行时,CBS-Pillowfight延迟测试的10倍差异可能的可能原因
-
21-12-2019 - |
题
所以我开始了一个简单的测试,
cbs-pillowfight -h localhost -b default -i 1 -I 10000 -T
.
get:
[10717.252368] Run
+---------+---------+---------+---------+
[ 20 - 29]us |## - 257
[ 30 - 39]us |# - 106
[ 40 - 49]us |###################### - 2173
[ 50 - 59]us |################ - 1539
[ 60 - 69]us |######################################## - 3809
[ 70 - 79]us |################ - 1601
[ 80 - 89]us |## - 254
[ 90 - 99]us |# - 101
[100 - 109]us | - 43
[110 - 119]us | - 17
[120 - 129]us | - 48
[130 - 139]us | - 23
[140 - 149]us | - 14
[150 - 159]us | - 5
[160 - 169]us | - 5
[170 - 179]us | - 1
[180 - 189]us | - 3
[210 - 219]us | - 1
[270 - 279]us | - 1
+----------------------------------------
.
然后,通过将此节点添加到另一个i7节点来创建群集。 '默认'桶绝对小于1GB,它有1个副本和2个作家,刷新未设置。
现在,相同的命令生成(使用的两个主机):
- 50%在100-200ns,200-900 ns中的1%,900ns中的49%为“1到9毫秒!” wtf。
添加-r(比率)开关设置为90%套,
- 25%在100-200ns中,900ns内为74%,剩余900ns到“1到9 ms!”
所以似乎写入表现在聚类模式中遭受了很大影响;为什么它可能是如此的大,10倍?网络很干净,没有高载服务运行..
upd1。
忘了添加理想情况:-R 100。
- 25%在100-200ns,900ns中的74%。
这让我思考,即:
- a)基准代码阻塞某处(快速读数显示没有迹象)
- b)服务器正在在套件上做一些未记录的魔法,我无法理解重新配置。复制因子?小型数据集不是那么废话吗?这就是我想在这里问的。
- c)网络问题。但Wireshark没有任何东西。
upd2。
停止两个节点,将它们移动到tmpfs。 对于“正常”的反应,得到20ns的禁止。但慢响应仍然很慢。
..[cut]
50 - 59]us |## - 164
[ 60 - 69]us |#### - 321
[ 70 - 79]us |######## - 561
[ 80 - 89]us |########## - 701
[ 90 - 99]us |############ - 844
[100 - 109]us |########## - 717
[110 - 119]us |####### - 514
[120 - 129]us |##### - 336
[130 - 139]us |### - 230
[140 - 149]us |## - 175
[150 - 159]us |## - 135
[160 - 169]us |# - 81
..[cut]
[930 - 939]us | - 24
[940 - 949]us |## - 139
[950 - 959]us |##### - 339
[960 - 969]us |####### - 474
[970 - 979]us |####### - 534
[980 - 989]us |###### - 467
[990 - 999]us |##### - 342
[ 1 - 9]ms |######################################## - 2681
[ 10 - 19]ms | - 1
..[cut]
.
upd3:屏幕截图。
解决方案
问题是通过在千兆网络上切换到三个节点配置“解决”。
不隶属于 StackOverflow