星球头孢

从外部来源新闻汇总

2020年4月16日

Ceph的yabo亚博体育下载模块性能监视

把吵闹的邻居在他们的地方用“RBD顶”和QoS

杰森Dillaman(红帽)亚博体育

在此之前红帽存储4亚博体育,Ceph的存储管理员还没有进入内置RBD性能监控和指标收集工具。而存储管理员可以监控高级集群或OSD I / O指标,通常情况下这是太粗粒度来确定RBD的图像上运行嘈杂邻居的工作负载的源极。提供最好的解决方法,假设已经获得所有客户机节点的存储管理员,是通过某种自产自销临时外部工具的轮询来自客户端节点的指标。

Ceph的存储4现在集成了通用的度量收集的OSD和MGRS内框架,提供内置的监控,以及新的RBD性能监控工具是建立在这个框架的顶部翻译个人RADOS的对象度量到输入/输出聚集RBD图像指标每秒(IOPS)操作,吞吐量和延迟。这些度量产生和Ceph的簇本身内处理,所以没有必要访问的客户机节点到刮指标。

普罗米修斯出口

其中RBD图像度量可以提取的第一Ceph的组分是通过内置的MGR普罗米修斯Exporter模块。如果尚未启用,该模块可以通过运行该命令启用:

$头孢头孢经理模块使普罗米修斯

需要注意的是RBD指标不是默认的普罗米修斯出口启用。要启用RBD的指标,您必须提供与RBD池的出口列表中的模块。例如,出口指标的一瞥,煤渣,和新星池,运行:

$头孢配置组经理经理/普罗米修斯/ rbd_stats_pools一目了然,煤渣,新星

普罗米修斯出口度量包括读/写操作和字节计数器除了读/写延迟测量。度量出口图像的例子image0在RBD池在这里提供:

#TYPE ceph_rbd_write_ops反击ceph_rbd_write_ops {池= “RBD”,命名空间= “”,形象= “image0”} 684652.0 ...#帮助ceph_rbd_read_ops RBD图像读取计数#TYPE ceph_rbd_read_ops反击ceph_rbd_read_ops {池= “RBD”,命名空间= “”,图像= “image0”} 5175256.0 ...#帮助ceph_rbd_write_bytes RBD图像写入的字节#TYPE ceph_rbd_write_bytes反击ceph_rbd_write_bytes {池= “RBD”,命名空间= “”,形象= “image0”} 3531403264.0 ...#帮助ceph_rbd_read_bytes RBD图像读取字节#TYPE ceph_rbd_read_bytes反击ceph_rbd_read_bytes {池= “RBD”,命名空间= “”,形象= “image0”} 242032795680.0 ...#帮助ceph_rbd_write_latency_sum RBD图像写入延迟(毫秒)总#TYPE ceph_rbd_write_latency_sum计数器ceph_rbd_write_latency_sum {池=“RBD”,命名空间= “”,图像= “image0”} 6886443555662.0 ...#HELP ceph_rbd_write_latency_count RBD图像延迟(毫秒)计数#TYPE ceph_rbd_write_latency_count计数器ceph_rbd_write_latency_count {池= “RBD”,命名空间= “”,图像= “image0” 写入} 684652.0 ...#帮助ceph_rbd_read_latency_sum RBD图像读取延迟时间(毫秒)总#TYPE ceph_rbd_read_latency_sum计数器ceph_rbd_read_latency_sum {池= “RBD”,命名空间= “”,形象= “image0”} 4371224159814.0 ...#帮助ceph_rbd_read_latency_count RBD图像读取延迟时间(毫秒)计数#TYPE ceph_rbd_read_latency_count计数器ceph_rbd_read_latency_count {池= “RBD”,命名空间= “”,形象= “image0”} 5175256.0 ...

如何配置和使用出口国包括模块的文档中的普罗米修斯的更多细节。

仪表板集成

该Ceph的仪表板的块凸起现在包括一个新的yabo亚博体育下载整体绩效子选项卡,其显示嵌入式Grafana高级别RBD度量仪表板。这提供了总体块工作负荷的IOPS,吞吐量和平均延迟的快速在一览图。yabo亚博体育下载它还显示正在使用的最高IOPS和吞吐量,以及以及与所述最高请求等待时间的图像中的前10名的图像 - 的因此绰号“RBD顶”。

image4_19.png

此Grafana仪表盘取决于从上文讨论的MGR普罗米修斯出口由普罗米修斯收集的指标。有关如何配置Ceph的仪表板嵌入式Grafana仪表盘的其他详细信息,请参阅仪表盘文档。

命令行界面

最后,对于喜欢使用命令行存储管理员,RBD的CLI工具已经增加了两个新的行动:RBD PERF图像iotop和RBD PERF图像的iostat。

RBD的CLI指标聚集是由一个新的MGR模块执行,rbd_support,必须在第一次使用前启用:

$头孢头孢经理模块使rbd_support

image5_15_0.png

RBD PERF图像的iostat命令提供的iostat状视图图像,排序由所述可用的指标之一。输出也可以被格式化为JSON或XML供其它工具摄取,和排序列可经由命令行选项来改变。

image1_38_0.png

请注意,这可能需要大约30秒的指标,在​​第一次使用填充。另一种值得注意的发现是,延迟测量没有结束对终端的但不限于的OSD数据路径。作为额外的网络段的延迟应该在任何良好架构的集群是恒定的,这不应该是一个问题。

吵闹的邻居和QoS

在任何虚拟环境中,当一个实例饿死其他情况下共享资源,导致性能问题对他人在相同的基础设施上运行发生吵闹的邻居。由Ceph的存储支持OpenStack的环境观察吵闹的邻居是不常见的,但肯定是可以的。这些事件都曾经真正难以解决的,因为他们需要运营商进行相关的计算和存储数据,并为我们描述了跟踪累积度量 - 直到现在。在Ceph的存储4仪表板新的“RBD顶”视图(正式整体性能窗格)允许一个OpenStack的云或Kubernetes集群的运营商迅速识别最活跃的情况下,集群中,并迅速确定如果工作负荷失常的方式生成负载的异常的水平。

对于客户是需要避免资源匮乏,如对于某些电信基础架构工作负载的情况下,红帽Ceph的和OpenStack的团队创造了使用类似于通过亚马逊应用了容量规划基础的方法提供了确定性的存储性能,部署战略亚博体育AWS弹性块存储yabo亚博体育下载(EBS)存储类机制。

通过结合一个容量规划和锻炼QEMU管理程序节流,我们提供服务质量(QoS)之类的大男孩做的,每GB分配存储的供应一定数量的IOPS,在由所选择的存储服务类定义的速率。

我们2017年5月在介绍这种方法亚博体育红帽峰会OpenStack的峰会在波士顿,并在深度由两个相连的会谈解释。

这IOPS供应策略可确保在指定的所有虚拟化工作负载,必要时的I / O容量未过载和可用。亚博体育红帽Ceph的存储4 LibRBD前端的QoS的形式,它提供了防止资源争用相同能力引入一个新的实现这种机制的直接安装块设备,其中管理程序在LibRBD使用新节流阀不存在。yabo亚博体育下载

迷死人的最后一个位是LibRBD前端的支持服务质量由交付管理仪表板,使运营商定义存储池或一个单独的RBD图像,如在下一图片所示,当到conventintly从GUI配置此机制。

image3_19_0.png

对于CIO的眼睛只

我们加入到Ceph的存储4不同的用途增强RBD监测是简化跨团队动态。在许多IT组织中,计算和存储团队是分开的群体。

随着存储从业者喜欢用自己的舌头牢牢地栽在自己的脸颊,每当应用程序运行缓慢地说,手指首先指向存储。尽管不完全不合理的猜测,它是(幸好)往往不是一种使工作负荷运行缓慢,需要人工操作员进行调查,并确定问题的根本原因的存储。

随着新的监测数据耦合形象标识和负载,现在可以以确定它是否实际上是存储或别的东西,是造成瓶颈违规的工作量,并立即重新路由故障单合适的团队 - 不包括高级专业技术,根本原因分析,延迟...。或不必要的戏剧。

在失控的工作量的情况下,操作员必须执行只是最后一步,并映射煤渣UUID名在RBD映像名称返回给用户友好的煤渣卷名发现,以确定是否有任何顶部的图像是一个她收到该报告有关或共同位于一个谁做(喧闹的邻居的情况)。

不要尝试这种在家里

亚博体育红帽Ceph的存储4可从亚博体育Red Hat的网站。试试你的手与存储今天的未来!

注释?浅谈黑客新闻

跨发布到亚博体育红帽博客

来源:费德里科Lucifredi(Ceph的yabo亚博体育下载模块性能监视

招聘