阿里云Milvus配置监控告警
阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见。已创建Milvus实例
阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。
背景信息
阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见什么是云监控。
前提条件
已创建Milvus实例,详情请参见快速创建Milvus实例。
开启一键告警
-
进入阿里云Milvus页面。
-
登录阿里云Milvus控制台。
-
在左侧导航栏,单击Milvus实例。
-
在顶部菜单栏处,根据实际情况选择地域。
-
-
在Milvus实例页面,单击实例名称。
-
单击监控告警页签。
-
单击告警设置。
-
在告警设置页面,打开一键告警开关。
默认规则如下表所示。
规则名称
监控项
指标采样周期
报警规则
SystemDefault_acs_milvus_ProcessResidentMemoryUtilization
内存使用率
60秒
连续5个周期平均值 >= 80%,则发出告警。
SystemDefault_acs_milvus_ProcessCPUUtilization
CPU使用率
60秒
连续5个周期平均值 >= 90%,则发出告警。
创建报警规则
-
进入告警设置页面。
-
登录阿里云Milvus控制台。
-
在左侧导航栏,单击Milvus实例。
-
在顶部菜单栏处,根据实际情况选择地域。
-
在Milvus实例页面,单击实例名称。
-
单击监控告警页签。
-
-
在告警设置页面,单击报警规则设置。
-
在报警规则页面,单击创建报警规则。
-
在创建报警规则面板,产品选择向量检索服务Milvus版,资源范围选择全部资源,设置相应的参数,单击确认。
以创建向量检索服务Milvus版的报警规则,详情请参见创建报警规则。
管理报警规则
在告警设置页面,单击报警规则设置,跳转到云监控的报警规则页面,您可以对当前的报警规则执行修改、删除和禁用等操作
创建报警规则后,您可以对其执行修改、禁用、启用和删除操作,您还可以查看报警历史,并及时处理报警资源。
修改报警规则
当已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据所需进行修改。
-
登录云监控控制台。
-
在左侧导航栏,选择报警服务 > 报警规则。
-
在报警规则页面,单击目标报警规则对应操作列的修改。
-
在修改报警规则面板,设置报警规则相关参数。
关于如何设置报警规则的相关参数,请参见报警规则相关参数说明。
-
单击确认。
禁用报警规则
新创建的报警规则的默认状态为正常。当您需要手动停止云产品的服务,进行维护或升级时,可以禁用报警规则,避免因人为变更而收到大量且无用的报警通知。
-
登录云监控控制台。
-
在左侧导航栏,选择报警服务 > 报警规则。
-
禁用报警规则。
-
单个禁用
-
先单击目标报警规则对应操作列的
图标,然后单击禁用。
-
在禁用报警规则确认对话框,单击确认。
-
-
批量禁用
-
先单击目标报警规则前面的复选框,然后单击左下角的禁用。
-
在禁用报警规则确认对话框,单击确认。
-
-
启用报警规则
当您完成云产品的维护或升级后,可以重新启用报警规则。启用报警规则后,自动恢复报警通知。
-
登录云监控控制台。
-
在左侧导航栏,选择报警服务 > 报警规则。
-
启用报警规则。
-
单个启用
-
先单击目标报警规则对应操作列的
图标,然后单击启用。
-
在启用报警规则确认对话框,单击确认。
-
-
批量启用
-
先单击目标报警规则前面的复选框,然后单击左下角的启用。
-
在启用报警规则确认对话框,单击确认。
-
-
删除报警规则
删除目标报警规则后,您将不会收到该报警规则的报警通知。
-
登录云监控控制台。
-
在左侧导航栏,选择报警服务 > 报警规则。
-
删除报警规则。
-
单个删除
-
先单击目标报警规则对应操作列的
图标,再单击删除。
-
在删除报警确认对话框,单击确认。
-
-
批量删除
-
先单击目标报警规则前面的复选框,然后单击左下角的删除。
-
在删除报警确认对话框,单击确认。
-
-
查看报警历史
您可以查看目标报警规则中的报警历史和报警资源详情,及时定位并处理报警资源。
-
登录云监控控制台。
-
在左侧导航栏,选择报警服务 > 报警规则。
-
在报警规则页面,单击目标报警规则对应操作列的报警历史。
您可以查看目标报警规则的详情、报警联系人组、报警历史和报警资源。
更多推荐
所有评论(0)