阿里云Milvus提供了告警设置功能,通过对重要的监控指标设置报警规则,可以实时了解实例的运行状况,及时处理潜在风险,保障实例稳定运行。

背景信息

阿里云Milvus的监控报警是通过阿里云云监控产品实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系人组,以便发生报警时,能及时通知到相关联系人。更多信息,请参见什么是云监控

前提条件

已创建Milvus实例,详情请参见快速创建Milvus实例

开启一键告警

  1. 进入阿里云Milvus页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

  2. Milvus实例页面,单击实例名称。

  3. 单击监控告警页签。

  4. 单击告警设置

  5. 告警设置页面,打开一键告警开关。

    image

    默认规则如下表所示。

    规则名称

    监控项

    指标采样周期

    报警规则

    SystemDefault_acs_milvus_ProcessResidentMemoryUtilization

    内存使用率

    60秒

    连续5个周期平均值 >= 80%,则发出告警。

    SystemDefault_acs_milvus_ProcessCPUUtilization

    CPU使用率

    60秒

    连续5个周期平均值 >= 90%,则发出告警。

创建报警规则

  1. 进入告警设置页面。

    1. 登录阿里云Milvus控制台

    2. 在左侧导航栏,单击Milvus实例

    3. 在顶部菜单栏处,根据实际情况选择地域。

    4. Milvus实例页面,单击实例名称。

    5. 单击监控告警页签。

  2. 告警设置页面,单击报警规则设置

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,产品选择向量检索服务Milvus版资源范围选择全部资源,设置相应的参数,单击确认

    以创建向量检索服务Milvus版的报警规则,详情请参见创建报警规则

    image

管理报警规则

告警设置页面,单击报警规则设置,跳转到云监控的报警规则页面,您可以对当前的报警规则执行修改、删除和禁用等操作

创建报警规则后,您可以对其执行修改、禁用、启用和删除操作,您还可以查看报警历史,并及时处理报警资源。

修改报警规则

当已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据所需进行修改。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击目标报警规则对应操作列的修改

  4. 修改报警规则面板,设置报警规则相关参数。

    关于如何设置报警规则的相关参数,请参见报警规则相关参数说明

  5. 单击确认

禁用报警规则

新创建的报警规则的默认状态为正常。当您需要手动停止云产品的服务,进行维护或升级时,可以禁用报警规则,避免因人为变更而收到大量且无用的报警通知。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 禁用报警规则。

    • 单个禁用

      1. 先单击目标报警规则对应操作列的

        更多

        图标,然后单击禁用

      2. 禁用报警规则确认对话框,单击确认

    • 批量禁用

      1. 先单击目标报警规则前面的复选框,然后单击左下角的禁用

      2. 禁用报警规则确认对话框,单击确认

启用报警规则

当您完成云产品的维护或升级后,可以重新启用报警规则。启用报警规则后,自动恢复报警通知。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 启用报警规则。

    • 单个启用

      1. 先单击目标报警规则对应操作列的

        更多

        图标,然后单击启用

      2. 启用报警规则确认对话框,单击确认

    • 批量启用

      1. 先单击目标报警规则前面的复选框,然后单击左下角的启用

      2. 启用报警规则确认对话框,单击确认

删除报警规则

删除目标报警规则后,您将不会收到该报警规则的报警通知。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 删除报警规则。

    • 单个删除

      1. 先单击目标报警规则对应操作列的

        更多

        图标,再单击删除

      2. 删除报警确认对话框,单击确认

    • 批量删除

      1. 先单击目标报警规则前面的复选框,然后单击左下角的删除

      2. 删除报警确认对话框,单击确认

查看报警历史

您可以查看目标报警规则中的报警历史和报警资源详情,及时定位并处理报警资源。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击目标报警规则对应操作列的报警历史

    您可以查看目标报警规则的详情报警联系人组报警历史报警资源

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐