此功能允许系统管理员在人工智能工厂环境中,实时跟踪物理服务器的内存消耗情况。通过汇总来自硬件传感器的信息,该功能提供关键的内存利用率趋势洞察,有助于防止过热或资源耗尽。该工具支持主动的容量规划,并提供异常警报,确保高性能计算任务的持续可用性。
该系统持续轮询物理服务器节点,通过内部硬件传感器收集当前的内存使用情况指标。
数据会被汇总和标准化,以便展示每个应用程序实例或服务器的总体负载情况。
阈值配置用于在内存使用量接近临界容量上限时,触发即时通知。
通过市场部署界面,在目标物理服务器节点上初始化监控代理。
根据预期的工作负载模式和历史内存消耗数据,配置告警阈值。
启用 RAM 指标的实时流式传输,以便在中央仪表盘上进行实时可视化。
每周审查生成的报告,以调整容量规划或根据需要触发扩展操作。
在一个视图中,可直观地展示所有受监控的物理服务器的实时内存图表和历史趋势。
允许管理员根据特定的内存利用率百分比或绝对值上限,设置自定义的警告级别。
提供详细的日志记录,将内存峰值与特定进程或硬件故障关联起来,以便进行根本原因分析。