故障排除命令 (/troubleshoot)
系统化问题诊断和故障排除命令,快速定位和解决技术问题。
核心功能
- 症状分析: 基于症状描述进行初步诊断
- 根因分析: 深度挖掘问题的根本原因
- 解决方案: 提供步骤化的问题解决方案
- 预防措施: 建议预防类似问题的措施
- 知识库: 积累常见问题的解决经验
使用语法
bash
/troubleshoot [症状描述] [选项]诊断类型
performance- 性能问题error- 错误和异常connectivity- 连接问题security- 安全问题deployment- 部署问题
主要选项
--severity critical|high|medium|low- 问题严重程度--systematic- 系统化诊断流程--logs- 包含日志分析--reproduction- 问题复现步骤--emergency- 紧急处理模式
诊断流程
症状收集
bash
/troubleshoot "网站响应缓慢" --systematic --logs
# 症状分析
#
# 初步诊断:
# - 问题类型: 性能问题
# - 影响范围: 全站
# - 严重程度: 中等
#
# 信息收集清单:
# 错误日志分析
# 性能指标检查
# 资源使用监控
# 数据库查询分析
# 网络延迟测试根因分析
bash
# 深度根因分析
/troubleshoot --root-cause-analysis --systematic
# 根因分析结果
#
# 可能原因排序:
# 1. 数据库查询性能 (70%概率)
# - N+1查询问题
# - 缺少索引优化
#
# 2. 内存泄漏 (20%概率)
# - 未释放的事件监听器
# - 循环引用对象
#
# 3. 网络瓶颈 (10%概率)
# - CDN配置问题
# - 带宽限制解决方案
步骤化解决
bash
# 生成解决方案步骤
/troubleshoot --solution --step-by-step
# 解决方案执行计划
#
# Phase 1: 紧急缓解 (5-10分钟)
# □ 重启应用服务器
# □ 清理应用缓存
# □ 启用CDN缓存
#
# Phase 2: 根本修复 (30-60分钟)
# □ 优化数据库查询
# □ 添加数据库索引
# □ 修复内存泄漏
#
# Phase 3: 长期优化 (1-2天)
# □ 实施监控告警
# □ 性能基准测试
# □ 容量规划更新应急处理
bash
# 紧急问题处理
/troubleshoot --emergency --critical-path
# 紧急处理协议
#
# 立即行动 (0-5分钟):
# 1. 评估影响范围
# 2. 启动故障响应团队
# 3. 实施临时缓解措施
#
# 短期修复 (5-30分钟):
# 1. 定位问题根源
# 2. 实施紧急修复
# 3. 验证修复效果
#
# 恢复监控 (持续):
# 1. 监控系统恢复
# 2. 收集故障数据
# 3. 准备详细报告知识库集成
历史问题查询
bash
# 查询相似历史问题
/troubleshoot --knowledge-base --similar-issues
# 相似问题记录
#
# 匹配问题 #1 (95%相似度):
# - 时间: 2023-10-15
# - 症状: 网站响应缓慢
# - 根因: 数据库连接池耗尽
# - 解决: 增加连接池大小,优化查询
# - 耗时: 45分钟
#
# 经验提取:
# - 检查数据库连接数
# - 监控慢查询日志
# - 验证连接池配置解决模式识别
bash
# 识别常见解决模式
/troubleshoot --pattern-recognition --best-practices
# 解决模式分析
#
# 模式: "性能下降"
# ├── 数据库优化 (45%的案例)
# ├── 缓存策略调整 (30%的案例)
# ├── 代码优化 (20%的案例)
# └── 基础设施扩容 (5%的案例)
#
# 成功率最高: 数据库优化 (90%成功率)可视化诊断
问题诊断图
bash
# 生成问题诊断流程图
/troubleshoot --visualize --diagnostic-tree
# 🌳 诊断决策树
#
# 网站缓慢
# ├── 服务器资源充足?
# │ ├── 是 → 检查数据库性能
# │ └── 否 → 扩容服务器资源
# ├── 数据库查询正常?
# │ ├── 是 → 检查网络延迟
# │ └── 否 → 优化查询/添加索引
# └── 缓存命中率正常?
# ├── 是 → 检查应用逻辑
# └── 否 → 优化缓存策略预防措施
预防性建议
bash
# 生成预防措施建议
/troubleshoot --prevention --proactive-measures
# 预防措施建议
#
# 监控告警:
# - 设置响应时间告警阈值
# - 配置数据库性能监控
# - 实施资源使用率告警
#
# 定期检查:
# - 每周性能基准测试
# - 每月数据库维护窗口
# - 季度容量规划评估
#
# 团队培训:
# - 故障处理流程培训
# - 性能优化最佳实践
# - 监控工具使用技能故障排除命令 - 快速诊断和解决技术问题