Skip to content

故障排除命令 (/troubleshoot)

系统化问题诊断和故障排除命令,快速定位和解决技术问题。

核心功能

  • 症状分析: 基于症状描述进行初步诊断
  • 根因分析: 深度挖掘问题的根本原因
  • 解决方案: 提供步骤化的问题解决方案
  • 预防措施: 建议预防类似问题的措施
  • 知识库: 积累常见问题的解决经验

使用语法

bash
/troubleshoot [症状描述] [选项]

诊断类型

  • performance - 性能问题
  • error - 错误和异常
  • connectivity - 连接问题
  • security - 安全问题
  • deployment - 部署问题

主要选项

  • --severity critical|high|medium|low - 问题严重程度
  • --systematic - 系统化诊断流程
  • --logs - 包含日志分析
  • --reproduction - 问题复现步骤
  • --emergency - 紧急处理模式

诊断流程

症状收集

bash
/troubleshoot "网站响应缓慢" --systematic --logs

# 症状分析
# 
# 初步诊断:
# - 问题类型: 性能问题
# - 影响范围: 全站
# - 严重程度: 中等
# 
# 信息收集清单:
# 错误日志分析
# 性能指标检查
# 资源使用监控
# 数据库查询分析
# 网络延迟测试

根因分析

bash
# 深度根因分析
/troubleshoot --root-cause-analysis --systematic

# 根因分析结果
# 
# 可能原因排序:
# 1. 数据库查询性能 (70%概率)
#  - N+1查询问题
#  - 缺少索引优化
# 
# 2. 内存泄漏 (20%概率)
#  - 未释放的事件监听器
#  - 循环引用对象
# 
# 3. 网络瓶颈 (10%概率)
#  - CDN配置问题
#  - 带宽限制

解决方案

步骤化解决

bash
# 生成解决方案步骤
/troubleshoot --solution --step-by-step

# 解决方案执行计划
# 
# Phase 1: 紧急缓解 (5-10分钟)
# □ 重启应用服务器
# □ 清理应用缓存
# □ 启用CDN缓存
# 
# Phase 2: 根本修复 (30-60分钟)  
# □ 优化数据库查询
# □ 添加数据库索引
# □ 修复内存泄漏
# 
# Phase 3: 长期优化 (1-2天)
# □ 实施监控告警
# □ 性能基准测试
# □ 容量规划更新

应急处理

bash
# 紧急问题处理
/troubleshoot --emergency --critical-path

# 紧急处理协议
# 
# 立即行动 (0-5分钟):
# 1. 评估影响范围
# 2. 启动故障响应团队
# 3. 实施临时缓解措施
# 
# 短期修复 (5-30分钟):
# 1. 定位问题根源
# 2. 实施紧急修复
# 3. 验证修复效果
# 
# 恢复监控 (持续):
# 1. 监控系统恢复
# 2. 收集故障数据
# 3. 准备详细报告

知识库集成

历史问题查询

bash
# 查询相似历史问题
/troubleshoot --knowledge-base --similar-issues

# 相似问题记录
# 
# 匹配问题 #1 (95%相似度):
# - 时间: 2023-10-15
# - 症状: 网站响应缓慢
# - 根因: 数据库连接池耗尽
# - 解决: 增加连接池大小,优化查询
# - 耗时: 45分钟
# 
# 经验提取:
# - 检查数据库连接数
# - 监控慢查询日志
# - 验证连接池配置

解决模式识别

bash
# 识别常见解决模式
/troubleshoot --pattern-recognition --best-practices

# 解决模式分析
# 
# 模式: "性能下降"
# ├── 数据库优化 (45%的案例)
# ├── 缓存策略调整 (30%的案例)
# ├── 代码优化 (20%的案例)
# └── 基础设施扩容 (5%的案例)
# 
# 成功率最高: 数据库优化 (90%成功率)

可视化诊断

问题诊断图

bash
# 生成问题诊断流程图
/troubleshoot --visualize --diagnostic-tree

# 🌳 诊断决策树
# 
# 网站缓慢
# ├── 服务器资源充足?
# │   ├── 是 → 检查数据库性能
# │   └── 否 → 扩容服务器资源
# ├── 数据库查询正常?
# │   ├── 是 → 检查网络延迟
# │   └── 否 → 优化查询/添加索引
# └── 缓存命中率正常?
#   ├── 是 → 检查应用逻辑
#   └── 否 → 优化缓存策略

预防措施

预防性建议

bash
# 生成预防措施建议
/troubleshoot --prevention --proactive-measures

# 预防措施建议
# 
# 监控告警:
# - 设置响应时间告警阈值
# - 配置数据库性能监控
# - 实施资源使用率告警
# 
# 定期检查:
# - 每周性能基准测试
# - 每月数据库维护窗口
# - 季度容量规划评估
# 
# 团队培训:
# - 故障处理流程培训
# - 性能优化最佳实践
# - 监控工具使用技能

故障排除命令 - 快速诊断和解决技术问题

Claude Code 使用指南