SST-DevFlow AI — CVTE 系统软件 AI 工作流自动化平台

// 01 — Harness Definition

什么是 Harness？

≡

来自 learn-claude-code 的定义

        Harness = Tools + Knowledge + Observation + Action Interfaces + Permissions
      

核心洞察：工程师的真正工作不是构建 Agent 本身（那是模型训练的事），而是构建让模型能在特定领域有效运作的 Harness。正如 DeepMind 训练 DQN 玩 Atari，游戏环境本身就是 Harness —— 它提供了状态感知、动作接口、奖励信号。

Harness 不是 prompt 链，不是脆弱的规则树。它是一套结构化的工程环境，让模型的智能真正能够落地。

Layered Architecture

分层 Harness 架构 — 通用层 + 领域扩展层

cvte-harness 不是独立的 Harness，而是基于 Claude Code 的领域特定扩展。 Claude Code 提供通用 AI 能力（文件操作、记忆、多 agent），cvte-harness 在其之上叠加 CVTE 系统软件工作流的专门化能力。

cvte-harness

领域特定扩展

为 CVTE 系统软件工作流提供专门化能力：

Tools

Jira/GitLab/Git 集成

Knowledge

CVTE 规范（CLAUDE.md）

Observation

4 维度质量评估

Actions

5 个 CVTE Skills

Permissions

Jira/GitLab 操作门控

基于 / 扩展

↓

Claude Code

通用 AI Harness

为所有 AI 任务提供基础设施：

Tools

Bash/Read/Write/Grep

Knowledge

记忆/压缩/多 agent

Observation

工具执行观测

Actions

Skills 系统

Permissions

文件操作确认

复用策略： ✓ Tools 复用 + 扩展， ✓ Knowledge 完全复用机制， ✗ Observation 必须自建（Claude Code 只观测执行，不评估领域质量）， ✓ Actions 复用 Skills 系统， ✓ Permissions 复用机制 + 扩展。

Tools

工具接入层

连接外部系统，将 AI 的意图转化为实际动作

jira_get_issue

gitlab_create_mr

git_push_temp_branch

local_compile

+ 11 更多工具

✅ 15 个 MCP 工具完整覆盖

Knowledge

领域知识层

将 CVTE 特有规范主动注入 AI 上下文，避免依赖记忆

CLAUDE.md（自动加载）

分支命名规则

Jira 字段 ID 映射

仓库路径参考表

SKILL.md 经验教训积累

✅ 结构化注入，不靠记忆

Observation

观测评估层

记录执行过程，量化质量，为进化提供数据基础

task_log_start/step/save

4 维度自动评分

失败模式识别

历史数据积累

✅ 双 AI 评估系统

Action Interfaces

动作接口层

定义 AI 可执行的操作边界，通过 Skills 提供结构化工作流

/fix-jira-bug

/merge-to-release

/apply-vendor-patch

/evaluate-task

/evolve

✅ 5 个标准化 Skills

Permissions

权限边界层

高风险不可逆操作设置人工确认门控，防止 AI 误操作

dry_run=True（默认）

push → 预览确认

create_mr → 预览确认

jira_transition → 预览确认

✅ 二阶段确认门控

Knowledge Layer Design

知识分层策略 — CLAUDE.md vs SKILL.md

并非所有知识都值得每次注入。按使用频率分层放置，是 token 效率的关键——全局通用规范放 CLAUDE.md 每次自动加载，任务专属细节放 SKILL.md 按需读取。

CLAUDE.md

每次会话自动加载

适合放置跨多个 Skill 都需要的全局规范：

✓ 工作目录说明（防止误操作）

✓ 分支命名规则（多 Skill 通用）

✓ 临时分支命名规范

✓ 提交消息格式（所有 git 操作）

✓ Permissions 门控规则（全局）

按需 vs 全量

SKILL.md

Skill 调用时按需读取

适合放置该任务专属的细节知识：

fix-jira-bug: Jira 流转必填字段、仓库路径参考

merge-to-release: cherry-pick 前置检查 SOP

apply-vendor-patch: stash + rebase 顺序约定

evolve: 进化引擎分析阈值配置

经验教训: 自进化自动写回，随时间积累

设计原则：全局通用 → CLAUDE.md（每次加载），任务专属 → SKILL.md（按需注入）。避免把所有知识堆进 CLAUDE.md 造成无关 token 消耗。

Evolution Loop

自进化闭环 — 超越标准定义

标准 Harness 是静态的；CVTE Harness 在此基础上增加了自进化机制：每次任务执行后自动评估 → 积累失败模式 → 新会话启动时自动分析 → 自动将 suggestions 写回 SKILL.md → 下次执行时 Knowledge 更丰富。Harness 的能力随时间单调递增。

执行任务

→

自动评估

→

生成建议

→

写回 SKILL.md

↩

// 02 — Context

为什么需要 SST-DevFlow AI？

⚙

什么是 Harness Engineering

模型只提供智能，Harness 让智能真正能用起来。其核心目标是：在特定任务场景下，大幅提升模型的准确率与执行效率。

准确率提升意味着更少的重试和纠错轮次；效率提升意味着达成目标所需的 token 消耗也随之减少 —— 高准确率与低 token 消耗，是同一件事的两面。

实现路径：为 AI 搭建工程环境，提供：

→ 工具接入：连接 Jira、GitLab、Git 等系统
→ 流程约束：结构化 SOP，减少模型自由发挥的误差
→ 上下文感知：技术栈、仓库、用户信息精确注入
→ 质量闭环：执行后自动评估，数据驱动持续优化

✓

功能元开发 — AI 已落地

AI 导入功能元大幅提升了导入效率，这一环节已经有成熟的 AI 实践。

但这仅仅是研发流程的一部分，消耗开发工时更多的缺陷 Debug 环节，至今还没有高效的 AI 解决方案。

缺陷 Debug — 最耗时的环节

每个 Bug 的处理都涉及：分析→修复→提测→合入，横跨研发测试、集成测试、生产测试全链路。

每次还要手动写 commit、填 Jira、创建 MR —— 这些重复劳动占去大量时间。

CVTE 系统软件研发流程全景

功能元开发

→

缺陷 Debug AI NOW

→

研发测试

→

集成测试

→

生产测试

缺陷 Debug 贯穿研发测试、集成测试、生产测试三个阶段，是整个研发流程中 最耗工时 的环节。
CVTE Harness 在此切入：简单问题一步解决，复杂问题节约提交/填写/备注的重复劳动，让研发专注在真正有价值的工作上。

// 03 — Architecture

系统架构 — 三层设计

用户层

Claude Code CLI

用户在 Claude Code 中输入指令（如：帮我修复 PROJ-5678），AI 自动调度对应 Skill

/ fix-jira-bug / merge-to-release / apply-vendor-patch / evaluate-task / evolve

核心层

Skills 工作流引擎

Markdown 定义的结构化工作流，包含决策分支和 SOP 约束，驱动 AI 按规范执行任务

MCP Server

Python 实现的 MCP 工具服务器，提供 Jira/GitLab/Git 深度集成，以及评估系统工具链

jira.py gitlab.py git.py evaluator.py evolution.py

双 AI 评估系统

生成器 AI 执行任务，评估器 AI 对完成度/效率/质量/规范性四维度独立打分，数据积累驱动自进化

集成层

Jira API

获取 Bug 信息、添加评论、流转工单状态

GitLab API

创建 Merge Request，管理多仓库合并

本地 Git

代码提交、分支推送、cherry-pick、补丁应用

本地编译环境

可选的本地编译验证，确保代码提交前质量

// 04 — Skills

5 个核心 Skills — 端到端自动化

🐛

fix-jira-bug

● 全自动 · 3 决策分支 · Bug 修复核心工作流

输入一个 Jira Bug ID，AI 自动完成：获取信息 → 分析代码 → 判断类型 → 修复/流转 → 提交代码 → 创建 MR → 流转 Jira 状态 → 质量评估。对于无法修复的问题（芯片原厂闭源、问题无效），及时终止并给出处理建议，避免无效工作。

决策分支

A1 芯片原厂闭源 → 提示联动原厂ESCALATE

A2 问题无效 → 建议关闭CLOSE

A3 可修复 → 完整 9 步流程FIX

A4 分支执行步骤

01 jira_add_comment (原因分析)

02 jira_transition_status (处理中)

03 修改代码文件

04 local_compile (可选验证)

05 git_commit_with_template

06 git_push_temp_branch

07 提示触发 Jenkins

08 gitlab_create_mr

09 jira_transition_status (提测)

🔀

merge-to-release

● 全自动 · 多仓库 cherry-pick

多仓库并行 cherry-pick 到 release 分支，前置检查 SOP 防止遗漏和冲突，完成后汇总所有 MR 链接并更新 Jira。

→ 前置检查：状态调研 + 依赖分析

→ N 个仓库并行 cherry-pick

→ 完整性验证：N 仓库 → N 个 MR

→ 汇总链接 + 更新 Jira

🔧

apply-vendor-patch

● 全自动 · 芯片原厂补丁合入

stash 保存当前工作 → rebase 同步最新代码 → 应用原厂补丁 → 冲突处理 → 提交代码 → 恢复工作现场。全程保护本地未提交修改。

→ git stash（保护工作区）

→ git rebase（基于最新代码）

→ git apply（应用补丁）

→ 提交 + git stash pop

🔄

evolve

● SessionEnd/Start hook 全自动 · 自进化分析引擎

v1.4.0 起全自动：SessionEnd hook 解析 session JSONL 生成 task-log，SessionStart hook 自动分析未处理数据，识别高频失败模式，生成分级优化建议，形成 AI 能力的持续改进闭环。支持 harness_evolve(task_id=...) 单任务评估。

→ 统计分析：平均分/通过率/耗时

→ 模式识别：高频失败自动浮现

→ 分级建议：高/中/低优先级

→ 生成报告 → 人工审核 → 迭代

⚙

setup

● 交互式引导 · 首次配置 / Token 过期重配

首次使用或 Token 过期时的配置引导 skill。交互式收集 Jira/GitLab Personal Access Token 和用户名缩写，自动安装 SessionEnd/SessionStart hook，验证连接后完成配置。配置保存在 ~/.claude/settings/cvte-harness.json。

→ 检查现有配置是否缺失

→ 交互式收集 Jira / GitLab Token

→ 安装 SessionEnd/Start hook

→ 验证连接，配置完成

// 08 — Get Started

快速开始 — 三步上手

安装

前置要求：Python 3.8+、Claude Code CLI、Jira / GitLab Personal Access Token

bash

# 1. 在 Claude Code 中打开插件管理
$ /plugins

# 2. 方向键 → 切换到 Marketplace，粘贴仓库地址安装
git@gitlab.gz.cvte.cn:jianghaodong/cvte-harness.git

# 3. 重载插件
$ /reload-plugins
Reloaded: cvte-harness

# 4. 首次配置
$ /cvte-harness:setup
✓ SST-DevFlow AI 配置完成

首次使用配置：

→ 运行 /cvte-harness:setup 进行配置引导

→ 填写 Jira / GitLab Personal Access Token

→ 配置保存在 ~/.claude/settings/cvte-harness.json

→ 建议 Token 设置 30～90 天有效期，定期更新

使用示例

在 Claude Code 中，用自然语言描述任务即可

claude code — 修复 Bug

You: 帮我修复 PROJ-1234

# AI 自动执行：
✓ 获取 Jira Bug 信息
✓ 分析代码，定位问题
✓ 判断：可修复
✓ 修改代码并验证
✓ git commit (标准模板)
✓ git push → 创建 MR
✓ Jira 状态 → 提测
✓ 质量评估: 8.5 / 10

claude code — 合入 Release

You: 把 PROJ-1234 合入 release_obm

# AI 自动执行：
✓ 前置检查：3 个涉及仓库
✓ 依赖分析：无冲突
✓ cherry-pick × 3 仓库
✓ 创建 MR × 3
✓ 更新 Jira 备注 + 状态

AI 工作流
SST-DevFlow

什么是 Harness？

为什么需要 SST-DevFlow AI？

系统架构 — 三层设计

5 个核心 Skills — 端到端自动化

15 个 MCP 工具 — 深度系统集成

双 AI 协作 — 执行 + evolve 自进化

路线图 — 从基础到平台

快速开始 — 三步上手

AI 工作流 SST-DevFlow

什么是 Harness？

为什么需要 SST-DevFlow AI？

系统架构 — 三层设计

5 个核心 Skills — 端到端自动化

15 个 MCP 工具 — 深度系统集成

双 AI 协作 — 执行 + evolve 自进化

路线图 — 从基础到平台

快速开始 — 三步上手

AI 工作流
SST-DevFlow