中国AI杀疯了：医疗AI迈入Harness时代新智元

火爆全网的Harness架构，终于在最难的医疗圈落地了！从单次问诊到全天候赛博名医盯盘，大健康赛道彻底变天。

2026年，AI工程圈最火的一个词，叫Harness。

今年2月，HashiCorp联创Mitchell Hashimoto在博客中率先命名了这个概念。

几天后，OpenAI发布了一份震动行业的实验报告：

3名工程师，5个月，0手写代码，纯靠Codex Agent生成了100万行生产级代码。

紧接着，Martin Fowler撰写深度长文，Anthropic发布长时运行Agent的Harness设计指南。

一夜之间，Harness成了AI工程化最核心的话题。

但当所有讨论都集中在代码生成和通用场景时，一个更尖锐的问题始终悬而未决：

在医疗这个链路最长、风险最高、合规最严的行业里，Harness到底怎么落？

一家中国公司，给出了自己的答案。

就在最近，智诊科技正式发布了WiseClaw 2.0，一套面向医疗健康行业的Agent OS平台。

试用通道：https://s.wisediag.com/dwpl2b1r

底层延续OpenClaw在连接与调度上的能力，上层将Harness的核心理念做成了系统默认值。

它给整个医疗AI行业抛出了一个问题：当Agent开始进入真实业务，平台到底该长什么样？

医疗AI走到2026年，真正的门槛在哪里？

过去几年，医疗AI最被热议的能力是「回答」。

能解读体检报告，能做健康咨询，能生成初步建议——这些确实让人眼前一亮。

但当AI真正推到医疗机构、体检中心、保险公司、健康管理企业和养老服务体系面前时，一组更硬的问题浮出了水面：

AI能持续跑多久？上线三个月后还稳不稳？一条健康建议出了问题，能查到它引用了什么指南、调用了什么工具、用的是哪个版本的知识库吗？关键节点的高风险输出，有人兜底吗？用户的健康管理能跨月、跨年持续发生，还是每次都从头开始？

这些问题，一个比一个现实。

把视角拉回到具体的业务场景，这件事会更直观。

一家慢病管理公司需要的，不是一个聊天机器人。他们要的是一套能持续读取设备数据、识别指标异常、发起分级提醒、记录干预轨迹、必要时无缝拉人接管的系统。

光靠几段漂亮的AI回答，撑不起这种业务。

一家体检机构面对的，也远不止报告解读——把检前问询、套餐推荐、检中提醒、检后解读、历年趋势对比串成一条服务链，让用户每年回来时都能感到「这家机构记得我」，这才是真正的服务壁垒。

药企、特医食品企业、保险机构、养老平台看重的，也绝非某个单点AI功能。

他们要的是更长的用户生命周期、更高频的服务触点、更稳的转化效率。

说到底，医疗AI走到今天，门槛已经清清楚楚落在四个地方：

长时程：服务以月、以年为单位，一轮问答撑不起这类业务；

可追溯：建议从哪来、调了什么工具、用了哪个知识版本，事后都要查得清；

可执行：光生成文本没用，必须接设备、接系统、接流程；

可治理：权限、脱敏、评测、审批、审计，一个都绕不过去。

Harness走热，本质上就是这四个门槛在行业里的集中映射。

当整个行业从「AI有没有用」转向「AI能不能长期、稳定、合规地用」，平台型玩家的价值，就开始迅速抬升。

拆解WiseClaw，把Agent放进生产系统

WiseClaw的底层能力，来自OpenClaw与Harness的协同。

一句话概括它们的分工：OpenClaw让Agent「接得上、调得动、能执行」；Harness让Agent「跑得稳、管得住、追得回」。

这套双引擎底座让WiseClaw成为医疗场景所需要的那种平台：可控、可追溯、可长期交付的运行系统。

健康档案驱动：让服务拥有「长期记忆」

医疗服务最怕每次都从头开始。

刚做完体检，下次再来系统像第一次见面。上周做完慢病随访，下周再聊前面的背景全丢。刚记录过饮食偏好和风险因素，下一轮服务又要重新问一遍。

这种体验，放在医疗场景里几乎是致命的。

WiseClaw把健康档案作为长期服务的核心基础。

对检验值、体检数据、用药史、诊断结论等客观信息，系统采用确定性、受控的方式读写，保障信息准确可靠。

对用户依从性、沟通偏好、生活习惯等服务信息，系统结构化沉淀，并在后续服务中持续更新。

对平台来说，这是一套长期健康档案。

对用户来说，感受到的只有八个字：「系统终于记得我了」。

三层流水线：把医疗风险控制在流程里

医疗场景很少存在「一步到位」的任务。

硬把所有任务塞给一个Agent，表面看省事，实际上最容易在关键节点失控。

WiseClaw将Agent的工作过程拆成三层清晰链路：

Triage分诊识别，负责识别用户意图、服务场景和风险等级；

Clinical临床执行，在受控的数据、知识和工具范围内生成候选方案；

Evaluator校验拦截，通过确定性规则、医学红线和业务门禁对输出进行把关。

关键节点还可以随时插入人工复核和审批，让高风险动作始终处在可控范围内。

这套设计带来的价值非常现实：企业可以把风险真正收进流程里，减少对单次模型输出的依赖，也让AI上线从「试试看」走向「敢用、可管」。

心跳引擎：从被动问答走向持续运行

医疗和健康管理服务最需要的，恰恰是主动提醒、持续跟进和长期干预。

很多风险要提前发现，很多服务节点要主动触发，很多管理动作要跨时间持续执行。

只靠用户主动提问，服务深度很难做出来。

WiseClaw通过「心跳引擎」，让系统从会话驱动升级为时间、事件和数据共同驱动。

用户指标异常时系统主动触发提醒，复查时间临近时服务流程自动唤醒，慢病指标连续波动时平台发起风险提示，用户长期未完成健康任务时系统进行干预触达。

对企业来说，这意味着更低的边际成本、更长的服务链路，以及更稳定的运营抓手。

医疗Agent由此从「等用户来问」，走向真正持续运行的健康服务系统。

全链路可观测：让每一次服务都可追溯

在医疗行业，答得像不像专家只是起点。

更关键的问题永远是：这条建议依据什么给出？引用了哪条指南？用了哪个版本的知识？有没有低置信度提示？事后能不能回放？

WiseClaw将对话、工具调用、知识引用、版本信息、流程节点、风险判断等信息结构化记录，形成完整Trace。

企业可以通过运行看板、风险审批、人机协同门禁、审计回放等能力，对Agent的运行过程进行管理。

这个动作看起来像是「多展示一点信息」，本质上是在补医疗AI最缺的那块底座：可信。

五个「试金石场景」

WiseClaw到底能不能打？

医疗AI能否成立，最终要看它能否在真实场景中产生价值。

值得注意的是，WiseClaw这次重点发力的，是用户感知更强、服务周期更长、商业空间更大的院外高频场景——

体检、健康硬件、慢病营养、家庭医生、保险养老。

这些场景共同指向一个趋势：医疗服务正在从低频、单点、人工驱动，走向持续、主动、智能化运营。

场景一：名医AI「分身术」

用户最朴素的需求往往也最难满足：能不能随时问？能不能有人持续跟进？能不能得到一个了解自己情况的健康建议？

然而，优质医生资源天然稀缺，线下的单次问诊难以实现长效闭环。

WiseClaw支持名医AI分身和数字家庭医生，可以把专家诊疗逻辑、健康档案、长期记忆和多终端交互结合起来，让用户在H5、小程序、App等入口获得连续的咨询和随访服务，有记忆，有逻辑，有温度。

在用户侧，我们获得了一位「随叫随到」的专属医生。