中国AI杀疯了:医疗AI迈入Harness时代新智元

5/7/2026

火爆全网的Harness架构,终于在最难的医疗圈落地了!从单次问诊到全天候赛博名医盯盘,大健康赛道彻底变天。

2026年,AI工程圈最火的一个词,叫Harness。

今年2月,HashiCorp联创Mitchell Hashimoto在博客中率先命名了这个概念。

几天后,OpenAI发布了一份震动行业的实验报告:

3名工程师,5个月,0手写代码,纯靠Codex Agent生成了100万行生产级代码。

紧接着,Martin Fowler撰写深度长文,Anthropic发布长时运行Agent的Harness设计指南。

一夜之间,Harness成了AI工程化最核心的话题。

但当所有讨论都集中在代码生成和通用场景时,一个更尖锐的问题始终悬而未决:

在医疗这个链路最长、风险最高、合规最严的行业里,Harness到底怎么落?

一家中国公司,给出了自己的答案。

就在最近,智诊科技正式发布了WiseClaw 2.0,一套面向医疗健康行业的Agent OS平台。

试用通道:https://s.wisediag.com/dwpl2b1r

底层延续OpenClaw在连接与调度上的能力,上层将Harness的核心理念做成了系统默认值。

它给整个医疗AI行业抛出了一个问题:当Agent开始进入真实业务,平台到底该长什么样?

医疗AI走到2026年,真正的门槛在哪里?

过去几年,医疗AI最被热议的能力是「回答」。

能解读体检报告,能做健康咨询,能生成初步建议——这些确实让人眼前一亮。

但当AI真正推到医疗机构、体检中心、保险公司、健康管理企业和养老服务体系面前时,一组更硬的问题浮出了水面:

AI能持续跑多久?上线三个月后还稳不稳?一条健康建议出了问题,能查到它引用了什么指南、调用了什么工具、用的是哪个版本的知识库吗?关键节点的高风险输出,有人兜底吗?用户的健康管理能跨月、跨年持续发生,还是每次都从头开始?

这些问题,一个比一个现实。

把视角拉回到具体的业务场景,这件事会更直观。

一家慢病管理公司需要的,不是一个聊天机器人。他们要的是一套能持续读取设备数据、识别指标异常、发起分级提醒、记录干预轨迹、必要时无缝拉人接管的系统。

光靠几段漂亮的AI回答,撑不起这种业务。

一家体检机构面对的,也远不止报告解读——把检前问询、套餐推荐、检中提醒、检后解读、历年趋势对比串成一条服务链,让用户每年回来时都能感到「这家机构记得我」,这才是真正的服务壁垒。

药企、特医食品企业、保险机构、养老平台看重的,也绝非某个单点AI功能。

他们要的是更长的用户生命周期、更高频的服务触点、更稳的转化效率。

说到底,医疗AI走到今天,门槛已经清清楚楚落在四个地方:

长时程: 服务以月、以年为单位,一轮问答撑不起这类业务;

可追溯: 建议从哪来、调了什么工具、用了哪个知识版本,事后都要查得清;

可执行: 光生成文本没用,必须接设备、接系统、接流程;

可治理: 权限、脱敏、评测、审批、审计,一个都绕不过去。

Harness走热,本质上就是这四个门槛在行业里的集中映射。

当整个行业从「AI有没有用」转向「AI能不能长期、稳定、合规地用」,平台型玩家的价值,就开始迅速抬升。

拆解WiseClaw,把Agent放进生产系统

WiseClaw的底层能力,来自OpenClaw与Harness的协同。

一句话概括它们的分工:OpenClaw让Agent「接得上、调得动、能执行」;Harness让Agent「跑得稳、管得住、追得回」。

这套双引擎底座让WiseClaw成为医疗场景所需要的那种平台:可控、可追溯、可长期交付的运行系统。

健康档案驱动:让服务拥有「长期记忆」

医疗服务最怕每次都从头开始。

刚做完体检,下次再来系统像第一次见面。上周做完慢病随访,下周再聊前面的背景全丢。刚记录过饮食偏好和风险因素,下一轮服务又要重新问一遍。

这种体验,放在医疗场景里几乎是致命的。

WiseClaw把健康档案作为长期服务的核心基础。

对检验值、体检数据、用药史、诊断结论等客观信息,系统采用确定性、受控的方式读写,保障信息准确可靠。

对用户依从性、沟通偏好、生活习惯等服务信息,系统结构化沉淀,并在后续服务中持续更新。

对平台来说,这是一套长期健康档案。

对用户来说,感受到的只有八个字:「系统终于记得我了」。

三层流水线:把医疗风险控制在流程里

医疗场景很少存在「一步到位」的任务。

硬把所有任务塞给一个Agent,表面看省事,实际上最容易在关键节点失控。

WiseClaw将Agent的工作过程拆成三层清晰链路:

Triage分诊识别,负责识别用户意图、服务场景和风险等级;

Clinical临床执行,在受控的数据、知识和工具范围内生成候选方案;

Evaluator校验拦截,通过确定性规则、医学红线和业务门禁对输出进行把关。

关键节点还可以随时插入人工复核和审批,让高风险动作始终处在可控范围内。

这套设计带来的价值非常现实:企业可以把风险真正收进流程里,减少对单次模型输出的依赖,也让AI上线从「试试看」走向「敢用、可管」。

心跳引擎:从被动问答走向持续运行

医疗和健康管理服务最需要的,恰恰是主动提醒、持续跟进和长期干预。

很多风险要提前发现,很多服务节点要主动触发,很多管理动作要跨时间持续执行。

只靠用户主动提问,服务深度很难做出来。

WiseClaw通过「心跳引擎」,让系统从会话驱动升级为时间、事件和数据共同驱动。

用户指标异常时系统主动触发提醒,复查时间临近时服务流程自动唤醒,慢病指标连续波动时平台发起风险提示,用户长期未完成健康任务时系统进行干预触达。

对企业来说,这意味着更低的边际成本、更长的服务链路,以及更稳定的运营抓手。

医疗Agent由此从「等用户来问」,走向真正持续运行的健康服务系统。

全链路可观测:让每一次服务都可追溯

在医疗行业,答得像不像专家只是起点。

更关键的问题永远是:这条建议依据什么给出?引用了哪条指南?用了哪个版本的知识?有没有低置信度提示?事后能不能回放?

WiseClaw将对话、工具调用、知识引用、版本信息、流程节点、风险判断等信息结构化记录,形成完整Trace。

企业可以通过运行看板、风险审批、人机协同门禁、审计回放等能力,对Agent的运行过程进行管理。

这个动作看起来像是「多展示一点信息」,本质上是在补医疗AI最缺的那块底座:可信。

五个「试金石场景」

WiseClaw到底能不能打?

医疗AI能否成立,最终要看它能否在真实场景中产生价值。

值得注意的是,WiseClaw这次重点发力的,是用户感知更强、服务周期更长、商业空间更大的院外高频场景——

体检、健康硬件、慢病营养、家庭医生、保险养老。

这些场景共同指向一个趋势:医疗服务正在从低频、单点、人工驱动,走向持续、主动、智能化运营。

场景一:名医AI「分身术」

用户最朴素的需求往往也最难满足:能不能随时问?能不能有人持续跟进?能不能得到一个了解自己情况的健康建议?

然而,优质医生资源天然稀缺,线下的单次问诊难以实现长效闭环。

WiseClaw支持名医AI分身和数字家庭医生,可以把专家诊疗逻辑、健康档案、长期记忆和多终端交互结合起来,让用户在H5、小程序、App等入口获得连续的咨询和随访服务,有记忆,有逻辑,有温度。

在用户侧,我们获得了一位「随叫随到」的专属医生。

Scroll for more