模型+Harness双轮驱动，金融Agent跑通了新智元

20天长流程、token严格控制在每单50k以内，AI审批预计能提速150%以上，单均成本预计可以降至人工五分之一。易鑫Harness不是简单套壳，而是把选择性压缩、实时检索、审计图谱全部打通，让Agent真正「越用越聪明」。

2026年，AI圈最热的词不是模型，也不是记忆，而是一个被翻译得有点别扭的英文单词——Harness。

马具，缰绳，驾驭。

最近，Anthropic在Claude Platform上放出了Managed Agents的公开beta。业内立刻给它贴了一个标签，meta-Harness。

一句话翻译过来，模型已经不是瓶颈了，真正决定Agent能不能干活的，是模型外面那套「驾驭系统」。

LangChain创始人Harrison Chase说得更直白一点，「Harness和上下文工程跟模型质量一样重要」。

VentureBeat的市场追踪给出了实锤。一个月内，Anthropic工具与工作流API的采用率，从0%直接飙到了5.7%。企业用Claude，用的就是它配套的编排方案。

如今，Harness从工程内部用语，一跃成为了Agent产品绕不开的基础设施。

Harness是多层结构，并非单一模型套壳

但这只是故事的一半。

通用Harness跑不了的金融订单

Anthropic做的Managed Agents，主要服务coding、文档生成、任务自动化这类通用场景。

这些任务有一个共性，边界相对清晰，错了大不了重跑一次。

但一些行业不是这样，比如金融行业。

一笔汽车贷款，从客户进件到资产管理，单笔金额几万到几十万，整个生命周期超过20天，要跨越15个以上关键决策节点，正向逆向反复评估，决策路径组合可以达到几万种。

中间任何一步AI出错，比如材料审核漏了一个关键瑕疵，后果都不是「再来一次」能解决的。

所以，从设计目标开始，金融行业要的Harness，跟通用场景的Harness就不一样。

通用场景的Harness在乎怎么让模型在长上下文里不丢失记忆、怎么管理工具调用。

金融场景的Harness在乎合规边界怎么实时兜底、模型幻觉的瞬间怎么把人工接进来、20天的订单流里数据全程能不能审计。

4月14日，香港世界互联网大会亚太峰会的「智能体创新与应用论坛」上，易鑫首席科技官贾志峰把这件事点了出来。

易鑫是国内最具规模的AI驱动的金融科技平台，以服务汽车金融生态为使命。2017年在香港上市，2025年成为港交所科技100指数成员。目前年交易额已达到约750亿元人民币，全球拥有员工5000多人

并且，他还抛出一个计划——

今年下半年，易鑫将开源部分自研Harness Framework。

这是全球汽车金融行业第一份公开的Agent治理基础设施。

不是套一层壳，是三层「驾驭体系」

在演讲里，贾志峰直接区分了易鑫的Harness跟通用方案。

和通用AI公司侧重memory、context这些技术模块设计不同，我们的设计是一个更全面的三个层次的驾驭体系。

三层分别是人类驾驭层、Agentic驾驭层、数据驾驭层。

人类驾驭层解决一件事，Agent和真人能不能在一笔订单流里实时无缝切换。

客户按要求上传一张银行流水的照片，IM Agent接管做OCR和结构化提取。

系统会判断这张照片是否包含风险字段或不符合要求的字段。

比如，要求提供6个月流水，但只给了3个月；再比如要求流水里必须提供收入，但实际流水里收入为0。

此时，Harness就会立刻把订单转给真人审核员，并且把前面所有对话上下文完整交接过去。

「Agent搞不定就转人工」，这种简单兜底逻辑做不到这一点。

Harness的人类驾驭层覆盖语音、文字、图片多模态，关键业务节点强制要求人工介入，转手时信息完整率必须做到100%。

人工不是替补，是工作流从一开始就设计进去的角色。

Agentic驾驭层解决模型出错的瞬间，比如当模型出现「幻觉」或违规承诺时，系统会在毫秒级触发熔断，切换到人工链路。

举个金融场景里的真实痛点。模型在诱导下承诺了一个黑名单客户肯定能放款，那么这笔订单就会成为合规风险事件。

Harness这一层的工作是在模型把话说出口之前拦截，并且根据客户互动的实时特点重新规划后续路径，不按预设脚本死板执行。

在3月底的工程博客中，Anthropic就提到一个有意思的现象：

Harness里塞进去的某些补丁，会随着模型升级而过时。

比如他们为Claude Sonnet 4.5加的上下文重置，在Claude Opus 4.5上就不再需要。

易鑫这层Harness的设计思路对应了同一个判断。

贾志峰在演讲里说了一句，「让模型越来越强，Harness越来越轻」。

Harness发现的问题要不断回流到模型训练里，让模型自己内化掉，避免长期用Harness打补丁。

数据驾驭层把人类操作数据和Agent操作数据打通。

不只给运行阶段做护栏，还给训练阶段提供高质量数据。

更关键的是合规。从数据接入、流转、清洗脱敏，到最终进入哪个版本的模型训练，全部建立关联图谱，模型表现一旦发生变化能立刻定位、快速调整。

这是金融监管最在意的事情，可追溯、可审计。在通用Agent领域可有可无的能力，在金融行业是过审的硬门槛。

需要强调的是，他们的Harness Framework并不是一个孤立存在的模块，而是整体贯穿Application、Products、Models 这三层架构，融合在业务的各个节点。