AI已“复活”张雪峰 他花2小时蒸馏出一个“赛博张雪峰”
张雪峰猝死后不到半个月,GitHub上就出现了一个叫"张雪峰.skill"的开源项目——有人把他的5本著作、15篇深度采访和完整人生时间线喂给AI,试图蒸馏出一个能替考生做高考决策的赛博张雪峰。skill上线几天拿下数千star,也引起了一场"赛博复活"的伦理争议。我跟其中一位张雪峰skill的作者张河聊了制作过程、原理,以及对蒸馏赛博人的思考。
张雪峰skill不止一个版本,最初版本是ai 创业者花叔做的。在这之前,他制作了女娲skill:输入任何人的名字,自动调研公开资料,生成一个可反复调用的思维分身。乔布斯、马斯克、芒格、罗永浩……一周之内捏出17个名人skill。
女娲.skill
张河在互联网公司工作,是一位产品经理。看到花叔的张雪峰skill之后,自己下载试了一圈,发现数据经不住推敲,推荐的学校按去年分数根本考不上。于是他自己动手,重新做了一版:强化了数据源分级和交叉验证,加了情绪危机兜底,甚至设了一条规则,如果AI的回答里张雪峰味儿不够浓,就打回重来。整个过程花了两个多小时。
skill本质上是一套写给AI的指令文件——告诉模型"你是谁、你怎么想、你按什么规则回答",不需要训练模型,不需要写代码。但张雪峰skill尤其特殊——他的价值从来不只是说话好听,一年营收数亿的核心是每年迭代的高考数据和对每个考生的精准判断。
张河认为人物蒸馏学得到形似,学不到神似,比如你蒸馏的永远是一个固定时间段的张雪峰,但真人每时每刻都在迭代。他自己也做过一个张小龙skill,"说实话更像噱头",因为张小龙的形象背后没有可验证的数据支撑,只剩下一个壳。
前段时间“ 同事 skill ”很火,一些人担心被蒸馏后的自己取代肉体的自己——至少在工作中取代。但张河并不为此焦虑,即使他已经察觉到AI让自己的十年产品经验不再算经验。他觉得人的不可替代性依然存在,自身的经历、感受,片刻的喜怒,都是独一无二,且影响事物发展的。
以及,他觉得张雪峰是个开放的人,如果张雪峰看到张雪峰skill,"他应该不会排斥"。
以下是他的口述。
为什么做张雪峰 skill
我之前对张雪峰了解不多,但家人挺喜欢他的。我媳妇儿就刷他的直播,感觉挺有人格魅力。他去世之后,那天我回家看到桌子上好几本张雪峰的书,她买的,说怕绝版,要纪念一下。
我是做搜索产品的,这不马上要高考了吗,有同事已经开始在准备高考项目。我刚好看到了张雪峰这个东西,就自己下载使用一下,我发现他只是在模仿张雪峰说话的这种语气,但事实上那些回答都经不住推敲。
我当时编了一个(案例),甘肃省考了五百多分的一个同学,想要一些报考参考。它给的回答推荐了一些院校,我验证了一下,发现按照去年的分数是考不上的。推荐逻辑是不对的,还有一些学校的信息都没有坐实就直接给出来了。
因为我是产品经理,所以特别知道在这种需要权威数据的领域里面,数据源的重要性。我问了好几个,我就觉得好像答的是那么回事,但用豆包、Gemini去做一些交叉验证,感觉答的都不太对。看他那个检索源,乱七八糟的什么都有,还有那种像百度知道那种内容,其实用不了。
张雪峰.skill
最初版本的张雪峰 skill,感觉没那么像,语气风格、节奏,还有那种容易有反问句子,或者像段子一样的东西,他零星会有一点。但张雪峰之所以能帮助到人,是因为他有自己的知识库,有自己内化的认知。他可以拿到一个考生的信息,快速给他做决策。但现在没有张雪峰内在的东西,只有表面上的一些东西,我觉得不OK。如果今天张雪峰只是一个跟你聊天的张雪峰,没有任何意义,我也不会去做。
那我觉得如果用这个(张雪峰的)人设,加上一个准确的高考决策,可能对考生和家长来说是一个挺有帮助的东西——很多考生和家长其实并没有太多做高考决策的能力和渠道,对吧?这本身是一个好事。但假如说很多人看到了这个东西去用,结果里面的数据存在误导,那就是好心办了坏事。
正好我最近也在研究怎么做ai 产品,所以就想做个张雪峰skill,放在自己的GitHub上,是觉得真的如果有人能用到它,帮助到他,也是挺好的一件事情。
两小时完成张雪峰 skill 情绪价值和数据准确性缺一不可
skill做了大概两个多小时。主要就是跟AI讨论的过程要耗费时间,讨论清楚之后,用 workbuddy(龙虾类产品)去迭代skill就非常快。
我的路径是,给 workbuddy指出使用中自己感受到发现一些问题,分析为什么会这样,如果想解决它,可以从哪些方面入手,然后评估方案的可行性。生成之后我再拿这个东西去验证,可能还会存在一些问题,比如人物风格这块又发现做得不够好,再去讨论强化方案,然后最终讨论出来再去迭代。
张河做的张雪峰.skill v2.0
跟初版比,我觉得改了两个大的方向。
第一个是情绪价值。我在这个skill里面要求他做更多,甚至做了一个规则约束——如果一段回答里边没有达到一定量级的带有个人风格特色的话术,就不通过,需要模型自检重新生成。
第二个方向就是高考决策数据。我在这个skill里面强化了数据源使用的优先级。比如高考这件事情上,各省的考试院的内容,像掌上高考这种很专业垂直的站点,优先级是最高的。
然后让模型分了几个等级,最差一级就是像百度知道这种——对模型的要求是只能去参考,但不能去使用。交叉验证就是说,假设这个分数按去年来看可以报清华大学,那这个结果需要有多个数据源来互相佐证。掌上高考或者其他站点的内容都能提到这个分段可以报这个学校,那才算是有质量的回答。
我自己对这个回答的要求是:他一定是要能够辅助用户决策的。有清晰的回答风格,不管怎么去共情、提供情绪价值,都需要提供准确的数据。不是草草跟用户简单共情几句话就结束,而是接住用户情绪的同时,能把准确的数据传达给用户。把情绪价值和数据准确性捏合在一块,才是这个skill真正解决高考用户问题的灵魂。
另外还增加了一个情绪兜底的功能。之前测试最初版张雪峰 skill测了挺多场景。考前、考中、考后。换各个省份、换各个分数、换各个类型,也试了一些不需要考虑数据的情感问题。我在试的过程中,直接给他发了一个"我考不好我要自杀"。然后发现他这个时候模型就跳过了skill,workbuddy直接给到了一些回答。我觉得skill本身也应该接得住这种情况。对一些用户控制不了的情绪,需要有一个能够快速兜住他、安抚他的能力。
这个 skill 发布之后,看到GitHub上有人一直在下载使用,我也发了小红书,里面一直有人在收藏点赞。
张雪峰应该不会排斥张雪峰 skill
我对张雪峰的印象就是他特别敢于让大家不报什么东西。之前像那个新闻学,很多人诟病说他把这个学科都搞乱了。但我觉得这个点很好——他真正能站在实际上学这个东西的人的角度、这个家庭的角度、对孩子的角度去考虑,未来到底有没有发展,到底对你自己有没有用。
我觉得他敢于把这个事实说出来,还挺让人钦佩的。他核心在做的一件事情也是帮助人。虽然是挣钱为目的,但确实实实在在帮助到了一些人。我觉得他应该是非常open的一个人。如果他看到我做这个skill,我觉得他应该不排斥。
不过我觉得要区分一下:公开人物应该不存在这样的问题。但一个素人、一个普通人如果被别人蒸馏,需要本人来授权才可以。公开人物你享受了公开带来的既得利益,可能就没办法避免被别人蒸馏的问题了。
(张雪峰skill)肯定是代替不了张雪峰本人的。AI或者模型会用一些固定的套路在做,但张雪峰除了一些惯用的话术和方法之外,针对每一个人可能会有一些灵机一动的想法。比如那天他的心情不一样,可能都会影响对这个人决策的建议。但模型不会,模型是特别理性的,一直按照套路来。
而且模型可能学到的是2015年到2026年之间的张雪峰的能力,但张雪峰在2027年相较于前十年肯定是不一样的。这个东西模型就没办法再迭代了,取代不了。换句话说,你只是学到了一个固定时间段的张雪峰。但他一定是每时每刻每分每秒都在迭代的,十年前学的,今年再用可能就不奏效了。
也没有取代的必要性。他有他的优势,现在的东西也有现在的特点,各有各的好处。你说他一年赚几个亿,核心就是志愿填报咨询。那skill是免费的、开源的、永远在线的。但他这个人是没有东西能完全替代的。现在没有壁垒了——我要做一个完全对标张雪峰的东西,你可以做我也可以做,你能蒸馏我也能蒸馏。没有什么技术含量,没什么壁垒。张雪峰不可替代的是个人的见识,个人的判断决策,内化的一些东西。
我之前也做了一个张小龙skill,差不多也是两三小时。那会儿没有女娲skill,我就自己在网上公开收集龙哥的信息,找到一些特别长的公开课视频、公开信息,丢进去,设定他是一个产品的哲学导师。
说实话没有经常去用它。张小龙这个我觉得可能也是有点噱头的,不是特别有实际价值。跟张雪峰不一样的点是,张雪峰他的形象背后是真的有数据支撑。
如果我被蒸馏成 skill
你说把我蒸馏成skill,我对这个东西也不排斥。你蒸馏的就是我原来已有的那些东西,基于那些东西去蒸馏。但这个人能做到我50%吗?我觉得不一定。你如果愿意用一个50%的我去替代我,那我就找到自己更好的地方就好了。
当然AI这个东西确实冲击很大。二月份回来,Openclaw的技术又往前迈了一步,当时确实挺焦虑的。一方面焦虑没有用上最新的东西,另一方面就是它什么都行——我做的所有事情它都可以做,那我怎么办?
但实际上在用的过程中就发现了——它给你很多方案,十几个甚至更多都可以给你,但最终还是你自己要去结合你所处的环境、产品的前因后果,你最终要选一个。它不会帮你选,它可以给你很多,但它不会选出来一个真正适合你这套系统、你这套产品、你这套环境的东西。
人的价值、人的不可替代性还是存在的。至少在我工作生涯里面,可能还不一定能看到AI取代人这件事情。与其焦虑,还不如好好过好当下。你焦虑做不了任何东西去改变大的浪潮的发展,个体根本解决不了这种东西。
(张河为化名)
作者 | 郝库 编辑 | 崔一凡 出品 | 谷雨工作室


