他在数据未成海时,便为AI修好了岸逻各斯笔记
“查尔斯・巴赫曼(Charles W. Bachman, 1924-2017)是网状数据库之父,1973 年图灵奖得主,美国计算机科学家。他开发了世界上第一个数据库管理系统 —— 集成数据存储(IDS),奠定了现代数据管理技术的基础。”
01. 人物介绍
(图片来源:AI 生成)
每一片浩瀚的海洋,都曾是一滴孤独的水。
在人工智能可以写诗、作画、与人交谈、诊断疾病、编写代码的这个时代,我们习惯仰望那些站在聚光灯下的算法天才 —— 辛顿、杨立昆、本吉奥。他们的名字被反复传颂,他们的论文被无数次引用,他们的面孔出现在杂志封面上。
却很少有人想起 —— 在数据还没有成为 “海” 之前,是谁先挖出了第一道沟渠,让水可以流动、汇聚、彼此找到。
查尔斯・巴赫曼,就是一个修岸的人。
他不张扬,不喧哗,甚至刻意避开镁光灯。他没有在顶级会议做过主旨演讲,没有创办过市值千亿的公司,没有在社交媒体上与同行论战。他只是安静地坐在上个世纪的机房里,听着磁带机嗡嗡的转动声,闻着打孔纸带特有的油墨味,然后用一种近乎固执的温柔,为后来所有的智能,铺好了第一张可以躺卧的床。
他相信一件事:数据是有生命的。它们应该被看见、被连接、被尊重。
这个故事,关于一个机械工程师,如何用一生,把世界从 “孤岛” 连成 “大陆”。
如果你愿意,请慢下来。泡一杯茶,找一个舒服的姿势。这是一个需要慢慢听的故事。
一、在堪萨斯的风里长大
1924 年 12 月 11 日,美国堪萨斯州,曼哈顿 —— 不是纽约那个曼哈顿,是一个安静的、被麦田包围的小城。
一个男孩出生了。
那年,卡尔文・柯立芝还是美国总统,爵士乐正在芝加哥的酒吧里悄悄萌芽,电视还没有被发明出来,人们刚刚开始用电灯照亮夜晚,收音机还是需要戴上耳机才能听见的稀罕玩意儿。
小查尔斯・巴赫曼来到这个世界的时候,还没有 “计算机” 这个词。甚至连 “电子” 都还只是一个物理课本上的抽象概念。
他的童年,是在开阔的平原上度过的。
堪萨斯的风很大,大到能把帽子吹跑,大到麦田会像海浪一样起伏。天很低,云跑得很快,地平线在四面八方向外延伸,好像永远走不到尽头。
他后来在回忆录里写道:“在堪萨斯长大,你会明白一件事:万物之间都有看不见的联系。风连着云,云连着雨,雨连着土地,土地连着麦子,麦子连着餐桌上的面包。没有任何东西是真正孤独的。”
这种直觉 —— 万物相连的直觉 —— 像一颗种子,埋进了他年幼的心里。
巴赫曼的父亲是一位工程师,母亲是一位教师。家里不算富裕,但书架从来不空。他从小就喜欢拆东西 —— 拆闹钟,拆收音机,拆一切能拆开的东西。不是为了破坏,而是想看看里面是怎么连接的:齿轮咬合齿轮,电线连接电线,每一个零件都有自己的位置,每一个位置都有自己的意义。
他后来常说:“一个闹钟和一套数据库,本质上没有区别 —— 都是关于‘连接’的艺术。”
高中毕业后,他先去了密歇根州立大学,读机械工程。那是工业时代最后的荣光 —— 钢铁、齿轮、传动轴、内燃机,一切都实实在在,一切都可以被触摸、被测量、被信任。
然后战争来了。
第二次世界大战期间,巴赫曼加入了美国陆军。他没有被派往前线,而是被分配到一个防空炮兵部队,负责维护火炮的瞄准系统。那是一份枯燥而精密的工作 —— 你需要让一个几十吨重的庞然大物,精准地指向天空中的一个小点。
他在那里学会了两件事:
第一,精度就是生命。差一度,就可能打不中;打不中,就可能有人死去。
第二,系统思维。一个瞄准系统,不是瞄准镜的事,而是齿轮、液压、光学、人力、天气、地形的总和。你不能只看一部分。
战争结束后,他回到了学校。
但这一次,他没有只学工程。他去了宾夕法尼亚大学读机械工程硕士,然后又去了沃顿商学院 —— 拿到了 MBA 学位。
这是一个奇怪的知识组合。工程教他 “怎么造”,商科教他 “为了谁”。
他后来解释过:“如果不懂商业,你就不知道数据为什么重要。数据不是为了存在而存在的 —— 数据是为了回答一个问题:我的生意到底怎么样了?”
1950 年,巴赫曼毕业了。
那一年,世界上的计算机屈指可数,每一台都像一堵墙那么大。没有人听说过 “软件”,没有人听说过 “数据库”,甚至 “程序员” 这个职业,都还在襁褓之中。
但他已经隐隐约约感觉到了什么。
他说不上来,只是一种子弹即将出膛前的震颤。
二、当数据还是孤岛
1960 年代初,巴赫曼加入了通用电气公司。
那时候的通用电气,是世界最强大的企业之一。它造发电机,造冰箱,造喷气发动机,造核反应堆。它拥有庞大的供应链、庞大的销售网络、庞大的财务系统 —— 每一个环节都在产生数据,但每一个环节的数据,都像一座孤岛。
生产部门有一个文件柜,里面装满了零件清单。采购部门有另一个文件柜,里面装满了供应商信息。销售部门有第三个文件柜,里面装满了客户订单。仓库有第四个,里面装满了库存记录。
这些文件柜之间,没有电话,没有信件,没有沟通。
一个订单从销售部到生产部到仓库到运输部,每一步都需要人工抄写、人工传递、人工核对。一个数字抄错了,整批货就送错了。一个名称写反了,客户就收不到账单。
通用电气请巴赫曼来,是为了解决一个很现实的问题:让这些文件柜,能够彼此说话。
巴赫曼走进了机房。
那是一个巨大的、没有窗户的房间。地板上铺着防静电的橡胶垫,空调全天候运转,声音很大,大到人们必须提高嗓门才能听见彼此。计算机 ——IBM 1401 系列 —— 占据了整整一面墙,磁带驱动器像一排沉默的卫兵,闪烁着绿色的指示灯。
巴赫曼看着这些昂贵的机器,陷入了一种奇特的沉思。
当时的计算机是怎么处理数据的?
你需要先把数据写在打孔卡片上。每一张卡片存储 80 个字符,像一句很短的句子。然后你把一叠卡片放进读卡器,读卡器把它们一张一张吞进去,转换成电信号。计算机处理完之后,再把结果打在另一叠卡片上。如果你想用这批数据做另一件事 —— 比如从 “计算工资” 变成 “生成报表”—— 你得把卡片重新整理一遍,重新输入一遍。
数据是线性的,是顺序的,是一次性的。
就像一个只有单行道的城市 —— 你想去另一个地方,必须回到原点,重新出发。
巴赫曼觉得不对劲。
他在笔记本上画了一条线,然后在线上画了一个分支,又在分支上画了另一个分支。他想:为什么不能直接过去呢?为什么一定要绕回来呢?
他站起来,走到白板前,画了一张图。
这张图,后来会被叫做 —— 网状数据模型。
三、修第一条路的人
(图片来源:AI 生成)
1963 年,巴赫曼做出了一个决定:他要自己写一个系统。
没有预算,没有团队,没有正式的立项。他只是在完成本职工作之余,一个人写代码。那时候写代码不像现在 —— 没有集成开发环境,没有代码补全,没有在线文档。你坐在一台电传打字机前,用纸带打孔,然后把纸带送进计算机,等它运行,然后等它出错,然后找错,然后重新打孔。
一遍,一遍,又一遍。
他在构建一个东西,他把它叫做集成数据存储 ——Integrated Data Store,简称 IDS。
这是人类历史上第一个数据库管理系统。
不是 “一个数据库”,而是 “一个管理数据库的系统”。它可以让不同的程序,同时访问同一份数据,而不会互相干扰。它可以让数据持久地存在,而不是随着程序的结束而消失。它可以在数据之间建立 “指针”—— 就像一个箭头,从一条记录指向另一条记录。
巴赫曼这样描述他的想法:
“想象你在一片森林里,每一棵树都是一条数据。你想从这棵树走到那棵树。在旧的系统里,你必须回到森林的入口,重新开始。但在 IDS 里,你可以直接从一棵树走向另一棵树 —— 只要你记得路。”
他把这种行走,叫做导航。


