微软2.02T登Nature:把字刻在石头上量子位
《三体》里,人类为文明选择的“亿年级”存档方案,是最原始的“把字刻在石头上”。
最近微软真把数据刻在了玻璃里。
Nature最新研究,展示了一种名为Silica的三维光学玻璃存储技术:
在一块巴掌大120mm×120mm、仅2mm厚的玻璃片中,微软研究团队实现了301层数据的三维写入。数据密度达到1.59 Gbit·mm⁻³,总容量4.84TB,单光束写入通量25.6 Mbit·s⁻¹,每bit能耗仅10.1nJ。
相当于能存下近500万本1MB大小的电子书、约100万张5MB大小的照片。
更惊人的是,针对相位体素编码方案(对应2.02T可用容量),加速老化实验外推结果显示,290℃高温下其特征寿命可达10000年。
为什么人类需要“玻璃硬盘”?
要知道,人类产生数据的速度在指数级增长,总量大约每三年翻一番,其中大量数据必须保存数十年甚至数百年。但现有的磁带和硬盘通常几年就开始退化,数据不得不定期“搬家”到新介质上,时间、设备、能源成本都不低。
玻璃是一种天然适合长期存储的材料——热稳定、化学稳定、不怕潮、不怕电磁干扰。用飞秒激光在玻璃内部写入数据的思路此前已有不少研究,但大多只做了某个单一环节的优化,没有把写入、存储、读取、解码整条链路完整跑通。
而Silica在所有关键存储指标上均表现达标,并且展示了写入、读取和解码全流程可靠运行的方案。
有关详情,我们接着往下看。
数据是怎么被写进玻璃里的?
Silica系统的整体架构如下图所示。
把数据写进玻璃,需要用到的一种核心技术是飞秒激光。
飞秒是时间单位,1飞秒等于一千万亿分之一秒。这种激光脉冲极短、能量极集中,打在玻璃内部时,能在微观层面改变玻璃的光学性质,形成一个个极其微小的光学“标记点”,名叫体素(voxel),可以理解为三维空间里的像素。
每个体素表示多级符号,而非单一二进制位。
具体怎么编码呢?微软团队开发了两种方式。
第一种叫双折射体素,写在高纯度石英玻璃上。
激光在玻璃内部制造出极小的拉长形纳米空洞,空洞的朝向由激光的偏振方向决定。改变偏振方向,就改变了空洞的朝向,相当于写入了不同的符号。论文中使用了8个不同的方位角等级,也就是说一个体素可实现8种状态编码,对应3bit。
这种方式有一个巧妙的写入技巧:
每个激光脉冲被分成两部分,一部分负责“打地基”(形成初始的空洞种子),另一部分负责把上一个脉冲留下的种子“拉长定型”成数据体素。这样每来一个脉冲,就有一个体素被“定型完成”,体素的生成速率接近激光重复频率量级,论文中使用的飞秒激光重复频率为10 MHz。
PS:因为每个体素存储的用户bit数还要扣除纠错冗余,所以论文最终报告的用户数据写入吞吐量低于理论峰值。
第二种叫相位体素,写在硼硅酸盐玻璃上(就是日常实验室常见的那种耐热玻璃,成本更低)。
这种方式更简单粗暴:通过调节激光脉冲的能量强弱来改变玻璃局部的折射率,能量不同,折射率变化不同,对应不同的数据符号。
团队利用声光调制器(AOM)对光束能量进行调制。
每个体素只需要一个脉冲就能写完,因此体素可在10 MHz的激光重复频率下完成写入。
两种方式产生的光学变化都非常微弱,好处是散射和串扰都很低,所以可以在玻璃内部叠多层。
接下来问题来了,写入质量如何保证?
激光系统里有很多光学元件,任何一个元件的微小波动都会影响写入质量。团队为此设计了一套双重质量控制系统。
第一层是离线标定(Offline Flattening)。写数据之前,先把整个光路里的各种不均匀性(比如扫描器不同面的反射率差异、物镜在不同深度的表现差异)全部测一遍,算出补偿参数存起来,写数据时自动叠加补偿。
第二层是闭环控制(Closed-loop Control)。激光打在玻璃上形成体素的瞬间,会产生等离子体发光。系统通过摄像头实时捕捉这个发光信号,如果发光强度偏离目标值,就立刻通过调制器调整激光功率,把能量拉回正轨。这就像一个持续运转的“自动纠偏器”,保证每个体素的质量始终稳定。
数据怎么读出来?


