重整化是什么

 

本文将介绍重整化的基本思想, 假设读者具有初中物理基础.

小时候和爷爷在铺着石子的小路上散步, 爷爷告诉我, 人的身体是由无数小小的细胞构成的. 我低头看看凹凸不平有些硌脚的地面, 又摸摸我滑滑嫩嫩的皮肤, 感到困惑: “如果我的身体是细胞构成的, 那它应该也会像地面一样是坑坑洼洼的.” 爷爷说细胞非常非常小, 单个的细胞只有用显微镜才能看见, 用手也不可能感觉得到. 我好像懂了, 又好像没懂, 为什么我们感觉不到单个的细胞, 皮肤看起来就是光滑的呢?

小学的最后几年, 我开始近视, 但害怕被家长批评不好好保护眼睛, 所以从来没有告诉家人, 也就没有配眼镜. (这种做法不值得提倡. 看到这篇文章的小朋友们, 如果你们感到视力下降, 一定要及时告诉家长去医院检查; 有孩子的读者也要注意, 视力下降因素非常复杂, 不能一味责怪孩子使得孩子不敢说出自己的真实状况, 延误就医时间.) 随着视力越来越差, 黑板上一笔一划的字在我眼里逐渐变成一个个稍有轮廓的白色方块, 然后轮廓也渐渐模糊, 方块失去了形状, 又失去了间隔, 变成一条条白色粗线. 有时窗户反光, 黑板变成一块深绿里透着白色的平面, 我就连有没有写字也不能看出了.

所以, 正常视力的人看不到细胞觉得皮肤光滑, 和近视的人把黑板上的字看成一行行白色粗线, 这两件事的原因是相同的吗? 我不记得儿时的我是否曾仔细思考过这个问题, 但如果我能见到他, 我会提醒他想一想, 因为其中蕴含着现代物理学最深刻的思想之一: 重整化.

什么是重整化? 简而言之, 在感知这个世界时, 我们并不能知道所有细节, 总是有一个最小尺度限制了我们的认知, 小于这一最小尺度的细节呈现给我们的, 是它们的平均效应——例如黑板上的一行字, 当我们看不清笔划时, 其他位置就是黑板的背景色, 而我们只能看到这一行所在位置的平均颜色: 比背景稍白一些. 由于我们只能看到平均效应而看不到细节, 我们丢失了一部分信息——看不清字, 当然不知道老师写了些什么. 虽然我们丢失了一部分信息, 但是在我们能看清的尺度上, 事情没有任何不同——无论是近视所以看不清字的我, 还是没近视所以能看清字的小明, 都看到了老师在写板书; 我们不会因为看清黑板上字迹的能力不同, 就对老师是否在写板书产生不一致的看法.

重整化就是一种利用上述规律研究事物的方法: 对于同一个研究对象, 不断改变我们能观察到的最小尺度, 分析这一过程中变化与不变的量之间的关系, 以此形成对研究对象的认知.

如果我见到儿时的我, 告诉他这些事情, 他一定会说 (我想我还是比较了解他的): 好大一堆废话, 近视了, 配眼镜不就完了吗? 难道不是看得越清楚越好吗?

还真不一定. 这里举一个最简单的例子. 中国人学英语, 感受到的一大文化差异, 就是英语对亲戚的称谓太粗糙了. 姐姐妹妹不分, 哥哥弟弟不分, 堂兄弟姐妹表兄弟姐妹不分, 七大姑八大姨一律不分. 但我们也可以反问自己, 为什么我们将父亲兄弟的孩子和姐妹的孩子区分开 (堂亲和表亲), 但不区分父亲姐妹的孩子和母亲兄弟姐妹的孩子 (都是表亲) 呢? 为什么不都区分开呢? 这一问题的答案 (最直接的回答是随父姓的传统下根据姓氏划分) 不是本文要讨论的内容, 但对它的思考已经足以让我们明白两件事: 一是生活中的分类, 很大程度上受到文化和社会的复杂影响; 二是各种不同的分类, 实际上都是忽略一些细节的结果. 一个有趣的问题是, 如果我们不忽略一些细节对事物进行分类, 我们就需要给世界上每个事物一个单独的名字, 此时我们的语言和文化会变成什么样子? 如此有趣的问题不如留给读者自己想象, 我们先讨论物理 (天呐, 终于要和物理沾边了).

在物理学中, 一个重要的任务是给物态分类, 例如我们将水分为固态、液态和气态. 前面已经提到, 分类的本质是忽略细节的差异. 在水的例子中, 我们忽略了哪些细节呢? 这个问题和人们对亲戚的分类有一个很大的不同, 把水分成固液气三态如此符合直觉, 这似乎说明我们的分类忽略的一定是所有人都会忽略的东西, 不存在视角和文化的差异. 我们将会说明, 这里我们忽略的正是那些小于肉眼可见的最小尺度的东西.

想象你变成一个和分子大小差不多的小人, 然后逐渐变回现在的大小. 第一次你跳进一杯 1 摄氏度的水, 第二次跳进一杯 60 摄氏度的水, 两杯水周边的空气很湿所以没有蒸发. 一开始你面前的世界会显得很不一样, 第一次周边的分子都懒洋洋地散步, 你可以从容地不碰到它们, 偶尔来一个飙车的分子, 稍微注意即可; 第二次你必须时刻小心, 避免被周围狂暴的水分子撞到, 也许会碰到一个慢慢悠悠的家伙, 你如果乐意, 也许可以在保证安全的前提下友善地和它握个手. 随着你能看清和感受到的最小尺度越来越大, 你感受到的区别将只是不同强度的碰撞和挤压. 最后你终于变回人类的大小, 两杯水看起来已经没有任何区别了, 摸上去你会觉得一杯热一杯冷, 你最终断定它们都是液态.

上述过程实际上是现代物理学中定义物态 (也叫相) 的一般思路: 不断增大我们所能观察的最小尺度, 微观上不同的系统最终可能会变成同一个样子, 如果是这样, 我们就说它们属于同一个相. 而不断增大我们所能观察的最小尺度, 正是上文提到的重整化的过程.

细心的读者 (比如儿时的作者) 看到这里也许会有问题: 到底什么是 “看起来一样”? 摸起来温度不同不也是有区别的吗? 这个问题涉及重整化中一个重要的技术细节, 我们将在一个更简单、更清晰因此也更抽象的模型中阐明. 简单的回答是, 上述变成小人再变回来的比喻并不完全精确, 如果我们的目的是分类物相, 因而希望逐渐看到完全相同的两杯水, 那么在小人变大的过程中, 水分子的速度和密度也应该相应改变; 如果不做改变, 那么最后温度和密度就可能有一些差异. 但无论如何, 在视觉上两杯水总是一样的. 决定视觉的因素主要是密度及其涨落和关联. 密度涨落是指密度在平均值附近的波动, 正常的液态和气态在宏观尺度下几乎没有密度涨落; 关联是指一个地方密度变化时, 另一个地方的密度会多大程度上跟着变化. 水在升温加压到一定程度时, 会到达一个临界点. 在临界点附近, 涨落和关联都很强, 水呈现出临界乳光等奇特现象, 见这一 B 站视频. 下面我们将从涨落和关联出发定性讨论不同相以及临界点的性质.

物理学家阐释相变最喜欢的模型是伊辛 (Ising) 模型. 既然本节假设读者是初中生而非物理学家, 不妨考虑一个 $N\times N$ 的棋盘, 每个格子可以随机地涂上白色或黑色. 棋盘的着色满足如下概率分布: 检查所有相邻的格子, 如果有 $M$ 对相邻的格子颜色不同, 那么其概率与都涂成黑色的概率比值为 $p^M$, 其中 $p\leq 1$. 例如对一个 $2\times 2$ 的格子, 共有 $2^4=16$ 种涂法, 取 $p=0.5$, 不同涂法有如下概率分布:

涂色模式 具体涂法个数 每个涂色结果的相对概率 每个涂色结果的概率
全白 1 $1$ 1/5.125
一个格子涂黑 4 $0.5^2=0.25$ 0.25/5.125
一行或一列涂黑 4 $0.5^2=0.25$ 0.25/5.125
对角涂黑 2 $0.5^4=0.0625$ 0.0625/5.125
一个留白 4 $0.5^2=0.25$ 0.25/5.125
全黑 1 $1$ 1/5.125

其中 $5.125 = 1+4\times 0.25+4\times 0.25+2\times 0.0625+4\times 0.25+1$. 假设我们根据上述概率分布涂好了大量的棋盘, 那么对于一个给定的 $p$, 平均而言棋盘上会有多少格子被涂黑呢? 大量按概率涂好的棋盘中, 最常见的棋盘是怎样的呢?

这一模型实际上是描写磁铁的最简单的模型. 我们可以将棋盘想象成一块 (二维的) 磁铁, 每个格子是磁铁内的一个分子. 磁铁中每个分子由于携带 “自旋” 因而具有磁性, 我们可以简单地将每个分子看成一个具有 N 和 S 极的小磁针, 且只能指向垂直于磁铁的两个方向. 磁针指向上方, 棋盘格涂黑, 指向下方, 棋盘格留白. 磁针之间的相互作用会使得磁针倾向于同向排列, 因此相邻磁针反向的概率小于同向. 模型中的 $p$ 由相邻磁针相互作用强度 $J$ 与温度 $T$ 的比值决定, 温度越低, 相互作用越强, $p$ 越小 (物理学家显然知道, $p=\exp\left(-2J/T\right)$). 模型忽略了除相邻格子之外磁针的相互作用. 我们对磁铁的物理性质有如下认识:

  • 低于一定温度时, 磁铁能吸引铁钉, 即指向一个方向的小磁针会明显多于另一个方向. 我们称此时磁铁发生自发磁化, 有铁磁性.
  • 高于一定温度时, 磁铁不能吸引铁钉, 即指向两个方向的小磁针数量相等. 我们称此时磁铁没有自发磁化, 没有铁磁性.

注意, 对于一块真实的磁铁我们只能改变其温度, 不能改变相互作用强度. 但模型只有一个参数 $p$, 因此改变温度就是改变 $p$.

上述磁铁的性质可以由模型看出: 温度很低时, $p=0$, 则棋盘必然要么都涂黑, 要么都留白; 温度很高时, $p=1$, 棋盘的每种着色概率都相等, 相当于独立地随机给每个格子涂色, 因此平均而言黑色和白色格子一样多. 这里似乎有一个问题: 无论哪种情况, 平均而言都是有一半格子被涂黑. 但虽然全体的平均值一致, 小 $p$ 和大 $p$ 仍有很大区别. 我们考虑 $N$ 很大的情况, 此时概率分布会非常集中, 我们称概率显著大于其他构型的那一类构型为 “典型构型”. 对于小 $p$, 涂黑格子数的分布聚集在两个点附近 (对于 $p=0$, 就是 $0$ 和 $N^2$), 典型构型是几乎都涂黑和几乎都留白; 而对于大的 $p$, 涂黑格子数的分布只有一个集中的点, 就是 $N^2/2$, 典型构型是每个格子随机地涂黑或留白. 实际的磁铁确实有磁化和未磁化的区别, 这是因为, 在温度较低 (小 $p$) 时, 随机的扰动使得小磁针有一个很微弱的指向上方或指向下方的倾向, 一旦形成这个倾向, 同向排列会不断加强这个倾向, 使得系统自发磁化. 用模型描述, 即真实的系统随机选择了一个典型构型, 而不是呈现出两个典型构型的平均. 为了说明这是如何发生的, 我们可以再引入一个 $q$, 它是一个格子涂黑的概率相对于涂白的概率的比值, 例如一个涂色构型有 $M$ 对相邻格子颜色不同, 有 $L$ 个涂黑的格子, 则其相对概率是 $p^Mq^L$. 总的概率是 $p$ 决定的 “同向排列的倾向” 和 $q$ 决定的 “涂成黑色的倾向” 的共同结果. 用这一模型描写真实的磁铁, 即 $p$ 很小, $q=1$ 时, 涂色构型的概率分布集中在 “都是黑色” 和 “都是白色” 两个典型构型附近, 这时我们让 $q$ 略大于 (或略小于) 1, 以模拟真实体现中的 “微小扰动”, 无论 $q$ 和 1 有多接近, 只要不是相等, 在 $N$ 很大时, $q^{N^2}$ 都会变得很大 (或很小), 因此都是黑色这一典型构型的概率会被指数地放大 (或压低), 因此最终会只有黑色 (或只有白色). 对于 $p$ 较大的情况, 因为典型构型中黑色和白色数量相等, $q\approx 1$ 不会对典型构型产生影响. 上述机制即所谓自发对称性破缺: 在体系大小趋于无穷时, 系统一个无论多小的不对称扰动 ($q=1+\epsilon,\epsilon\rightarrow 0$) 都会被放大, 使得整个系统在宏观层面呈现出不对称的形态. (稍微专业一些的读者不难从上述论证看出两点: 1. 自发对称性破缺需要 $N\rightarrow\infty$ 的热力学极限; 2. 热力学极限和微扰趋于零的极限顺序很重要, 只有先取前者再取后者, 才会有自发对称性破缺和相变. 这两个发现在杨振宁和李政道的相变理论中有更深刻的阐述, 详见原始文献)

下面我们来模拟不同 $p$ 下棋盘的构型. 对于一个边长为 $N$ 的棋盘, 共有 $2^{N^2}$ 种可能的构型, 这使得数值模拟几乎难以实现. 但事实上, 也是因为 $N$ 很大, 只有典型构型附近的构型有较大的贡献. 蒙特卡洛 (Monte Carlo)算法即提供了一种只在典型构型附近进行采样的方法. 最简单的蒙特卡洛算法如下: 我们从任意一种构型出发, 随机选择一个格子翻转其颜色, 计算翻转前后的概率 $P_1$ 和 $P_2$. 如果 $P_2\geq P_1$, 我们就 “接受” 这一翻转, 得到一个新的样本; 如果 $P_2<P_1$, 我们就以 $P_2/P_1$ 的概率接受这一翻转, 得到一个新的样本. 重复这一过程很多次后, 我们得到的样本集里的分布就近似是典型构型附近的分布. 这一算法可以自动实现自发对称性破缺, 因为随机翻转会产生微小扰动, 而一旦进入一个典型构型, 系统就很难再演化出来.

我们在不同参数 $p=0.403, 0.414, 0.419, 1$ (即 $T/J=2.20, 2.27, 2.30, \infty$) 下作了蒙特卡洛模拟 (读者也可以自己尝试在这里调整参数进行模拟), 在模拟结果稳定后随机选择了一个构型, (在 $p=0.414$, 即 $T/J=2.27$ 时, 涨落很大, 所以我们取了 5 个构型, 每个格子的颜色取 5 个构型中较多的那个), 下图中四张大图. 我们在 $512\times 512$ 的棋盘上进行模拟, 大图是从棋盘中间截取的 ($486\times 486$) 的子区域. 每张大图右边的小图展示了重整化的结果, 具体来说,

  • 从上往下第一张是大图左上角红框内 $18\times 18$ 的区域.
  • 对原图作一次重整化, 即从左上角开始, 将大图中每 $3\times 3$ 个小格子 “打包” 成一个大格子, 得到一个 $162\times 162$ 的新棋盘 ($486=162\times 3$), 每个格子涂的颜色由组成它的 9 个小格子的颜色决定, 如果 9 个小格中黑色较多, 就涂成黑色, 反之涂成白色. 第二张小图是第一次重整化后的新棋盘左上角的 $18\times 18$ 个格子, 对应大图左上小次小的红框, 包含了 $54\times 54$ 个小格子.
  • 对第一次重整化得到的棋盘再作一次重整化, 得到 $54\times 54$ 的新棋盘. 第三张小图即第二次重整化后左上角 $18\times 18$ 个格子, 对应原图左上角的大红框.
  • 对第二次重整化得到的棋盘再作一次重整化, 得到 $18\times 18$ 的新棋盘, 即第四张小图, 对应整个原图.
2.2 2.27 2.3 Inf

上述四个参数下得到的典型构型在重整化下展示出不同的行为:

  • 第一张图 ($p=0.403, T/J=2.20$), 大图展示了黑色背景下均匀而孤立的白色涨落. 重整化显示, 小尺度下 (上面的小图) 有涨落, 大尺度下 (下面的小图) 则几乎全是黑色. 出于对人类智力的尊重, 我们没有画出 $p=0$ 的结果 (即一张全黑的大图和四张全黑的小图), 可以想象此时无论作多少次重整化, 图像都不会有任何变化, 这样的情况称为重整化下的不动点. 不难看出, $p=0.403$ 时重整化三次后的图像 (最下小图) 和 $p=0$ 的图像没有差异.
  • 第四张图 ($p=1, T/J=\infty$), 大图展示了和第一张图完全不同的涨落模式: 黑色和白色数量几乎相等, 每一个小格都独立地随机选择其颜色. 右侧四张小图也是一样的模式, 完全混乱. 这也是一个重整化下的不动点.
  • 作为对比, 请看第三张图 ($p=0.419, T/J=2.30$). 大图和第一张图完全不同, 因为黑色和白色数量大致相等, 但也与第四张图不同, 似乎并非每个小格独立地选择颜色, 而像是一块块形状各异但大小差异不大 (直径大约在几十个格子) 的 “疤” 镶嵌在一起. “疤” 的大小是物理学家描述这个体系的关键参数: 关联长度, 它给出了这个体系的一个独立于微观尺度 (格子边长) 的特征尺度. 对它作重整化可以看到, 在最小的尺度上 (最上面的小图), 黑白聚集分布, 有明显的边界; 随着尺度逐渐增大, 重整化三次后看起来已经很像 $p=1$ 的情形了, 其原因无非是我们能分辨的最小尺度已经超过了系统的关联长度, 即 “疤” 的大小, 于是黑白镶嵌的 “疤” 就变成了黑白镶嵌的小格.
  • 如果读者尚不理解第三张图的 “关联长度” 意味着什么, 不妨与第二张图 ($p=0.414, T/J=0.27$) 作一对比. 第二张图黑白仍然势均力敌, 但看起来与第三张图和第四张图都不一样: 它不是一个个小格独立选择颜色, 它有一片一片的 “疤”, 但是它的 “疤” 又没有相对一致的大小, 不如第三张图看着整齐. 对它作重整化结果非常有趣: 既不像第一张图, 尺度越大越像 $p=0$ 的纯黑或纯白; 又不像第三张图, 尺度越大越像 $p=1$ 的独立随机. 四张小图看不出任何明显规律, 甚至最小尺度 (第一张小图) 和最大尺度 (第四张小图) 看起来几乎一样. 这样的构型也是一个重整化下的不动点, 它在所有尺度上都有涨落因此没有固定的特征尺度 (关联长度), 无论我们观察的最小尺度怎么变化, 它在我们眼里都是差不多的.

总结下来, 我们的模型存在三个重整化下的 “不动点”: $p=0, 0.141, 1$. 临界点 $p_c=0.414$ 将参数 $0\leq p\leq 1$ 划分成了两个区域, 当 $0<p<0.414$ 时, 随着我们逐渐放大观察的最小尺度 (重整化), 我们看到的系统会变得越来越像 $p=0$ 时的系统; 当 $0.414<p<1$ 时, 随着我们反复重整化, 我们看到的系统会变得越来越像 $p=1$ 时的系统. 我们可以画出下图所示的重整化流, 箭头表示随着我们反复重整化, 系统会表现得越来越像箭头所指方向的参数. 图中箭头指向的不动点是稳定的不动点, 箭头背向的不动点是不稳定的不动点. 结合第一节对相变的讨论, 我们不难得出: 重整化下流向同一个稳定不动点的参数构成一个相, 重整化下的不稳定不动点对应相变点.1

下面回答此前提出的问题: 我们摸到的 “温度不同”, 究竟在体现在哪里? 为此, 我们考察上述棋盘模型和磁铁的对应:

棋盘 (伊辛) 模型 磁铁
棋盘格 分子
黑色/白色 小磁针向上/向下
$p=0$ $T=0$ (处在绝对零度)
$0\leq p<p_c$ 有铁磁性
$p=p_c$ $T=T_c$ (处在相变点)
$p_c<p<1$ 没有铁磁性
$p=1$ $T=\infty$

在棋盘模型中, 在稍低于临界点的温度下, 作三次重整化即显得和绝对零度没有差异, 但现实中我们几乎看不到任何微观细节, 却仍然能感受到真实的温度, 降温也能观察到铁磁性的增强. 造成这一差异的原因是, 我们上面所做的重整化过程, 并不严格等效于 “看不清微观信息所以以平均值代替”. 我们画新的格子不是保持其真实大小而涂掉旧的边界, 而是将新格子缩放到和旧格子一样的大小; 我们也没有取九个格子颜色的平均来给新的格子涂色, 而是选取了其中的多数而仍然保持黑白二色. 如果都采取前一种方法, 我们将最终得到一张真实反映 “细节体现为平均” 的灰度图而非黑白图, 从不同参数开始, 如此得到的灰度显然是不同的.

为什么我们不采取前一种方法呢? 这与我们的目的有关. 在这里, 我们的目的是分类物态, 所以我们希望采取一种重整化策略, 使得重整化前后系统的自由度可以完全对应. 在高能物理中, 出于另外的目的, 我们完全可以使用另一种 “看起来更真实” 的重整化策略.

  1. 这里我们讨论的是单参数的情形. 多参数时由于存在无关 (irrelavent) 参数, 不稳定不动点不一定是临界点.