王孟源 哈佛大学物理学博士关键字: 悟空暗物质暗物质粒子探测卫星【文/ 观察者网专栏作者 王孟源】物理界在1880年代就提出暗物质的猜测。一开始是因为银河系外围恒星的切向飞行速度太快,银河系核心被观测到的质量远远不足以提供所需的向心力。后来在20世纪发现同样的问题也出现在更大的尺度上,星系团(Galaxy Cluster)和超星系团(Supercluster) 外围成员的切向飞行速度也是数倍于核心重力能维持的范围。如此一来,只有两个逻辑可能,第一是每个星系(Galaxy)都有大量不参加强作用力(否则会与原子核有反应)和电磁力(否则会与电子和质子有反应)的暗物质;第二,是广义相对论的重力方程式在星系以上的尺度必须有新修正项。近年来,用各种间接手段观测到的暗物质重力效应越来越多,要靠修改重力方程式来满足所有的观测结果也越来越难自圆其说,所以暗物质就成为天文物理界的主流理论。2017年11月有两篇论文引起了学术界专家的注意和广泛讨论,刚好就是有关这个话题;一篇似乎是对的,另一篇则似乎是错的。头一篇是UC Berkeley的Katelin Schutz在11月9日发表的论文:经过观测和研究,证明暗物质的重力效应,至少在银河系内是完全球对称的(Spherically Symmetric)。因为银河系的可见物质成碟状分布,如果暗物质的重力效应其实来自重力方程式的变形,那么应该也会看到碟状而不是球状的现象,所以这个新结果又再一次偏爱(Favor)了暗物质的存在。另一篇是University of Geneva的教授André Maeder在11月27日发表的理论,是广义相对论重力方程式的又一个新的变形。但是随即遭到好几个物理博主的无情反驳(参见Sabine Hossenfelder在11月30日的总结:http://backreaction.blogspot.com/2017/11/if-science-is-what-scientists-do-what.html ),基本上已经确定是错的。
至于中国的悟空卫星,在11月30日发表于《Nature》的论文,号称在1.4TeV的能阶上可
能发现了暗物质衰变产生的电子,虽然被中国官方广为宣传,不但充斥于中文媒体,英
文的大众媒体也多有报道,但是如此惊人的结果,物理专业的博客却对它基本无视,既
没有庆祝也没有反驳,《Nature》自己的网站也没有出新闻报道,这是为什么呢?
前面提过,暗物质理论来自对重力现象的间接观测结果;它不可能参与强作用力和电磁
力,否则必然早已被直接观测到。但是宇宙中还有第四种作用力,也是弱作用力;它太
过微弱,所以暗物质是否参加弱作用力,目前的实验和观测很难完全排除其可能。其实
客观来说,希望很小,这是因为量子效应会在较低的能阶也留下蛛丝马迹,人类的对撞
机已经做到13TeV的能级,却完全没有看到任何这类的量子修正项,代表着在1TeV、
10TeV、乃至100TeV的能级上,暗物质都不太可能有弱作用力的效应。如果理论非要硬
拗不可,当然也做得到,只须要多加几十个、乃至几百个自由度,或者硬是假设精度极
高的参数(例如弱作用反应项的系数被设定为0.00001),但是这些做法都是失败理论
的特征,严重违反了Occam's Razor。
实验学家要向政府要大钱(虽然悟空的造价宣称只有1亿美元,即7亿人民币,但与悟空
卫星类似的AMS-02可花了20多亿美元,亦即130多亿人民币)来花,就不能老实地解释
这一点,而必须假装暗物质参加弱作用力(叫做“WIMP”假设,Weakly Interacting
Massive Particles)是个有根据的结论。刚好超弦的基本假设,也就是超对称,天然
就会产生WIMP,于是里应外合,高能物理的理论和实验界都众口一词,把WIMP假设吹嘘
成主流理论,在过去十年里催生了许多个昂贵(即百亿人民币级)的实验,专门要测量
WIMP。这些WIMP实验又分成两类:第一类是在很深的地下,用大量同位素稳定(亦即没
有会自发衰变的同位素)的介质,藉以观察其原子核与WIMP直接进行弱作用力反应,例
如美国的LUX实验和中国版PandaX。第二类则是用卫星来测量WIMP在银河系空间中因弱
作用力而自行衰变产生的正子和电子对,例如美国的AMS-02和中国版悟空卫星。
所以悟空卫星实际上是一个专门测量宇宙线中的正子流和电子流的仪器。但是因为银河
系到处都有磁场,电子和正子在被截获之前,已经转过许多弯了,所以不可能知道它们
的发源方向。那么唯一能测量的,只是它们的能量。结果全世界几百个博士,花十年时
间和百亿元,所得到的,也就是下面这张图:横轴是能量,纵轴是观测到的电子流密度
。然而,宇宙中能产生电子和正子的机制太多了,根本不可能精确计算背景信号曲线。
所以最后只能笼统地看看测量结果的曲线是否平滑。
DAMPE是悟空卫星计划的英文名字,AMS-02和Fermi都是美国较早发射的卫星。这次悟空
卫星团队宣传的结果,就是在图中红线右端没有平滑过渡的一高一低两个点,分别对应
着1.4TeV和1.2TeV的能量。但是有三个疑点:1)Fermi卫星(图中的蓝线)也涵盖了相
关的能阶,却没有看到类似的现象;2)这个结果出现在电子流(纵轴)很低的尾端,
刚好对应着较少的统计样本和较低的统计意义;3)这两个偏离平滑曲线的点,偏离的
程度只有两个统计标准偏差左右,距离物理界传统上要求的五个标准偏差很远,连“有
趣”都谈不上。
一般统计方法假设高斯分布(Gaussian Distribution),两个标准偏差对应着名义上
(Nominally)4.5%的统计噪音机率(亦即有4.5%的机率这个结果是因统计样本不足而
随机产生的噪音)。五个标准偏差则精确到0.00006%。为什么物理界会要求如此高的统
计精确度呢?
这有很多原因,和我们眼前话题有关的有三个:1)实际的随机分布往往不遵循高斯分
布,而有不能确定的胖尾巴(Fat Tail),使得统计噪音被低估。2)两个标准偏差对
应到4.5%的噪音,是假设只有一个数据,像上图这条红线总共有38个数据点,那么随机
出现两个标准偏差数据的机率就是(1-(1-4.5%)^38)=93%;换句话说,没有偏离的
现象才算奇怪。这在物理界叫做“Look Elsewhere Effect”;也就是人类天性就会专
注在“特别”的数据点上,而忘记有多少“普通”的数据点被尝试过了。所以要求五个
标准偏差,即使有10000个“普通”的数据点被忘记,实际上统计噪音仍然只有(1-(1
-0.00006%)^10000)=0.6%,还在可接受的精度内。3)这种简单的标准偏差估算,还
有另一个隐性的假设,就是横轴的测量是绝对精确的,统计误差只存在于纵轴。可是电
子流密度的测量,最大的误差其实是在能级上;换句话说,这张图的横轴误差实际上比
纵轴误差还大,有少数几个1.2TeV的样本被测量成1.4TeV,就自然会有一个1.2TeV的低
点和一个1.4TeV的高点。这是统计噪音又被低估的另一个原因。
正是因为悟空卫星结果的实际统计误差太大,完全没有任何统计意义,所以国际物理界
不把它当回事。但是悟空卫星团队不止是拿一个没有实际统计意义的假结果来蒙混过关
,而且存在误导听众的可能性。我这么说,是因为暗物质如果真的衰变,会产生同样数
量的正子和电子;但是在1TeV左右的能级上,宇宙线中电子流的背景比正子流高20倍,
所以AMS-02和Fermi发表结果的时候,都专注在正子流而不是电子流上,正是缘于前者
的信噪比是后者的20倍。悟空卫星团队反其道而行,显然是正子流的曲线图没有对应到
1.2TeV和1.4TeV的异常点;换句话说,他们其实有否定自己结论,而且信噪比高20倍的
数据,但是有意地藏了起来。万一真是如此,就不止是夸大宣传,而是有作假忽悠之嫌
了。
实际上,WIMP和它所依据的超对称理论,从1986年的Ginsparg & Glashaw论文揭露真相
开始,大多数的高能物理学家就知道不靠谱(例如2000年有行内的赌盘,结果赌LHC不
会发现超对称的占70%),偏偏有关部门在美国超弦界影响下,依然坚持做超对称实验
,两年前的Panda X和这次的DAMPE不但都如有识之士早已预见的做了虚功,而且是美国
实验的重复投资,即使误打误撞中了彩票,也只会是追救护车之举,可有可无。因为比
起美国稍早的版本,它们只多出一点点功能,而美国实验在设计的时候,就已经寻求效
费比的最大化,所以名义上的多出来的那一点功能,其实没有什么实际上的物理意义。
例如这次悟空卫星,牺牲了寿命来追求高一点点的能阶。但是高能级的统计误差本来就
大,再牺牲了寿命之后,就不太可能有足够的统计样本来得到确实的新结果。换句话说
,Panda X和悟空卫星都是在投资上并不明智:不但找到信号的机率很低(小于0.1%)
,就算有信号,美国实验也会先找到。美国人找不到而中国找到的脚本,是完全不存在
的。
相比之下,前面提到Katelin Schutz真正推展了人类对暗物质的了解,所用的却只是几
台简单的个人计算器。