内特·希尔结合亲身实践告诉读者,做一名优秀的预测家到底有多难。
内特·希尔以统计学家与预言大师的名号蜚声全美,在2008年总统大选中,他成功预测了49个州的胜出者;而在过去的一个月间,他在全部50个州的“押宝”悉数命中。面对各种非议乃至恶言谩骂,他仍默默地坚持着自己的风格,要将选举分析做到极致。
尽管希尔的预测相当靠谱,他的新作《信号与噪音》不偏不倚地展现了预测的美好与丑陋。在书的前半部分,他考察了金融、体育、政治、健康及天气领域的预测水平。在后半部分,他讨论了预测的改进方式和它们在阐述全球变暖、恐怖主义及市场泡沫方面的功用。
本书的精彩之处在于,希尔提供了不同领域的、足够丰富的细节,分析了为什么有些领域的预测结果会比其他领域的更可信。为此,他寻访了很多专业人士,其中一个线索性人物是心理学教授菲利普·泰特罗克。泰特罗克收集了相当可观的数据,试图让公众相信:教授、记者、政府官员做出的大多数预测是毫无价值的,希尔对这点深表赞同。
希尔提到了古希腊抒情诗人阿尔齐洛科斯的名句“狐狸多才多艺,刺猬只会一招看家本领”。专业人士做起预测来更像狐狸,他们仿佛不基于事实就能给出结论,却通常比那些自命不凡的专家干得更好。其实,希尔在《纽约时报》网站开设的竞选博客FiveThirtyEight.com,就说明他自己是头老狐狸。与之形成鲜明对比,刺猬型专家的极品要数所谓“热狗型”,这类专家具有共同的特点:自负,忽略可能性的存在,给出的预测自然离题万里。
毋庸置疑,数据越丰富的领域,预测效果就越好。棒球作为其中之一,希尔亲自参与开发的分析与预测系统PECOTA被证明非常成功。同样是因为数据充足,包括飓风路径及洪水水位在内的天气预报也得到持续改进。做到这一点比在体育馆里预测今晚的球赛输赢更难,因为与棒球专家不同,气象员应对的是一个动态的、快速变化的系统。
按希尔在书中的描述,在爱德华·洛伦兹(译注:美国气象学家,1963年首次提出“蝴蝶效应”概念)的年代,他苦心建立的气象模型极其不合用,只要随机往其中插入一个与之前不同的数字,最后得出的结论就会南辕北辙,没过多久便看不出任何相关性了。即便在今天,模型的改进及强大的计算机显著提升了短期天气预报的准确度,模型对初始条件的敏感性——众所周知的蝴蝶效应——依然使得长期预报的准确性比猜拳好不了多少。
缓慢改进天气预报准确性的方法已经出现,希尔将其同18世纪英国牧师、概率理论先驱汤姆斯·贝叶斯的贡献联系起来。该理论允许系统在接收新信息的情况下,连续更新一些事件的概率。贝叶斯理论很了不起,但对初始概率估算等细节还存在争议。
尽管贝叶斯理论在书中占有重要位置,希尔并没打算透彻地阐明它,只是简单地给出了一个代数表达式。同样,他避免过多地展开其他专业概念,这与他以往对次贷危机、流行病、经济甚至扑克牌进行深入分析时祭出的复杂理论形成鲜明对比。
希尔擅长发现看似不相干的领域的相似点,将全书串连起来。地震与恐怖袭击就是很好的例子。虽然地震预测目前仍不可能,地震强度符合所谓“幂数律”的事实,毕竟能让我们意识到:震级递增的地震的发生频率,以相当有规律的方式递减,所以能依此估算特大地震多久会发生一次。类似的结论对恐怖袭击也成立,因为恐怖袭击的级别也服从幂数律,我们能按照恐怖袭击发生频率的变化规律估算“9·11”是否会重演——概率极低,但确实不等于0。
总之,对于不同领域的预测情况,《信号与噪音》均给出了引人入胜而富有启发性的纲要。就此,基于本人这个样本,笔者斗胆预测:全美所有50个州的读者都会有同感。
美国《华盛顿邮报》