摘 要

靠谱?不靠谱!

3月30日,朋友转了一篇文章《用Excel来预测一下明天的上海的阳性病例数量》。看后极为震惊。

文中用过去上海3月28日之前18天的阳性病例数据,利用Excel的“设定趋势线”,预测了3月29日以后,上海的每日新增数据。

其中,29日的数据与公布数据非常接近,因此被小郝许多朋友点赞、转发、甚至赞赏,迅速达成阅读10万+。

更扎眼的是,他的预测下,甚至算到4月13日,单日新增到了10万+的地步,又一个预测大神就此诞生?

但小郝作为一个金融工程毕业的学生真的看不下去这种误导,在上海异常艰难的时候,继续这种不明原理、乱带节奏的博眼球做法,给上海添乱,必须吹毛求疵地说明他究竟错到哪里:

1、万能的预测方法?错!

小郝常做科技公司财报分析,就拿京东近13年的营收来用,套用王先生的方法,立马就能做出更好的趋势线,四项式下,R2拟合度(决定系数)高达99.9%。

与之类似的,还有亚马逊近10多年的营收,苹果公司近2012年前的营收,都能做出类似的预测公式,R2超过99.4%比比皆是,王先生说的“在统计学里面非常少见的精确”,完全不存在,明明是很常见。

同时,这些模型也都能精准预测那些公司近两年的营收,误差极小,难道这就是完美又万能的预测方法?绝非如此,反例立刻来打脸。

拿苹果2001-2015年的营收数据做这类模型,做图如下:

其趋势线预测下2016年营收是2447亿美元。

可现实呢(图3)?2016年苹果公司的营收只有2170亿美元,是15年来第一次下降。销售负责人换将、外部环境影响等多重因素,造成了整个预测模型的失败。

可见,Excel做的简单预测模型,根本无法精准预测“拐点”何时到来,毕竟单一维度的数据,实在单薄,根本无法覆盖造成数据变化的复杂因素和假设变更,这正是统计学里“蝴蝶效应”的本意。

2、尊重专业,别做“野仙”

没错,Excel提供了方便的统计工具,但其背后的统计原理,逻辑假设,王先生真的明白吗?

统计预测是极为严谨的,要考虑的因素,对假设条件的考量都极为严苛,稍有不慎,预测就变得南辕北辙,因为现实状况本身就是复杂多变,一个小要素的变更,都可能毁掉整个模型的基础。

所以,单一数据的统计模型,向来在严谨预测里从未被大量采用,就像基因和某种疾病的关系,常常说只“存在统计学上的关联”,而确认基因是导致疾病的关键要素,还需要海量的各种方面的验证。

因为专业,才能分清什么是“王道”,什么是“旁门左道”。

如果用Excel选一组数据,做个趋势线就能预测世界的种种现象,那还要复杂的统计学干什么?还要计量经济学、计量金融学复杂的理论干什么?

套用《潜伏》里余则成、李涯“录音大决战”里的台词,王先生现在的所作所为就是不懂其中的“基本原理”。

的确,王先生是知名企业家,创立的百姓网也已经上市,也拿过“青年精锐”的称号,还是技术专家出身,但统计预测,并非您的专业,就拿兴趣来当真理,是不是太不把病例预测当回事了?

我2012年采访过王先生,映像里他是谨慎、逻辑严密的理工男,应该不会走网红“野仙”的路子,要做“高手在民间,失手在阴间”的事。

只是,当下上海正值关键时刻,担忧、难过、不平等负面情绪已经不少,此时,王先生还火上浇油,搞出数据如此扎眼的不靠谱预测,不是更激化矛盾,制造焦虑?这和当年的“咪蒙”有啥区别?这对病例清零有什么好处?

所以,请王先生把专业预测的事交给专业的机构,只有孙悟空的爱好,没有孙悟空的本事,还捉哪门子妖啊?

小郝知道,写了这些,也没有王先生的能力造出10万+的阅读,毕竟,数理分析都太过理智。比不过那些“专业不够,手段来凑”高人。

但我真的只想让周围的上海朋友,不要被误导,尤其在现在信心不足的时候,变得更加恐惧、难过、焦虑。

愿大家都好!

感谢您看到这里

转发收藏加点赞

祝您喜乐合家欢

≧ ≦

关键词: 必须争锋相对 王建硕做上海阳性病例预测 这是怎样的误导