魔都渡劫记2022-05-04

小区封控的第4⃣️7⃣️天,今日的午餐是香干西芹配萝卜烧鸡腿。一举消灭西芹半颗、白萝卜半截,也算是去库存有成。做法都很简单,今天就不赘述了。 img22050401

中午赶了个末班车做了一次核酸,补上了4月26日以来空缺。平时上班时间做做抗原还行;做核酸的话,实在有点忙不过来。如果真如传言5月8日大解封的话,也是有最新核酸记录了,当不影响。

今天是五四青年节。每年的这一天,其实都有点尴尬。主流话语一方面要维持自己的左翼传统、倡导大家纪念五四,另一方面又各种语言不详、不好意思说究竟要纪念五四什么、以及要如何纪念五四。毕竟火烧赵家楼这种极端案例,一不小心就真的成了“经学家看见《易》,道学家看见淫,才子看见缠绵,革命家看见排满,流言家看见宫闱秘事”。鲁迅评论《红楼梦》的话套在这里也是合适的。

五四究竟是什么样的?各花入各眼。这里推荐一本2019年为纪念五四百年杨念群写的《五四的另一面》,可作参考(链接参加文末)。其中有云: img22050405

除了史学界自己的官司之外,这里面基本也算是点到了每次纪念五四都绕不开话题德先生、赛先生和莫小姐。八卦一点的是,这个杨念群是杨度的曾孙。对,就是那个投靠过清末民初几乎所有势力、争议满天下的奇人杨度。

莫小姐现在似乎也不太受人待见,不好谈。再说刘再复、李泽厚老早就说要《告别革命》了。再谈确实有点不合时宜。德先生的话,好死不死的跟拜登、佩洛西他们那里重号了,咱总不能拾人牙慧吧?那今天就借着疫情的事情,说说赛先生。

所谓的赛先生,其实是五四一代对西词science的戏称。今日所对应之“科学”二字则是当年严复直接借用science的日语译名而来。在日语中,“科学”一词作为译名出现于明治初年,是从“分科之学”的意义上理解science的。这个又有点跟中国传统的格物致知的“格致之学”混淆,当年章太炎好像还就此打过笔墨官司。

这个译名最容易让人误会的地方在于,不仅容易忽视现代西方学术与传统中国学术的重要区分,也容易忽视science的基本要义以及它背后所代表的西方思想传统。从这个角度来说,李约瑟之问约莫可以赖皮等价于问:为啥你一个十代纯粹华人生不下一个洋娃娃出来。而我们常讲的,“某某事科不科学”,这种将“科学”作形容词使用,其实是在说某某事符不符合科学精神的口语简称,这个是语言学里面的常见异化现象,与科学本身的内涵无关。

那么究竟什么是科学呢?这个话题有点大、说起来有点绕,各家看法不一。但基本可以这么来看:在归纳主义科学观看来,科学是对事实进行归纳推理之后所得到的结论;在否证主义者看来,可以被检验的理论才能被叫做科学;在结构主义科学观看来,一门科学是遵循同一范式的多个理论的集合;在贝叶斯主义科学观看来,科学理论的对错未必是绝对的,而是一个概率问题。

可见,科学首先是一种探究问题、解释问题的方法论。它只负责方法本身,只负责结论的可靠性、而不负责结论的正确与否。结论可被证实也可被证伪,但是路径、方法与手段本身才是科学所坚持的要义所在。

及至今日,我们日常对于科学一词的种种滥用,其根本原因也在于对科学一词的内涵的严重误解。比如,时下常见将种种混合着诸多价值判断的社会、人文类学科都冠以科学一名,即是一例。另外一例,则是从实用、应用的角度理解科学,倾向于把科学混同于科技,科技混同于技术。滥用到什么程度呢?比如在如今比较热门的计算机领域,懂点怎么从数据仓库抽取数据、做点数据汇总与数据加工的,但凡高端点的就会叫自己data  scientist。而那些会套个神经网络模型、调个参数做数据分类或者预测的,更是不叫自己scientist,大有旁边的人都不答应的阵势。

其实这俩词分野非常明确。科学负责why的问题、技术负责how的问题。比如用砖头造房子这件事情。科学负责从理论力学、材料力学、分析力学等角度论证这些砖头是否适合用来造房子。而技术则是负责怎么设计图纸、怎么制作脚手架、怎么封顶、怎么收尾、怎么防晒甚至怎么制定工民建国标等等。不可否认的是,二则中间会有比较多交叉与相互配合的部分,但总体上这个why-how的划分是不错的。

而所谓科学研究过程一般是指,先根据某些前提条件及基本信息构建假设,然后运用各种技术手段去证实、证伪该假设,最后得出结论的整个过程。如果前提、基本条件与研究的技术手段都是一定的情况下,结论应该是可重复的、可解释的。

举个例子,我们今天就拿魔都的防疫数据来说说。

【前提】: 1、魔都卫健委数据是准确的、数据口径定义是前后一致、未改变的; 2、自始至终我们面临的是同一种病毒Omicron的BA.2毒株; 3、相同的病毒在短期不同时间内的传播表现具有高度的一致性。

【假设】:魔都卫健委数据没有问题。

【论证过程】: 1、根据卫健委数据每日发布数据,整理出自3月19日以来的每日新增确诊与每日无症状感染人数; 2、根据前提1、2、3,可得出推论每日各区的新增确诊与新增无症状感染之间存在一个合理的结构性比例; 3、由第2步可构建出一计算指标=每日新增无症状感染人数 / 每日新增确诊人数。 4、将数据导入Excel,利用Excel的条件格式工具,对这个计算结果进行数据可视化。可得如下图。 5、通过仔细观察与分析下图,可以看出该指标在4月13日至5月1日之间,有着与其他时段分布完全不一致的表现。而这一点与本次研究的前提1、2、3点直接违背。

【结论】:因此,可拒绝接受原假设,认为魔都卫健委数据可能存在问题。不是数据不准确、就是中途修改过定义或口径(也不排除二者兼而有之的可能性)。至于究竟是什么问题,这个需要进一步的信息公开与研究来厘清。 【推论】:该指标整齐划一地显著偏离历史均值,只能有两种可能:要么是分母变小了;要么是分子变大了。结合4月13日至5月1日之间的新增确诊、无症状感染暴增这一事实,合理的解释只有一个。即在此期间的新增确诊人数增幅明显高于其余时段。即可能在此期间,调低了确诊threshold。 img22050402

需要指出的是,这里使用Excel的条件格式工具来做data visualization就是一个典型的技术问题。你当然可以通过直接计算这些指标在每天、甚至各区的最大值、最小值、平均值、中位数、分位数、标准差等一系列描述统计指标来发现和得出一样的结论。这个就是不同技术手段的殊途同归。如果通过不同技术手段得出的结论不一致,那么首先应该怀疑的就是研究方法本身的差异性了。

上面的问题,直接从数据层面是无法得到合理解释的。但当你从今天微信群里都在传的孙梁关于CT值调整的对话过程的时候,一个合格的研究者当可自行推出自己的下一个假设。循此往复,直至找出问题真正所在。 img22050403 img22050404

这里需要指出的是关于CT值的问题,可以参考文末所附的知乎普及贴以及3月中旬澎湃新闻提到的第九版诊疗方案中的CT值下调问题。至于孙梁在此期间究竟做了些啥,这个问题就不妨让子弹飞会儿吧。

魔都的问题,从来就不是科学不科学的问题。

参考资料