作为一个外行,笔者试图从数学的视角看一看新冠肺炎之疫情,算是管中窥豹吧。
一、数学来源
峰值与拐点两个概念来源于连续数学曲线(不含直线段)。

图1中,A1、A2、A3为极值点。其中A1、A3处有极大值,又称峰值;A2处有极小值。B1、B2、B3为拐点,是指曲线由凹变凸或由凸变凹的转折点。其中B1、B3为上升段的拐点,B2为下降段的拐点。
不太严谨地说,在极值点处一阶导数为0,即y’=0;在拐点处二阶导数为0,即y”=0。(但不是充要条件)。
如果一条曲线只有单一的峰值点(无极小值),有且只有2个拐点B1、B2,则被描述的事物,从开始到B1可称为爆发期,B1、B2之间可称为高峰期,B2到结束可称为衰减期。(当然是指各段曲线在x轴上所对应的时间)。
二、实际疫情、统计数据与数学模型
影响新冠肺炎实际疫情的有四大因素:
1、病毒在人们身上的出现发展、传播与消失(或潜伏)的规律;
2、人体对病毒之抗体的产生和发展;
3、气候(温度)条件;
4、人类对疾病的防控与治疗。
前两个是内因,后两个是外因。外因终究要通过内因起作用,但绝非不重要,有时还起着决定性的作用。
实际疫情,是在人类与病毒的拉锯战中不断变化的客观存在。对这个基本未知的事物,在不断的“实践、认识、再实践、再认识……”的过程中,从多方调查得来的统计数据是必不可少的。
统计数据不仅是滞后的,而且由于各种主客观的原因,原始数据杂乱纷呈。为了分析甚至预测疫情走向,需要建立数学模型。建模的框架是从过去疫情的发展中得出来的。
数学曲线虽然抽象,但绝非虚幻。科学的抽象反映了事物的本质,排除了数据中的许多偶然因素。实际疫情的发展肯定是多峰值多拐点的,通过滞后的调查数据而得出的曲线也应如此。但是,在总体上往往又可再抽象为一条单峰值(或无峰值)的曲线,到后来它将逐渐逼近实际,但又不可能完全符合实际。

图2是一个极为粗略的示意图,其纵坐标y(疫情)的含义是非常模糊不清的。它大致表达了三者的关系,着重显示了认识对实际的滞后性。比如这次新冠肺炎可能2019年11月就产生了,但公布数据到了2020年元月份。
三、哪些数据重要些
新冠肺炎疫情数据纷繁。我们听到的就有:无症状感染者、密切接触者、疑似病例、临床诊断、确诊病例(轻微、重症、危重)、病愈出院、病亡、死亡率等。许多数据又分累计数、新增数、现有数等。每种数据都有各自的用处。对普通百姓而言,那些数据重要些呢?
显然确诊病例数重要些。图3是从网上搜集的、而又简化了的草图。

图中有三条曲线,分别代表了①累计确诊、②现有确诊、③新增确诊病人数随时间而变化的情况。
什么叫“确诊病例”呢?就是指具备了一定症状且由核酸检测确定为新冠病毒肺炎的人(后文简称为“病人”)。而现有确诊数=累计确诊数-病愈出院人数-病亡人数。
但核酸检测手段本身也有一个不断完善的过程。曲线中1月27日的小凸起就是检测手段改进所致(还有2月13日的5093例可能也是如此)。而2月12日的大凸起,则是因为把13332例“临床诊断数”(前些日子累积的没来得及检测的)并入“确诊病例数”所致(为了“应收尽收”)。如果把这13332人合理地分摊到前面去,则可得一条较为平滑的曲线(图中虚线所示)。
四、选择哪条曲线分析
常规是选择曲线①累计确诊病人数、③新增确诊病人数进行分析,以曲线③为主。

图4把两条曲线更为简化了。纵坐标的名称也简化了:y=累计病人数;△y=新增病人数。
曲线①是单调上升的,没有峰值点,只有一个拐点B。曲线③有峰值点A,它和曲线①中的拐点B正好对应。这时大约是2月5日(参看图3)。
选此法的优点是能够把疫情前期的发展呈现出来:B点前病人数增速很快,乃“爆发期”;B点以后,病人总数仍在继续增加,但增速放慢了(这体现在曲线③A点以后新增病人数开始减少了)。这是符合任何一种疫情的“自然”进程的。
但笔者窃以为,两曲线把人的主观能动性—治疗和护理—排除在外了,从图上无法看出现有病人数的减少,更看不到疫情的“高峰期”和“衰减期”。故而认为,为了呈现疫情变化的全过程,用曲线②现有确诊病人数来代替曲线①累计确诊病人数更为好些。并不揣冒昧,又引入了一条新曲线—图5中曲线④—来辅助曲线②,共同完成任务。

前面图3中,曲线②的纵坐标为y,意义是:y=现有病人数=累计病人数-累计出院数-累计病亡数。
而图5中,曲线④纵坐标为△y,意义是:=当天病人变化数=当天新增人数-当天出院人数-当天病亡人数。(△y可以是正整数、负整数或0)
为了突出重点便于分析,我们先把曲线②、④简化了一下,然后组合在图6里。

五、拐点究竟在哪里
自新冠疫情发生以来,大家不断听到许多专家甚至官方提及“拐点”二字(这几天好像不大提了)。可是,似乎一直没有听到拐点的具体日期。
事先需要指出的是:
1、下面估算的日期,绝非实际疫情真正发生拐点的日期(见图2 的“滞后性”);
2、也不是官方经常强调的“拐点尚未到来”的那个拐点,其意图无从得知;
3、它只是从图6中两条数学曲线中估算出来的,其纵坐标的设定是否合理尚存疑问;
4、但曲线依据的数字,均来自官方正式公布的全国31省区市和新疆生产建设兵团的疫情报告(若换成湖北或武汉的数字,结论变化不大)。
图6中曲线2(现有病人数)的峰值点为A,峰值为58097人,出现在2月17日;第一拐点B1出现在2月5日;第二拐点B2出现在2月27 日。
这些点有什么意义呢?
1、从开始到2月5日,是疫情的爆发期;
2、2月5日到2月27日,是高峰期(A为峰顶);
3、2月27日以后,是疫情的衰减期,尚属“正在进行时”。
六、打一个比方—— 爬山
本来,高峰、峰顶等词就是出自山头。而许多山头或山梁的横断面与某些统计曲线的形状,的确具有某种相似性。(我们不去探讨这种相似性的科学—地质学与统计学—上的起源)。这种相似性,使我们以爬山来比喻战瘟疫,十分自然。
先设想一个极为普通的情形:一个人在白天独自去爬一座既不高也不险的山梁—但他从未上去过,山上也没有成形的路。他必然要过许多沟沟坎坎,有时还要手足并用,故曰爬山。其轨迹必然曲曲弯弯,还有不少回头路,但其总体过程必然是:
1、开头上山还可以,接着发现坡度越来越陡,险象环生。但过了某处(点)之后,发现坡度由陡变缓了。他刚过的那个点就是第一个拐点B1。
2、坡度虽然缓和了,但仍是向上爬。上到“某点”,发现周围山包都比他低—“一览众山小”。这就是到了峰顶(峰点值)A。
3、开始下山了,发现下坡“路”由缓而陡,也有不少危险。下到“某点”后,觉得坡度由陡变缓了。就是说,他已经走过了第二个拐点B2。
4、然后就是走过很长的小下坡(当然仍有不少较小的沟坎)慢慢到达平地。此人和大家都明白了B1、A、B2的意思。
我们再来假设一种非常极端的、不太可能发生的情形:一群蒙昧人被龙卷风卷到了万里之外陌生的山里(所幸均安然无恙),周围是高山峻岭。最要命的是时间已经到了没有星光的夜晚!而他们的知识和技能充其量还停留在点火把和造拐杖的水平—而又不是有备而来。他们的状态可想而知:恐惧、慌乱、狼狈……要想走出(应为爬出)大山,要多花五倍的努力与时间!甚至要付出生命的代价……即使经过了某个拐点,他们也要很长时间才能领悟。(有人说,第一拐点,不是“黎明前的黑暗”,而是“半夜零时的艰难”)。即使到了峰顶,由于没有微光,人们仍然战战兢兢:谁知道前方的路上还有多少高峰呢?
一切比喻都有缺陷。我们碰到的新冠病毒肺炎,当然不是普通的困难,可也不是什么灭顶之灾。我们的科技水平,也不是哪个千人登山队可比。我们的人民也决不是乌合之众,而是有坚强领导的“数亿神州尽舜尧”!下好“全国一盘棋”,推进“人类命运共同体”。曙光就在前头!
2020年3月5日终稿
「 支持乌有之乡!」
您的打赏将用于网站日常运行与维护。
帮助我们办好网站,宣传红色文化!
欢迎扫描下方二维码,订阅乌有之乡网刊微信公众号
