归因传染病动力学模型


生态学角度去研究环境因素对传染病的影响,早已贯穿整个传染病研究史。我们不仅仅需从传染病本身去观测其传播特性,如传播力等,我们也关心传染病发生发展规律过程中的环境驱动因子。疾控事业的核心依然是寻找作用干预靶点进而促进健康(控制环境因素可能实施难度会较大)。如何更准确且有效地寻找传染病的环境驱动因子,这是一个牵扯了众多复杂过程的难题,尤其是针对非人传人传染病。但是路难走依然还是得继续,本研究在传染病动力学模型的基础上融入环境流行病学思想,构建了归因动力学模型(Causal tranmission model),用以探究人传人传染病(比如大部分呼吸道传染病和肠道传染病)可能的环境驱动因子。


别人怎么做


研究一个因素是否会对目标变量产生影响,我们可采取最简单的方法:线性回归,但简单的方法往往有其简单的局限性,对于线性回归而言,需保证因变量的生态性独立性。但对于传染病,下时点传染病的数量往往受到此时刻传染病数量的影响,故独立性这个先决条件难满足。故而,很多学者改用广义线性或者广义加性模型,这个确实可以有效摆脱数据独立性的限制,包括近年来新出的CCM算法,但是,这些方法“囫囵吞枣”般研究模式(不考虑传染病传播规律)得出来的结论往往让人“食之无味“,比如温度对传染病的效应在某个区域为正向的,但研究区域一换则效应也发生本质变化。在哲学中始终流传着一段话:我是谁,从哪儿来,最终回哪儿去。故最好的方式莫过于采用传染病动力学模型,既能充分考虑传染病传播特征,又能增加相关生物学假设来检验效应的有无及大小,何乐而不为?


我们缺什么


动力学模型主要是用以预测传染病的发生发展趋势及评估干预措施的效果,较少用以探究环境因素对传染病的影响。一方面是因为传染病动力学模型中未知参数过多会影响到目标参数求解,另一方面,目前主流算法对目标参数的求解需要较强的计算机资源支持。当然,随着近些年计算机能力的快速发展,各种类型的服务器及超级计算机相继问世,使得计算资源这个门槛已经不那么严重。但这些年看来,往往是软能力的缺乏,导致了环境因素与传染病间关系的研究一直没有较大突破。传染病研究,软能力更加侧重于传染病流行规律及其动力学模型内在意义的理解,这些知识将是准确探究环境因素与传染病关系的基石。


我们怎么做


建立一套合理的框架有效结合传染病动力学模型和环境流行病学相关知识,是给予环境因素与传染病关系合理解释的重要手段。既需结合环境流行病学和传染病动力学模型,那自然需要懂这两块内容所关注的靶点。环境流行病学关注的是关系强度滞后效应阈值效应;而动力学模型关注的是模型设定方式及其对实际疫情的反映程度。一个合格的动力学模型是既能符合传染病传播模式及其内在生物学特性,同时又能较好地与监测数据进行耦合。需要注意的是,动力学模型中所涉及的生物学过程,为环境流行病学相关理念的插入提供了很好的作用靶点。


作用靶点集


动力学模型会将目标人群认为多个状态,以SIR模型为例,目标人群被分为易感者,感染者和恢复者,其中易感者会受到一定程度感染力的作用而变成感染者,而感染者经过一个感染期后成为恢复者,恢复者获得终身免疫不再受该传染病影响。对于人传人传染病,环境因素只有两个靶点可以作用:作用病毒本身,影响了传播力和毒力;作用人群影响人群活动模式、人群免疫力。对于人群活动模式和传播力,可都归纳于传染力,因为气象因素对于人群活动模式的影响还是很有限,除非是相关极端气象因素如飓风等,人群活动模式不会有较大的变化。当然,我们研究组前段时间做的一个分析发现不同季节人群接触模式存在差别,但这个能否去解解传染病的季节性特征仍需进一步研究。而环境因素对病毒毒力和人群免疫力的影响,也可进行有效捆绑,目前还没有何种证据去支持气象因素可以影响病毒的毒力(病毒毒力主要由病毒本身决定),故此处可归纳为对人群免疫力的影响。因而,在归因动力学模型中我们将环境因素作用于传染病归纳为两个环节:1. 环境因素影响病毒感染力;2. 环境因素影响人群免疫力。这两个环节如何有效地嵌套到动力学模型框架中呢?


作用靶点嵌套


环境因素作用于感染力可直接嵌套在动力学模型中,因为传统的动力学模型中的感染力其实已是综合了多种环境效应对传染病感染力的影响,而此时我们要做的也只是将环境因素效应从这综合效应中剥离出来。而环境因素是如何改变人群免疫水平进而影响传染病传播的,是目前难点。正如上述提及的,环境因素影响人群免疫力会改变人群对于该病毒的易感性,同时也会影响人群感染该病毒后续一系列临床表征。为了更好地将效应剥离,我们做了一个很粗鲁的假设:环境因素并不会改变人群对病原体的易感性。这个假设可以这么理解:环境因素对人群易感性的影响相比于环境因素对病毒本身的存活及活力的影响要弱的多,故可将其忽略;另一个方面,在整个感染过程中,环境因素变化与否,人群对于病毒的清除能力并不会发生质变(对于免疫力的影响还未达到影响阈值水平),接触病毒后(来源于外界环境或直接来源于接触者)该感染的还是感染,该排毒的还是排毒。另一方面,环境因素改变人群免疫力会产生另一个现象:环境因素影响感染人群就诊比率,比如人群免疫力的下降会使得人体更易出现相关临床症状进而去医院就诊而被登记为病例,降低隐形感染率(1-报告率~隐形感染率)。这个假设可有效地嵌套到动力学模型耦合监测数据过程中(measure process)。


两个假设-两个靶点


综上所述,我们将环境因素作用于传染病传播演变过程中的两个环节:影响病毒的存活、繁殖等;影响人群免疫力进而影响出现临床症状而就诊的比例数。对于不管是SIR模型,还是SEIR模型,都可将两个假设嵌套到动力学模型框架里,也就是说这套假设具有普适性。同时需要注意的是:第一个假设会影响动力学模型的动态性(dynamic process),但第二个影响的仅仅是病例耦合(measure process),对动态传播过程没影响。这样设置最大的益处是方便参数求解。众所周知,若多个参数嵌套在动力学过程中,但耦合的只是动力学过程中病例数和实际监测病例数,这会使得参数的不确定性增大。换句话说,多种参数组合会得到同样的效果,哪组参数更嵌合实际自是无从知晓,因为再无其他信息可用以判断。当然,考虑到模型的稳定性及环境因素效应的可比性,我们会对模型进行相关调整,主要包括:环境因素的标准化;报告率设置为logistic形式;不同环境因素作用靶点设置(比如,环境流行病学大多探讨相对湿度而非绝对湿度对健康效应的影响。)


参数求解一:框架设置


有了模型框架和数据,接下来自然是去求解目标参数及其可信区间。目前主流思路是在隐马尔可夫模型的框架基础上,采用相关统计算法求解目标参数。之所以采用隐马尔可夫模型,这个和该模型独有特性有关。隐马尔可夫模型具有两大特性:1. 模型框架中有隐状态,也就是不可观测状态。对于SIR模型来说,人群中有多大比例是易感者,多大比例是感染者,在真实世界里难以获知;2. 马尔可夫特性,即t时刻的状态,只与上一时刻(t-1)该状态有关,而与其他时刻该状态无关。这两大特性都很好地满足了动力学模型中各状态的动态演变规律。对隐马尔可夫模型中参数求解,既可采用频率派的方法,如粒子滤波算法,也可采用贝叶斯方法,如偏蒙托卡洛算法。这些算法都已经集成在pomp程序包中,会R且懂C这即可调用。


参数求解二:阈值效应


上述只说到最简单的情形:各环境因素作用靶点的方式是线性的。对于部分情形,线性方式可近似作为两者关系的表述,但对于某些环境因素如温度等,其对人体免疫力的影响是非线性的(一般认为是U型,温度过高或者过低都会降低人群免疫力)。对于这类存在阈值的作用情景,该如何在动力学模型框架下进行定量评估呢?首先,我们需要同时设定一个二次项和一次项系数,求解这两个系数的组合值(考虑到一次项和二次项系数会相互影响),若二次项系数不为0,则说明该环境因素对该靶点存在阈值;反之,则线性方式拟合也算最优。接下来,我们还需要从生物学角度去评估该环境因素对该作用靶点的效应是何种阈值形状:J型,U型还是V型。不同阈值形状所采用的计算方式并不一样,最简单的是V型,具体实现思路如下:假设该环境因素取值为[a,b],将其范围划分为10等分,分别对环境因素根据等分点进行V转换,再代入模型求解其参数值及似然值,参数值显著且似然值最大者所对应的点即为V型效应阈值。对于U型阈值则需在V型阈值的基础上增加组合参数值的求解:简而言之,低阈值和高阈值组合而成的那套参数出现了阈值特性才能将其认为是阈值点。当然,U型阈值相比于V型,会有一个很明显特性:V型转换后求解的各参数值会随着转换点的增大而降低,且在中间值处会使得参数值接近于0。


参数求解三:滞后效应


另一个需要关注则是滞后效应。滞后效应的评估带有点非合理性。由于归因动力学模型主要是针对周数据,因而环境因素不管是作用于病原体本身还是人群,滞后效应都极其有限,尤其对感染力。就理论机制而言,上周环境因素对本周病原体的生存及活力所产生的影响应该要远小于本周环境因素(病原体体外存活时间较短),同时环境因素在时间层面上呈现出来的自相关性会使得效应出现明显的归拢现象:本周环境因素对作用靶点的效应从整体上会是多个时点效应的总和。当然,突发的环境事件可能会改变此情形,但归因动力学模型评估的是综合效应,非特殊场景下的极端效应。故综上所述,我们一般将滞后效应设置在报告率这个靶点,而非感染力。具体而言,只需要将环境变量代入模型前进行滞后处理,参数求解而得的即为该环境因素的滞后效应。需要注意的是,在同一个作用靶点下,不要同时评估滞后效应和主效应,这样会导致滞后效应的不确定性增大。


相对危险度与归因百分比


公共卫生专家关心的是环境因素与结局变量的联系强度。正如前面提及的,传染病中存在隐性感染(不同传染病隐性感染比例不一致),所以环境因素与结局变量间的强度则可分为环境因素与感染病例数(RRp)及环境因素与监测病例数(RRt)。前者度量的是环境因素在动态过程中的作用,而后者,则反映的是环境因素在动态过程和耦合过程中的综合效应。当然,不管哪种,都需要注意在参数求解过程中我们对各环境因素所做的标化处理,因而此处得出的关联强度反映的是在均值基础上改变一个标准差所带来的效应。具体而言,RRt的计算可采用simulation的方式:设定环境因素为1进而计算总报告病例数,设定环境因素为0时计算总报告病例数,前者环境因素为均值增加一个标准差的发病风险,而后者则为环境因素为均值时的发病风险,前者除以后者则为在均值基础上改变一个标准差的相对危险度。考虑到模型结构中的随机性,将上述过程重复100次即可获得RRt的置信区间。


莫问英雄出处:何去何从


整个归因动力学模型的框架已介绍完毕,接下来则要探讨模型的优劣。众多模型中,不管是前面介绍的广义相加模型还是模型结构更为复杂的分布非线性滞后模型,又或者是几何模型如CCM,归因动力学模型具有如下优势:

  1. 传统模型只拟合的只是监测病例数,获取得到的只是该环境因素对监测病例效应,而非实际病例。在准确评估环境因素所产生的公共卫生效应时,应该考虑产生的总病例而非报告病例数。

  2. 某些环境因素对人体和病原体作用方式不一样,比如高温会降低病原体活性,但会降低人体免疫力而提升疾病报告率,这会使得传统方法估计温度总效应时存在很强的区域异质性,且无法解释。

  3. 分靶点的阈值效应,相比于传统方法中的单阈值,可更好地与实验室对比进而验证方法的可靠性,同时解释环境效应对传染病的区域异质性。

当然,归因动力学模型也存在诸多不足之处,1. 计算较为依赖计算资源,整套计算完成需要近几天甚至几周。2. 动力学模型去耦合传染病监测数据,比较依赖好的模型框架,比如SIRS模型简化成SIR模型,会使得参数求解变得异常曲折。一个能较好反映传染病特性的动力学模型框架是归因动力学模型的基础。3. 归因动力学模型将效应分割成作用人体和作用病原体两部分,但由于环境因素对人体免疫力的影响会改变其对病原体感染后的清除能力,因而环境因素作用于病原体的部分其实是作用于病原体和作用人体易感性的总和。

Previous     Next Spatial-R /
Published under (CC) BY-NC-SA in categories 科研  tagged with R  传染病  环境因素