大數據溯源:美國新冠“零號病人”大概率2019年4月出現
(抗擊新冠肺炎)大數據溯源:美國新冠“零號病人”大概率2019年4月出現
中新社北京9月22日電 (記者 孫自法)中國科學院科技論文預發布平臺(ChinaXiv)9月22日發表一項基于新的大數據分析方法得到的溯源結果顯示,美國新冠“零號病人”大概率出現在2019年9月前后,最早是羅德島州首例感染發生概率50%的日期為2019年4月26日,遠早于美國官方公布的全美首例確診日期2020年1月20日。
當前,新冠病毒溯源是全人類面臨的共同挑戰。一系列研究已顯示,美國、西班牙、法國、意大利、巴西等多國早在中國疫情暴發前就已出現遭病毒侵襲的痕跡。為快速、精準地推進溯源,數學家開始嘗試基于大數據分析的溯源方法,和生物學家共同尋找“零號病人”。
在最新這項大數據分析工作中,科研人員基于已公開數據并根據傳染病模型和統計方法,建立最優化模型,對美國部分州和中國武漢市、浙江省等地的疫情起源時間進行了推斷。該研究論文提出,結合數學模型和人工智能技術對傳染病進行定性和定量分析,可以揭示傳染病流行規律。目前,根據傳染病模型和數據進行疫情預測的研究比較多,但是利用大數據分析的方法建立數學模型“倒推”疫情變化的研究,中外都比較少。
在論文中,科研人員主要根據經典傳染病模型和統計方法,建立“模型與數據混合驅動的疫情傳播模型”,并且應用最小二乘估計和核密度估計方法,得到模型參數。他們利用美國東北部12州每日公布的疫情數據,分別求出美國東北部這12州的初期疫情傳播模型所對應的參數。在此基礎上,推斷出它們各自的首例、50例和100例的感染時間及其對應的概率。
計算結果顯示,對于美國東北部的12州,新冠疫情首例感染發生大概率出現在2019年9月前后,最早是羅德島州首例感染發生概率50%的日期為2019年4月26日,最晚是特拉華州首例感染發生概率50%的日期為2019年11月30日,均早于美國官方公布的全美首例確診日期2020年1月20日。
此外,為驗證這一新方法,論文研究團隊還利用同一模型和中國的公開數據,推斷了中國武漢市和浙江省首例、50例和100例病例感染時間。武漢市首例感染發生概率50%的日期為2019年12月20日,浙江省首例感染發生概率50%的日期為2019年12月23日。據此推斷,中國新冠疫情大概率從2019年12月下旬開始流行,這一結論與流行病學調查結果基本相符,證明該計算方法準確可靠。
該研究論文表明,如果其他國家或地區疫情傳播初期檢測數據比較準確,可以利用該方法對疫情起源時間進行推斷,在給定概率意義下計算出首例和若干例的感染時間。(完)
- 專題:抗擊新型冠狀病毒肺炎
國內新聞精選:
- 2024年10月22日 11:08:38
- 2024年10月22日 10:40:34
- 2024年10月22日 10:35:46
- 2024年10月22日 10:11:01
- 2024年10月22日 09:39:56
- 2024年10月21日 22:09:49
- 2024年10月21日 20:16:44
- 2024年10月21日 16:49:55
- 2024年10月21日 15:55:25
- 2024年10月21日 15:51:55