高致病性禽流感(HPAI),特別是H5N1亞型,已導致全球反複爆發,主要影響鳥類,但偶爾會在人類之間傳播。這些事件構成了嚴重的公共衛生和經濟風險,需要加強監測。這項研究以加拿大的機器學習模型為例,評估了用於預測高致病性禽流感爆發的基於網絡的新數據。通過應用程序編程接口(API)驅動的管道並結合曆史高致病性禽流感案例,自動收集並整合了七個基於網絡的資源,即穀歌趨勢、穀歌新聞、全球事件、語言和音調數據庫(GDELT)、Reddit、臉書、最低溫度和空氣質量(紫外線指數和CO水平)。使用深度學習模型進行預測:門控遞歸單元(GRU),長期短期記憶(LSTM)及其與卷積神經網絡(CNN)的組合。包括經典的機器學習模型,隨機森林(RF),支持向量機(SVM)和樸素貝葉斯(NB)進行比較。使用均方根誤差(RMSE)和相關性評估模型性能。使用排列方法和Mann-Whitney U檢驗評估特征重要性。GRU提供了最准確的預測。曆史病例數據是最重要的因素(p<0.01),其次是Facebook活動和最低溫度。這些發現表明,將多種數據與機器學習相結合可以增強高致病性禽流感的早期檢測,從而能夠及時做出公共衛生反應並減輕經濟影響。