用谷歌流感趨勢跟踪流感

人們在患病期間搜索有關流感的信息並不奇怪。 谷歌找到了一種方法來挖掘這一趨勢,並用它來估計各地區的流感活動。 他們發現,搜索趨勢數據實際上比傳統CDC(疾病控制中心)流感爆發跟踪方法快兩週。

谷歌流感趨勢將為您提供美國當前疫情級別的估計值或按州分類。 您還可以看到過去幾年的趨勢,並尋找一個地方在您附近尋找流感疫苗。

大數據

Google流感趨勢是可以用“大數據”發現的一個例子,這個術語用於描述大量的結構化或非結構化數據集,這些數據集太大而且複雜,不能用傳統方法檢查。

對數據的傳統分析通常涉及將收集的內容保存為可管理的大小。 研究人員使用較小的統計樣本,對較大的群體進行猜測。 例如,通過調用相對較少的人並向他們提出問題來進行政治投票。 如果抽樣類似於較大的群體(比如說馬薩諸塞州的所有選民),那麼小群體的調查結果可以用來對較大群體進行猜測。 你需要有一個非常乾淨的數據集,並知道你在尋找什麼。

另一方面,大數據使用盡可能大的數據集 - 例如Google中的所有搜索查詢。 當你使用一個很大的數據集時,你也會得到“雜亂”的數據:不完整的條目,貓通過鍵盤走過的搜索條目,等等。 沒關係。 大數據分析可以考慮到這一點,並最終得出結論,否則可能找不到結論。

其中一項發現是Google流感趨勢,它考察流感症狀的搜索查詢的峰值。 你並不總是谷歌,“嗨,我有流感,好吧Google,我附近的醫生在哪裡?” 你傾向於搜索諸如“頭痛和發燒”之類的東西。 谷歌流感趨勢的強大之處在於其他非常混亂和大量搜索查詢的輕微上升趨勢。

這不僅僅是一種新鮮事物,因為它比CDC更快地發現流感峰值。 CDC依靠醫生和醫院的積極流感測試。 這意味著人們必須生病得足以造訪足以引起流感測試高峰的醫生,然後實驗室必須報告這一趨勢。 當你能夠動員治療的時候,人們已經生病了。