巨大數據 藏著未知的機會
什麼是大數據?大數據是指針對非常大量資料,泛指資料大小至PB級(至少1000顆1Tera的硬碟才裝得下)的資料做分析。而大數據是要對資料全體做分析,不是只選其中幾個抽樣做代表來分析;大數據重視資料之間的關聯性,就像美國人發現在週四晚上買尿布的人同時買啤酒的機率很高, 因此把啤酒放在尿布附近, 讓消費者可以很容易的買到啤酒;我在學大數據的前身資料探勘時,得知資料量越大, 資料探勘的結果代表性越夠, 而在以前是沒法做到這麼大量資料的分析的,但現在Google找出的讓很多電腦可合作一起處理的方法,而每台Linux的個人電腦系統又很便宜, 讓這樣的非常大量資料分析準確性提高很多, 也因此成為現在的顯學。