四、觀察數據的重點與方法
數據分析首重數據本身,所以在選擇數據進行觀察時,我們需要挑選有意義的指標,並且觀察數據的目的是希望在數據分析後能夠察知數據特徵或規律背後隱含的關鍵資訊,所以選擇觀察數據的方法,就會從我們希望從數據身上看到哪些要素有關。
專注於代表性的指標
數據觀察的首要步驟是識別具代表性的指標。有些指標可以單獨講述一個完整的故事,因為它們能夠精確地反映數據的核心變化。例如,在財經與金融市場中,某些指標如GDP增長率或失業率能夠提供有關經濟健康狀況的直接信息。然而,在某些情況下,我們需要多個指標來組合成一個有意義的故事。例如,當分析股票市場時,不僅要看股價走勢,還需要考慮交易量、宏觀經濟數據等其他相關指標。專業知識在這裡起到了至關重要的作用,幫助我們判斷哪些指標是關鍵,哪些指標是輔助。
按部就班地進行數據分析
數據分析與理論學習的最大不同在於,數據分析需要實際運行數據來獲取結果,而不是僅僅依靠理論推測。初學者應該一步一步地進行數據分析,從數據的收集、整理到分析和可視化。這樣做不僅能增加對數據的理解,還能積累實際操作經驗。對於那些聲稱在跑數據前就知道結果的人,他們憑藉的是經驗,而不是可學習和傳承的方法。初學者應該通過實際的數據運行和觀察,逐步掌握分析技能,並能識別異常值或數據錄入錯誤。例如,在分析新冠肺炎影響時,數據可能會顯示出與平常不同的特徵,這需要通過實際數據運行才能發現。
重點觀察時間序列數據
在數據分析中,時間序列數據的觀察尤為重要。這包括觀察趨勢的持續時間、趨勢的方向、趨勢的轉折點以及趨勢的變化。這些要素能幫助我們更好地理解數據的動態變化。
趨勢持續時間
了解趨勢從開始到結束的時間跨度,這能幫助我們預測未來的變化。例如,某種趨勢持續了多長時間,這有助於我們判斷它是否會繼續保持下去。同時也有助於我們比對是否新增加的數據造成整體性的趨勢改變可能。
趨勢方向
觀察趨勢是向上還是向下,這能直接反映數據的變化情況。例如,股價是上漲還是下跌,這能幫助投資者做出決策。多數在看數據趨勢的分析人員都以此為基礎能力,而這點通常使用觀察法就能做到。數據分析師之間的能力差異則展現在你所找出來的趨勢精準程度。有的數據分析師能夠抓出精準的趨勢時間範圍,所以判斷趨勢方向同樣也很精準。而這點還須搭配下一個要素 - 趨勢轉折。
趨勢轉折與時間點
識別趨勢何時發生變化,這能幫助我們抓住關鍵的市場機會。例如,發現股價從下跌轉為上漲的點,這可能是買入的好時機。這是所有數據分析師或觀察時間序列資料者最希望獲得的資訊。但也有人認為這要容錯率大點,因為容錯率過小代表過於敏感,很可能只是很微小的趨勢轉折,意義不大。對於大數據或AI來說,人類相對更難介入,並賦予容錯率的調整。反而是精準的趨勢建模所得到的趨勢轉折,更容易讓大數據與AI實施。
趨勢變化
觀察趨勢在特定期間內的變化程度,這能幫助我們更好地了解數據的波動。例如,某段時間內的增減幅度,這有助於我們評估趨勢的強度和持續性。
透過這些觀察,我們能夠降低單純憑藉經驗進行數據分析的風險與不可複製性,提高分析的客觀性和可靠性。這些方法不僅適用於學術研究,還能應用於實際工作和生活中,幫助我們更好地理解和利用數據。