玩股網全新登入機制上線,未來將更全面保護你的帳號安全
搶先了解
站內廣告

如何用機器學習做投資

高手高手高高手

上一篇的文章中,我們帶投資人了解何謂演算法,並認識了第一個簡單的演算法 KNN(K-Nearest Neighbors,最近鄰居法)。本篇文章將介紹另外一個核心精神與 KNN 相似的演算法 K Means(K - 平均演算法,以下簡稱 K Means),並實際將該演算法運用在投資上,展現其簡單運算背後隱藏的大威力。

1. 演算法:K Means

灰球該如何分類?

資料來源:「鉅亨買基金」整理,資料日期:2019/5/29。

資料來源:「鉅亨買基金」整理,資料日期: 2019/5/29。

KNN 演算法是在清楚知道哪些是藍色球、哪些是紅色球的情況下,要判斷手中的灰球會是什麼顏色。而 K Means 演算法則是要在完全不知道每顆球的顏色情況下,判斷哪些是紅色球或藍色球。

儘管知道的資訊不同,但核心假設都一樣,同樣顏色的球應該會落在附近(你會跟背景與你相似的人較像)。假設我們知道上圖的灰色球可以分成 3 類(與 KNN 演算法的 K 值一樣,都是自行決定),則演算法會隨機選取 3 顆中心球(上圖的 A、B、C),並分別給與藍紅黃等不同顏色,接著審視每顆剩下的球,看該球與哪顆中心球最接近,便屬於一樣的顏色(以 D 球為例,因為與 A 球最近,所以 D 球是藍色)。判斷完後,計算每顆球與中心球的距離後加總,再隨機選取 3 顆中心球,計算距離總和,反覆此流程,最後以距離總和最小的 3 顆中心球,為最後答案。

2. 應用:協助判斷景氣週期

K Means 演算法最大的特色,是能夠在對一堆資料沒有頭緒的情形下,讓電腦幫你先分類。以判斷經濟週期為例,假設我們有一大堆不同的經濟指標(失業率、通貨膨脹率、採購經理人只數等),但我們不知道怎麼定義景氣週期。我們只需要把這一大堆資料用 K Means 演算法處理,各類指標相近的便會被分在同一類中。舉例來說,低失業率、低通貨膨脹率、高採購經理人指數的資料可能就會被分在一類,而該類應該代表景氣好,且未來股價表現應該較佳。

3. 成果:有效避開市場大跌

下圖與表為我們剛才提到,將一堆經濟資料分為 5 個類別後的結果。假設我們對於景氣週期與股市連結的看法正確,則應該會看到不同的預期報酬率。從下表可看出,群組 3 與 4 應該代表景氣好,未來半年股市上漲機率高達 80% 以上,平均報酬率也較為出色;群組 0 則是景氣接近衰退,未來半年股市上漲機率只有 17.4%,平均報酬率也低至 - 10.3%。對應的投資策略應該為,當目前景氣週期屬於群組 3 或 4 時,股市佔資產配置權重應較高,當落到群組 0 時,股市佔比應該顯著降低。

K Means 模型有助判斷未來股市表現

資料來源:Bloomberg,「鉅亨買基金」整理;資料日期:2019/5/29。此資料僅為歷史數據模擬回測,不為未來投資獲利之保證,在不同指數走勢、比重與期間下,可能得到不同數據結果。

資料來源:Bloomberg,「鉅亨買基金」整理;資料日期: 2019/5/29。此資料僅為歷史數據模擬回測,不為未來投資獲利之保證,在不同指數走勢、比重與期間下,可能得到不同數據結果。

 

資料來源:鉅亨網

本文內容僅供參考,無任何買賣建議,投資人應謹慎評估,風險自負。

精選文章

更多
華通、昇達科重挫,金寶今日大怒神!太空AI題材全面降溫,太空種電接棒成新戰場!
月線又是假跌破!台股7/1漲893點價過所有均,6/29外資空單沒加碼早就洩底了
蘋果摺疊機是糖還是毒藥?新日興散戶持股占三成,兆利、富世達案例看出陣痛期真相!
長線抱不住,短線抓不到?保證金逼退散戶的歷史大行情,小資如何複製贏家混搭戰略
【搞錯了】台股現在最重要的,不是看漲跌!
南電(8046)資本支出創史上最大規模:從消費電子到AI伺服器的結構性轉骨