隨著 AlphaGo 打敗韓國頂尖棋手李世石,人工智慧、機器學習與深度學習等詞語,不斷被各個媒體、投資機構與企業所提及。這些令人霧裡看花的名詞,成為企業股價或形象點石成金的最好工具。「鉅亨買基金」透過「阿發總管」的開發經驗(機器人投顧服務),對此領域也小有所成,希望能藉由系列文章,讓大家了解機器學習中看似深奧的演算法。
1. 演算法:KNN
如何判斷灰球分類?
資料來源:「鉅亨買基金」整理,資料日期: 2019/5/15。
機器學習的目標是要幫助判斷某些或某個事物為何(像是判斷圖片中的動物是法國鬥牛犬還是巴哥犬),而達成此目標的工具便是演算法。看到演算法,可能很多讀者都會退避三舍,但其實演算法只是一套解決問題的規則與流程,下雨且溫度高於 25 度時吃麥當勞、下雨且溫度低於 25 度時吃肯德基、不下雨時吃泡麵,這就是一套解決吃什麼午餐的簡單演算法。
本系列文第一個介紹的便是 KNN 演算法(K-Nearest Neighbors,最近鄰居法),顧名思義,此演算法的核心精神便是,你會與最接近你的 K 個鄰居相似(假設離你最近的 5 個鄰居中,有 4 個是高收入者、1 個是中等收入者,則你很可能也是高收入者)。以上圖為例,假設有紅色與藍色兩個類別,而我們想判斷灰色球是哪個類別時,就會以附近球的顏色當依據。由於最近的 3 顆球中,有 2 顆是藍色、1 顆是紅色,因此灰色球應該屬於藍色(此處的 K 為 3,選取標準為演算法的預測準確率最高者)。
2. 應用:判斷股市表現
對於可明確分類的資料來說,KNN 演算法威力強大,只要找到相關的變數,便能協助判斷資料類別。以投資為例,對股市表現會有影響的,無非是經濟成長率、物價年增率、失業率、政策利率水準等與景氣週期相關的經濟數據。假設與目前經濟數據相似的情況下,未來股市大多下跌,那根據 KNN 演算法,未來股市下跌機率就會較高。
3. 成果:準確率達 81%
以剛才提到的股市判斷模型為例,失業率、長短期利率差距、製造業採購經理人指數、韓國出口年增率與實質利率為變數,半年後股市漲跌為預測目標。下圖為 KNN 演算法的結果,當 K 在 3 時,模型正確率最高。當 K 等於 3 時,模型預測未來半年股市下跌的準確度為 82%(預測下跌次數 22 次,真的發生下跌次數為 18 次,18 除以 22 等於 82%)、未來半年股市上漲的準確度更高達 86%(同理,82 除以 95 等於 86%)。
透過 KNN 模型,判斷未來半年股市表現
資料來源:Bloomberg,「鉅亨買基金」整理;資料日期: 2019/5/15。此資料僅為歷史數據模擬回測,不為未來投資獲利之保證,在不同指數走勢、比重與期間下,可能得到不同數據結果。
資料來源:鉅亨網
本文內容僅供參考,無任何買賣建議,投資人應謹慎評估,風險自負。

