理財不靠運氣!機器學習分析財報「軟資訊」,出現這些字財務風險特別高

大數聚

20171107

2623 Views

原文出自【注意!若財報出現這些字,未來財務風險高】,採訪編輯/柯旂、美術編輯/張語辰,本文獲研之有物授權轉載,未經同意請勿轉載。

首圖來源:Rawpixel

什麼是「財務資料分析」?

投資理財除了靠經驗與運氣,能否更科學一點?中研院資訊科技創新研究中心的王釧茹助研究員,與團隊運用機器學習分析財報中的「軟資訊」,找出「特定詞彙的出現」跟「企業財務風險」的關係。

01

「老實說不想去當資工工程師,覺得財金領域應該比較有趣吧!」因為這個念頭,王釧茹從大學開始投入財務資料分析:用數學模型及電腦計算資料,解決財務問題。(攝影/張語辰,Images Source:研之有物

若要發行或交易「衍生性金融商品」,例如期貨 (Futures)、選擇權 (Option),往往需要知道其「理論價格」是多少。為此,早期華爾街聘請許多稱為「Quant」的人才 ,擁有物理、數學等專業背景,透過電腦計算金融模型,為衍生性金融商品定價、或預測市場行為。

早期的 Quant 是透過「理論」來定價、分析或預測市場行為,現在則引入透過「資料」進入此過程。

最大的不同在於:以往數學模型是依照理論,假設股票遵循某種分配去擬定理論價格,但理論和假設是會改變的;資料分析則基於現實存在的金融資料,有什麼資料、就說什麼話,而這種專業正是王釧茹團隊所擅長──尤其是財務報告中的「軟資訊」。

02

資料科學家被形容是「21世紀最性感的職業」,華爾街也招募大量的資料科學家,有別以往從「數學理論」解決問題,轉變為用「實際資料」來解決問題。(Images Source:Rawpixel

會有這樣的轉變,拜賜於電腦硬體的發展、機器學習的進步,也因為大量的資料不斷累積,而美國證券交易委員會 (Securities and Exchange Commission,縮寫 SEC) 更規定上市公司要依規撰寫財務報告,累積了許多格式標準、具豐富資訊、可供分析的財務資料。

財報字裡行間 潛藏企業的情緒

若要簡單說明「硬資訊」和「軟資訊」的差別,「硬資訊」主要為財報或市場資訊中的數字,例如企業的每股盈餘 (EPS) ,多為結構化資料;而「軟資訊」主要是文字資料,例如會計事務所撰寫財報時使用了哪些詞彙,來描述下個年度企業經營的發展方向,多為非結構化資料。

軟資訊,也就是書寫者在特定情境脈絡下,依照判斷、情緒寫下的文字資料。

「2011 年我們看到 Tim Loughran 和 Bill McDonald 的財務情緒字典發表在 《Journal of Finance》,堪稱財務界的《Science》期刊,就知道這是未來重要的趨勢之一!」王釧茹回想,因此和團隊運用這套財務情緒字典,看看後續能進行什麼研究。

03

Tim Loughran 和 Bill McDonald 將財務領域的用詞分為這六大類情緒,奠定王釧茹團隊的軟資訊分析基礎。(資料來源/Tim Loughran and Bill McDonald, 2011, When is a Liability not a Liability? Textual Analysis, Dictionaries, and 10-Ks, Journal of Finance, 66:1, 35-65. 圖片重製/柯旂、張語辰,Images Source:研之有物

用「軟資訊」預測企業財務風險

傳統的財務資料分析領域,許多研究及實務上多傾向分析硬資訊,而王釧茹團隊選擇了分析「軟資訊」的新方向。

04

10-K 財務年報,為企業給美國證管會 (SEC) 的正式財報,內有公司運作狀況的詳細描述。

(資料來源/Starbucks,Images Source:研之有物

王釧茹團隊運用「10-K 財務年報的第七章」,也就是陳述企業管理和未來方向的章節文字,運用該企業未來的「股票報酬波動 (Stock return volatility)」 數據作為風險指標,藉此分析財務報表詞彙與風險的相關性。

「若今天 A 公司股價上漲 70%,隔天突然又跌 50% ,這個報酬波動太大,普遍會被認定為財務高風險的公司。反之,如果公司股價穩定維持高價或低價,就會被視為財務低風險的公司。」王釧茹說明為何會選擇「股票報酬波動」,作為訓練電腦預測未來企業財務風險的資料。

團隊開發的機器學習模型,訓練資料包含 1996-2013 年期間各企業的財務報表,篇數超過萬篇、字數超過十萬字,而資料變數高達好幾萬維度,有別於過往的統計分析難以處理超過二十維度的變數。

05

電腦分析某企業的 10-K 財務年報後,接續分析後十二個月該企業的股票報酬波動,訓練電腦自動找出「財報詞彙」與「未來財務風險」的關係。時間點依各企業發表年報的時間而有所異動。

(資料來源/王釧茹提供 圖說設計/柯旂、張語辰,Images Source:研之有物

文章內容屬作者個人觀點,不代表本站立場

FacebookShare MessengerShare LineShare