入力がテキストで出力が離散値(カテゴリー)のもの.
次の2つのタイプがある.
-銘柄やインデックスを上昇または下降に分類する
-ニュース記事を良いニュースまたは悪いニュースに分類する
[[テキスト回帰分析>テキスト・マイニング/テキスト回帰分析]](出力が連続値のもの)はこちら.
*SVM [#n12f1173]
-[[''Topic-dependent sentiment analysis of financial blogs'':http://doi.acm.org/10.1145/1651461.1651464]]~
Neil O'Hare, Michael Davy, Adam Bermingham, Paul Ferguson, Páraic Sheridan, Cathal Gurrin, Alan F. Smeaton~
CIKM 2009 Workshop on Topic-sentiment analysis for mass opinion, pp. 9-16 (2009)~
内容: 金融系のブログ記事をとてもネガティブ,ネガティブ,ニュートラル,ポジティブ,とてもポジティブ,両方,無関係,わからないのいずれかに分類する.
-[[''News aware volatility forecasting: is the content of news important?'':http://portal.acm.org/citation.cfm?id=1378245.1378267]]~
Calum S. Robertson, Shlomo Geva, Rodney C. Wolff~
AusDM 2007, pp. 161-170 (2007)~
内容: ニュースを興味深いもの(市場がいつもと違う動きをするもの)とそうでないものに分類する.
-[[''Forecasting Intraday Stock Price Trends with Text Mining Techniques'':http://portal.acm.org/citation.cfm?id=962898]]~
Marc-André Mittermayer~
HICSS 2004, Vol. 3, Issue C, p. 30064.2 (2004)~
内容: ニュース記事を良い,悪い,どちらでもない(No Movers)のいずれかに分類する.
-[[''Good News or Bad News? Let the Market Decide'':http://www.aaai.org/Library/Symposia/Spring/ss04-07.php]]~
Moshe Koppel and Itai Shtrimberg~
2004 AAAI Spring Symposium on Exploring Attitude and Affect in Text: Theories and Applications, pp. 86-88 (2004).~
内容: ある企業に関するニュースをポジティブまたはネガティブに分類する.
-[[''News Sensitive Stock Trend Prediction'':http://www.springerlink.com/content/h1m3pmxtd7htkymn]]~
Gabriel Pui Cheong Fung, Jeffrey Xu Yu, and Wai Lam~
PAKDD 2002, pp. 481-493 (2002)~
内容: ニュース記事を分析し,トレンドを上昇,下落,安定のいずれかに分類する.
*Naïve Bayes [#ff012a00]
-[[''Topic-dependent sentiment analysis of financial blogs'':http://doi.acm.org/10.1145/1651461.1651464]]~
Neil O'Hare, Michael Davy, Adam Bermingham, Paul Ferguson, Páraic Sheridan, Cathal Gurrin, Alan F. Smeaton~
CIKM 2009 Workshop on Topic-sentiment analysis for mass opinion, pp. 9-16 (2009)~
内容: 金融系のブログ記事をとてもネガティブ,ネガティブ,ニュートラル,ポジティブ,とてもポジティブ,両方,無関係,わからないのいずれかに分類する.
-[[''Is all that talk just notice? The information content of internet stock message boards'':http://onlinelibrary.wiley.com/doi/10.1111/j.1540-6261.2004.00662.x/full]]~
Werner Antweiler, Murray Z. Frank~
The Journal of Finance, Volume 59, Issue 3, pages 1259–1294 (2004)~
内容: Yahoo! FinanceとRaging Bullへの投稿を分析したところ,株価リターンは予測できないが出来高とボラティリティを説明できる場合があることがわかった.
-''Using News Articles to Predict Stock Price Movements''~
Győző Gidófalvi, Charles Elkan~
Tech. Report, Department of Computer Science and Engineering, University of California at San Diego (2003)~
内容: ニュース記事を分析し,20分後の株価について上昇,下落,そのままのいずれかに分類する.
-[[''Text Classification for Intelligent Portfolio Management'':http://www.ri.cmu.edu/publication_view.html?pub_id=3976]]~
Young-Woo Seo, Joseph Andrew Giampapa, and Katia Sycara~
Tech. Report CMU-RI-TR-02-14, Robotics Institute, Carnegie Mellon University (2002)~
内容: ニュース記事を分析し,記事を良い,たぶん良い,ふつう,たぶん悪い,悪いのいずれかに分類する.
-[[''Language models for financial news recommendation'':http://doi.acm.org/10.1145/354756.354845]]~
Victor Lavrenko, Matt Schmill, Dawn Lawrie, Paul Ogilvie, David Jensen, James Allan~
CIKM 2000, pp. 389-396 (2000)~
内容: ニュース記事を分析し,上昇トレンド,下降トレンド,フラットのいずれかに分類する.
-[[''Mining of concurrent text and time series'':http://www.cs.cmu.edu/~dunja/WshKDD2000.html]]~
Victor Lavrenko, Matt Schmill, Dawn Lawrie, Paul Ogilvie, David Jensen, James Allan~
KDD 2000 Workshop on Text Mining, pp. 37-44 (2000)~
同上.
*決定木 [#w8e4a1ec]
-[[''News aware volatility forecasting: is the content of news important?'':http://portal.acm.org/citation.cfm?id=1378245.1378267]]~
Calum S. Robertson, Shlomo Geva, Rodney C. Wolff~
AusDM 2007, pp. 161-170 (2007)~
内容: ニュースを興味深いもの(市場がいつもと違う動きをするもの)とそうでないものに分類する.
*GA [#fa052b09]
-[[''Integrating Genetic Algorithms and Text Learning for Financial Prediction'':http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.34.8655]]~
James Thomas, Katia Sycara~
GECCO 2000, pp. 72-75 (2000)~
内容: ある銘柄についてのチャットのテキストを分析し,その銘柄をカイまたはウリのいずれかに分類する.
*その他 [#n68f31c8]
-[[''Cheap talk on the Web: The determinants of posting on stock message boards'':http://papers.ssrn.com/sol3/papers.cfm?abstract_id=160170]]~
Peter D. Wysocki~
Working Paper, No. 98025, University of Michigan Business School (1998)~
内容: Yahoo!掲示板に投稿が多かった50銘柄と市場の動きを調べたところ,投稿数が翌日のリターンと相関があるが,手数料を考慮すると利益が出ないことがわかった.