テキストから数値を予測する研究に関する文献.
ファイナンス系の文献は[[SIG-FINのWiki:http://www.kishii.ss.is.nagoya-u.ac.jp/~tori/society/sig-fin/pukiwiki/index.php?%A5%C6%A5%AD%A5%B9%A5%C8%CA%AC%C0%CF]]にもまとめられています.
*リスク予測 [#v5a54976]
-[[''Predicting risk from financial reports with regression'':http://portal.acm.org/citation.cfm?id=1620794]]~
Shimon Kogan, Dimitry Levin, Bryan R. Routledge, Jacob S. Sagi, Noah A. Smith~
NAACL HLT 2009, pp. 272-280 (2009)~
手法: SVR~
内容: SECによる市場レポートから株価リターンのボラティリティを予測する.
-[[''Text-based portfolio choice'':http://editorialexpress.com/conference/NASM2008/program/NASM2008.html#12]]~
Shimon Kogan, Bryan R. Routledge, Jacob Sagi, Noah A. Smith~
2008 North American Summer Meeting of the Econometric Society (2008)~
同上.
*市場予測 [#bd7befb0]
-[[''A Discrete Stock Price Prediction Engine Based on Financial News'':http://dx.doi.org/10.1109/MC.2010.2]]~
Schumaker, R.P. and Hsinchun Chen~
IEEE Computer, Vol. 43, No. 1, pp. 51-56 (2010)~
手法: SVR~
内容: Yahoo! Financeの記事を分析し,新しい記事に対して記事が出てから20分後の株価を予測する.
-[[''Stock Price Forecasting by Combining News Mining and Time Series Analysis'':http://dx.doi.org/10.1109/WI-IAT.2009.48]]~
Xiangyu Tang, Chunyu Yang, Jie Zhou~
WI-IAT 2009, Vol. 1, pp. 279-282 (2009)~
手法: SVR~
内容: WebニュースのRSSフィードを分析して上海株式市場のA株の株価を予測する.
-[[''Textual analysis of stock market prediction using breaking financial news: The AZFin text system'':http://doi.acm.org/10.1145/1462198.1462204]]~
Robert P. Schumaker, Hsinchun Chen~
ACM Transactions on Information Systems (TOIS), Vol. 27, Issue 2, Article No. 12 (2009)~
手法: SVR~
内容: ニュース記事がリリースされた20分後の株価を予測する.
-[[''A quantitative stock prediction system based on financial news'':http://dx.doi.org/10.1016/j.ipm.2009.05.001]]~
Robert P. Schumaker, Hsinchun Chen~
Information Processing & Management, Vol. 45, Issue 5, pp. 571-583 (2009)~
未読.たぶん上と同じ.
-[[''Currency exchange rate forecasting from news headlines'':http://doi.acm.org/10.1145/563932.563921]]~
Desh Peramunetilleke, Raymond K. Wong~
Australian Computer Science Communications, Vol. 24, No. 2 (2002)~
手法: アソシエーション・ルール・マイニング~
内容: LHSにニュースの見出しから抽出したキーワード,RHSに米ドルと独マルクの為替レートの変動を持つアソシエーション・ルールを発見し,為替レートの変動を予測する.
*評判分析 [#kb8711fe]
-''Movie Reviews and Revenues: An Experiment in Text Regression''~
-[[''Movie Reviews and Revenues: An Experiment in Text Regression'':http://portal.acm.org/citation.cfm?id=1857999.1858037]]~
Mahesh Joshi, Dipanjan Das, Kevin Gimpel and Noah A. Smith~
NAACL HLT 2010, Accepted.~
未読.
NAACL HLT 2010, pp. 293-296 (2010).~
手法: 回帰分析~
内容: 映画評論家のレビューからその映画の公開週の観客動員数を予測する.
-[[''Rated aspect summarization of short comments'':http://dx.doi.org/10.1145/1526709.1526728]]~
Yue Lu, ChengXiang Zhai, Neel Sundaresan~
WWW 2009, pp. 131-140 (2009)~
手法:クラスタリング, probabilistic latent semantic analysis (pLSA)~
内容: 商品に対するコメントを要約してレート(★の数)を予測する.
-[[''Supervised Topic Models'':http://nips.cc/Conferences/2007/Program/event.php?ID=939]]~
David Blei, Jon McAuliffe~
NIPS 2007, pp. 121-128 (2008)~
手法: supervised latent Dirichlet allocation (sLDA)~
内容: sLDAを用いて新聞の映画レビューの点数(★の数)を予測する.また,Digg.com(ソーシャル・ブックマーク)の最初の週のブックマーク数を予測する.
*文書要約 [#aa7b8970]
-[[''An Unsupervised Approach to Biography Production Using Wikipedia'':http://www.aclweb.org/anthology/P/P08/]]~
Fadi Biadsy; Julia Hirschberg; Elena Filatova~
ACL 2008, pp. 807-815 (2008)~
手法: sentence-extraction based multi-document summarization (MDS), SVR~
内容: 人物紹介を生成するタスクDUC2004に対して,Wikipediaの文章を要約するアプローチを取り,Wikipediaに含まれる文の評価値(ROUGE-Lスコア)をSVRで推定する.
*機械翻訳 [#t9c95f0d]
-[[''Regression for machine translation evaluation at the sentence level'':http://dx.doi.org/10.1007/s10590-008-9046-1]]~
Joshua S. Albrecht, Rebecca Hwa~
Machine Translation, Vol. 22, No. 1-2, pp. 1-27 (2008)~
未読.たぶん下の論文を発展させたもの.
-[[''Regression for Sentence-Level MT Evaluation with Pseudo References'':http://www.aclweb.org/anthology/P/P07/]]~
Joshua Albrecht; Rebecca Hwa~
ACL 2007, pp. 296-303 (2007).~
手法: SVR~
内容: 機械翻訳の結果に対し文単位で評価値を予測する.
*情報検索 [#m8be7c9b]
-[[''An application of least squares fit mapping to text information retrieval'':http://doi.acm.org/10.1145/160688.160738]]~
Yiming Yang, Christopher G. Chute~
SIGIR 1993, pp. 281-290 (1993)~
手法: Linear Least Squares Fit (LLSF)~
内容: MEDLINEに入力された検索キーワードに対して関係する概念をマッピングする.
*診断 [#xca7bdc2]
-[[''A Linear Least Squares Fit mapping method for information retrieval from natural language texts'':http://dx.doi.org/10.3115/992133.992139]]~
Yiming Yang, Christopher G. Chute~
COLING 1992, Vol. 2, pp. 447-453 (1992)~
手法: Linear Least Squares Fit (LLSF)~
内容: 診療記録を分類する.