テキスト回帰分析

2011-06-07 (火) 08:32:39 (4701d) | Topic path: Top / テキスト・マイニング / テキスト回帰分析

テキストから数値を予測する研究に関する文献.

ファイナンス系の文献はSIG-FINのWikiにもまとめられています.

リスク予測

  • Predicting risk from financial reports with regression
    Shimon Kogan, Dimitry Levin, Bryan R. Routledge, Jacob S. Sagi, Noah A. Smith
    NAACL HLT 2009, pp. 272-280 (2009)
    手法: SVR
    内容: SECによる市場レポートから株価リターンのボラティリティを予測する.
  • Text-based portfolio choice
    Shimon Kogan, Bryan R. Routledge, Jacob Sagi, Noah A. Smith
    2008 North American Summer Meeting of the Econometric Society (2008)
    同上.

市場予測

評判分析

  • Movie Reviews and Revenues: An Experiment in Text Regression
    Mahesh Joshi, Dipanjan Das, Kevin Gimpel and Noah A. Smith
    NAACL HLT 2010, pp. 293-296 (2010).
    手法: 回帰分析
    内容: 映画評論家のレビューからその映画の公開週の観客動員数を予測する.
  • Rated aspect summarization of short comments
    Yue Lu, ChengXiang Zhai, Neel Sundaresan
    WWW 2009, pp. 131-140 (2009)
    手法:クラスタリング, probabilistic latent semantic analysis (pLSA)
    内容: 商品に対するコメントを要約してレート(★の数)を予測する.
  • Supervised Topic Models
    David Blei, Jon McAuliffe
    NIPS 2007, pp. 121-128 (2008)
    手法: supervised latent Dirichlet allocation (sLDA)
    内容: sLDAを用いて新聞の映画レビューの点数(★の数)を予測する.また,Digg.com(ソーシャル・ブックマーク)の最初の週のブックマーク数を予測する.

文書要約

  • An Unsupervised Approach to Biography Production Using Wikipedia
    Fadi Biadsy; Julia Hirschberg; Elena Filatova
    ACL 2008, pp. 807-815 (2008)
    手法: sentence-extraction based multi-document summarization (MDS), SVR
    内容: 人物紹介を生成するタスクDUC2004に対して,Wikipediaの文章を要約するアプローチを取り,Wikipediaに含まれる文の評価値(ROUGE-Lスコア)をSVRで推定する.

機械翻訳

情報検索

診断

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS