Simultaneous Record Detection and Attribute Labeling in Web Data Extraction
by Jun Zhu (Tsinghua Univ.), Zaiqing Nie, Ji-Rong Wen (Microsoft Research Asia), Bo Zhang (Tsinghua Univ.), Wei-Ying Ma (Microsoft Research Asia)
Visual Tree というものを使ってテンプレートに依存しないでウェブ・データを抽出する手法を提案しています.
Acclimatizing Taxonomic Semantics for Hierarchical Content Classification
by Lei Tang (Arizona State Univ.), Jianping Zhang (AOL), Huan Liu (Arizona State Univ.)
ウェブ・ページをタクソノミに基づいて分類した階層モデルを構築する手法を提案しています.
Hierarchical Topic Segmentation of Websites
by Ravi Kumar (Yahoo!), Kunal Punera (Univ. of Texas), Andrew Tomkins (Yahoo!)
ウェブ・サイトの階層構造の中でトピックが分岐している segmentation point を検出する手法を提案しています.
Topics over Time: A Non-Markov Continuous-Time Model of Topical Trends
by Xuerui Wang, Andrew McCallum (Univ. of Massachusetts)
時間によるトピックの移り変わりを検出する手法を提案しています.

