KDD-2006: Web/Text Mining

Simultaneous Record Detection and Attribute Labeling in Web Data Extraction
by Jun Zhu (Tsinghua Univ.), Zaiqing Nie, Ji-Rong Wen (Microsoft Research Asia), Bo Zhang (Tsinghua Univ.), Wei-Ying Ma (Microsoft Research Asia)
kdd2006_17.jpg

Visual Tree というものを使ってテンプレートに依存しないでウェブ・データを抽出する手法を提案しています.

Acclimatizing Taxonomic Semantics for Hierarchical Content Classification
by Lei Tang (Arizona State Univ.), Jianping Zhang (AOL), Huan Liu (Arizona State Univ.)
kdd2006_18.jpg

ウェブ・ページをタクソノミに基づいて分類した階層モデルを構築する手法を提案しています.

Hierarchical Topic Segmentation of Websites
by Ravi Kumar (Yahoo!), Kunal Punera (Univ. of Texas), Andrew Tomkins (Yahoo!)
kdd2006_19.jpg

ウェブ・サイトの階層構造の中でトピックが分岐している segmentation point を検出する手法を提案しています.

Topics over Time: A Non-Markov Continuous-Time Model of Topical Trends
by Xuerui Wang, Andrew McCallum (Univ. of Massachusetts)
kdd2006_20.jpg

時間によるトピックの移り変わりを検出する手法を提案しています.

Google

Google
とうごろう.jp
WWW
Powered by Movable Type 4.24-ja