Loading jsMath...

動的クラスタリングについてのメモ

Gu (2022) による動的クラスタリングの定義

原文

Given the dataset D and its clustering results \mathcal{L}_D, let D_\mathit{new} be a new set of objects with some updates on D where D \cap D_\mathit{new} \neq \emptyset. Dynamic clustering computes the clustering results of D_\mathit{new} based on \mathcal{L}_D. The dynamic clustering is denoted by F and its clustering result is denoted as F(D, D_\mathit{new}, \mathcal{L}_D).

データセット D とそのクラスタリング結果 \mathcal{L}_D が与えられ、D を更新してできた新しいデータセットを D_\mathit{new} とする。 このとき、D \cap D_\mathit{new} \neq \emptyset、つまり、DD_\mathit{new} には共通するデータが存在する。 動的クラスタリングは、\mathcal{L}_D に基づいて D_\mathit{new} のクラスタリング結果を計算する。 動的クラスタリングF、その結果をF(D, D_\mathit{new}, \mathcal{L}_D) と表す。

動的クラスタリングの目的は、データセット D が与えられたときに D のクラスタリング結果 \mathcal{L}_D を得るバッチ・アルゴリズム \mathcal{L}_D = B(D) に対して、B(D_\mathit{new}) より効率的に F(D, D_\mathit{new}, \mathcal{L}_D) \approx \mathcal{L}_{D_\mathit{new}} を得ること。

Gruenheid (2014) による動的クラスタリングの定義

原文

Let D be a set of records and \Delta D be an increment to D. Let \mathcal{L}_D be the clustering of records in D. Incremental linkage clusters records in D + \Delta D based on \mathcal{L}_D. We denote the incremental linkage method by f, and denote the results by f(D, \Delta D, \mathcal{L}_D).

D をレコードの集合、\Delta DD の増分、D のクラスタリング結果を \mathcal{L}_D とする。 動的クラスタリング は、\mathcal{L}_D に基づいて D + \Delta D に含まれるレコードをクラスタリングする。 動的クラスタリングの手法を f、その結果を f(D, \Delta D, \mathcal{L}_D) と表す。

動的クラスタリングの目的は、次の2つ。

  1. D+\Delta D のクラスタリング F(D + \Delta D) より動的クラスタリング f(D, \Delta D, \mathcal{L}_D) を速く実行すること
  2. 動的クラスタリングの結果 f(D, \Delta D, \mathcal{L}_D) と(バッチ)クラスタリングの結果 F(D + \Delta D) が似ていること、つまり f(D, \Delta D, \mathcal{L}_D \approx F(D + \Delta D)

論文

手法

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS