Citation Hunt

Das unten stehende Wikipedia-Snippet wird von keiner verlässlichen Quelle unterstützt. Kannst du eine finden?

Klicke auf Verstanden!, um zu Wikipedia zu gehen und das Snippet zu reparieren, oder Nächstes!, um ein anderes zu sehen. Viel Glück!

In Seite Hierarchische Clusteranalyse:

"

Beim Density Linkage wird für jedes Objekt ein Dichtewert geschätzt. Zur Berechnung wird eines der üblichen Distanzmaße, z. B. euklidischer Abstand, Manhattan-Distanz, zwischen den Objekten benutzt. Auf Basis der Dichtewerte zweier Objekte wird dann eine neue Distanz d ( i , j ) {\displaystyle d(i,j)} zwischen ihnen berechnet. Diese hängen auch von der Umgebung der Objekte i {\displaystyle i} und j {\displaystyle j} ab. Für das agglomerative Clustering kann dann eine der vorhergehenden Fusionierungsmethoden verwendet werden.

  1. Lege den Radius r {\displaystyle r} fest
  2. Schätze die Dichte f ^ ( i ) {\displaystyle {\hat {f}}(i)} als den Anteil der Beobachtungen, die eine Entfernung kleiner gleich r {\displaystyle r} vom Objekt i {\displaystyle i} haben
  3. Berechne die Distanz zwischen Objekt i {\displaystyle i} und j {\displaystyle j} als
  1. Lege die Anzahl der Nachbarn k {\displaystyle k} fest
  2. Berechne die Distanz r k ( i ) {\displaystyle r_{k}(i)} zum k {\displaystyle k} nächsten Nachbarn des Objektes i {\displaystyle i}
  3. Schätze die Dichte f ^ ( i ) {\displaystyle {\hat {f}}(i)} als den Anteil der Beobachtungen, die eine Entfernung kleiner gleich r k ( i ) {\displaystyle r_{k}(i)} vom Objekt i {\displaystyle i} haben, dividiert durch das Volumen der Sphäre mit dem Radius r k ( i ) {\displaystyle r_{k}(i)}
  4. Berechne die Distanz zwischen den Objekten i {\displaystyle i} und j {\displaystyle j} als
  1. Führe zunächst ein k-means Clustering durch und betrachte nur die k {\displaystyle k} Cluster-Schwerpunkt x ¯ i {\displaystyle {\bar {x}}_{i}}
  2. Berechne für jeden Cluster die totale Varianz w i {\displaystyle w_{i}}
  3. Berechne die Distanz zwischen Cluster-Schwerpunkten i {\displaystyle i} und j {\displaystyle j} als

Ein Problem der Density linkage Algorithmen ist die Festlegung der Parameter.

Die Algorithmen OPTICS und HDBSCAN* (eine hierarchische Variante von DBSCAN clustering) können ebenfalls als hierarchisches Density Linkage clustering interpretiert werden.