Clustering

Ein PMML-Clustering-Modell bestimmt das am besten übereinstimmende Cluster für einen angegebenen Datensatz, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit. Ein Cluster ist eine Teilmenge mit ähnlichen Daten. Clustering (auch bekannt als unüberwachtes Lernen) ist der Prozess, bei dem ein Dataset in Gruppen aufgeteilt wird, sodass die Mitglieder jeder Gruppe einander so ähnlich wie möglich sind und unterschiedliche Gruppen sich so viel wie möglich voneinander unterscheiden.

Modellelement

<ClusteringModel functionName="clustering" ...

Nicht unterstützte Features

Clustering-Modelle mit dem Element <MiningSchema>, das einen Verweis auf ein Element <DerivedField> enthält, werden nicht unterstützt.

Modellausgaben


Unterstützte Features für Modellausgaben	Beschreibung
predictedValue	Dies ist das am besten übereinstimmende Cluster, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit.
transformedValue	Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Transformationsausdruck generiert wird.
decision	Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Ausdruck generiert wird, der einen kategorisierten Wert ergibt.
predictedDisplayValue	Dies ist der visuell lesbare Wert, der zur Anzeige des vom Modell vorhergesagten Wertes verwendet wird.

entityId	Dies ist der bei 1 startenden Index (implizite Identifikation) des vorhergesagten Ergebnisclusters.
affinity	Dies ist der Wert der Entfernung oder der Ähnlichkeit des angegebenen Datensatzes bezüglich des vorhergesagten Clusters, wie er im Modell definiert wird.