Clustering
Ein PMML-Clustering-Modell bestimmt das am besten übereinstimmende Cluster für einen angegebenen Datensatz, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit. Ein Cluster ist eine Teilmenge mit ähnlichen Daten. Clustering (auch bekannt als unüberwachtes Lernen) ist der Prozess, bei dem ein Dataset in Gruppen aufgeteilt wird, sodass die Mitglieder jeder Gruppe einander so ähnlich wie möglich sind und unterschiedliche Gruppen sich so viel wie möglich voneinander unterscheiden.
Modellelement
<ClusteringModel functionName="clustering" ...
Nicht unterstützte Features
Clustering-Modelle mit dem Element <MiningSchema>, das einen Verweis auf ein Element <DerivedField> enthält, werden nicht unterstützt.
Modellausgaben
Unterstützte Features für Modellausgaben | Beschreibung |
---|---|
predictedValue | Dies ist das am besten übereinstimmende Cluster, basierend auf dem im Cluster verwendeten Maß für Entfernung oder Ähnlichkeit. |
transformedValue | Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Transformationsausdruck generiert wird. |
decision | Dies ist ein Wert, der über einen auf die vorhergesagte Modellausgabe angewendeten Ausdruck generiert wird, der einen kategorisierten Wert ergibt. |
predictedDisplayValue | Dies ist der visuell lesbare Wert, der zur Anzeige des vom Modell vorhergesagten Wertes verwendet wird. |
entityId | Dies ist der bei 1 startenden Index (implizite Identifikation) des vorhergesagten Ergebnisclusters. |
affinity | Dies ist der Wert der Entfernung oder der Ähnlichkeit des angegebenen Datensatzes bezüglich des vorhergesagten Clusters, wie er im Modell definiert wird. |