Text Categorizer

Die Textkategorisierung, auch als Textklassifizierung bezeichnet, beinhaltet die Zuweisung von benutzerdefinierten Kategorien zu unstrukturiertem Inhalt oder Klartext (wie in E-Mails, Nachrichtenartikeln und Kommentaren), je nachdem, wie viel des Inhalts mit der Kategorie übereinstimmt. Die Kategorisierung kann auf Basis des Betreffs, Autors, Datums oder nahezu jedes definierten Klassifizierungssystems ausgeführt werden.

Sie können Ihren eigenen Kategorisierer erstellen, indem Sie ein Kategorisierungsmodell mit Ihren Daten und Kategorien trainieren. Der Trainer analysiert die Daten und speichert die erfassten Informationen im Trainingsvorgang. Er analysiert anschließend die Inhalte und bestimmt die Kategorie, zu welcher der Inhalt gehört.

Die Textkategorisierungsfunktion nutzt statistische Textkategorisierungsvorgänge. Sie wendet Machine-Learning-Methoden an, um automatische Klassifizierungsregeln zu erlernen, die auf von Menschen markierten Trainingsdokumenten basieren.

Da Sie in der Lage sind, die Kategorisierung Ihrer Wahl anzuwenden, müssen Sie zunächst Ihre Modell „trainieren“, damit es die Kategorien „erlernt“. Danach können Sie dieses Modell im Text Categorizer-Schritt zur Kategorisierung Ihrer unstrukturierten Daten verwenden.

Spectrum™ Technology Platform nutzt Administrationsumgebung-Befehle zur Verwaltung von Textkategorisierungsmodellen. Eine Beschreibung dieser Befehle finden Sie im Abschnitt Administrationsumgebung im Administrationshandbuch.