Information Extraction-Modul

Beziehungsextraktion

Das Information Extraction-Modul kann nun einen Eingabetext in einer beliebigen natürlichen Sprache parsen und die Beziehungstypen identifizieren, die zwischen den unterschiedlichen, im Text identifizierten Entitätsgruppen vorhanden sind. Dies wird über den neuen Schritt Relationship Extractor durchgeführt.

Relationship Extractor identifiziert Beziehungen zwischen den folgenden Entitätstypen:

Person
Organisation
Position

Befehl zum Auswerten und Trainieren eines Modells

Das Information Extraction-Modul verfügt nun über einen Befehl in der Administrationsumgebung, der neue und vorhandene Modelle auswertet und trainiert. Der Befehl lautet iemodel trainAndevaluate model. Er ersetzt den Befehl iemodel evaluate train_model, der lediglich ein vorhandenes Modell ausgewertet hat.

Separate Schritte zur Entitätsextraktion und Textkategorisierung

Das Information Extraction-Modul verfügt nun über separate Schritte zur Textkategorisierung und Entitätsextraktion. Zuvor wurden diese beiden Funktionen im Schritt Information Extractor durchgeführt. Nun sind zwei Schritte vorhanden: Entity Extractor und Text Categorizer. Extrahieren Sie Entitäten wie Namen und Adressen aus Zeichenfolgen mit unstrukturierten Daten anhand von Entity Extractor. Verwenden Sie Text Categorizer, um unstrukturiertem Inhalt oder Klartext benutzerdefinierte Kategorien zuzuweisen.