Módulo Information Extraction

El módulo Information Extraction tiene capacidades de procesamiento de texto avanzado y extracción de información de cualquier texto de entrada en lenguaje natural.

Tiene modelos con capacitación previa que se utilizan para extraer las entidades de un texto de entrada, determinar las relaciones entre las entidades y asignar la categoría a la cual pertenece el texto.

Características proporcionadas

Extracción de entidad: Extrae entidades de datos sin estructura y los clasifica en tipos tales como Ubicación, Fecha, Organización, NombrePropio, Dirección y Persona. El módulo incluye algunas entidades preexistentes. Sin embargo, también ofrece la capacidad de entrenar modelos según sus requisitos específicos. Para obtener más detalles sobre cómo entrenar un modelo y definir entidades personalizadas, consulte Entidades personalizadas
Extracción de relaciones: Identifica el tipo de relación que conecta a las entidades en cualquier tipo de texto de entrada en lenguaje natural.
Categorización de texto: Asigna categorías tales como correo electrónico, informes médicos y deportes al texto sin estructura, según el contenido. Antes de ordenar el texto sin estructura, es necesario entrenar un modelo de categorización de texto mediante la Utilidad de administración. Esta función se puede utilizar para indexar los informes de atención de pacientes, clasificar documentos por dominio y subdominio, y categorizar el correo electrónico como correo no deseado y correo deseado, entre otras aplicaciones. Este también clasifica las categorías identificadas según un rango que se basa en el grado de cruce de su texto con las categorías.