InformationExtractor

InformationExtractor extrae entidades tales como los nombres y las direcciones de las cadenas de datos no estructurados (también denominados como texto sin formato).

Es posible que no se devuelvan todas las entidades para un tipo seleccionado, ya que la precisión varía según el tipo de documento de entrada. Dado que Information Extractor utiliza procesamiento de lenguaje natural, una cadena que contiene una oración gramaticalmente correcta de un artículo noticioso o blog tendría una devolución de nombres más precisa que una simple lista de nombres y fechas.

URL del recurso

Extremo del elemento JSON:

http://server:port/rest/InformationExtractor/result.json

Extremo del XML:

http://server:port/rest/InformationExtractor/result.xml

Ejemplo con respuesta JSON

Este ejemplo solicita una respuesta JSON:

http://myserver:8080/rest/InformationExtractor/result.json?​Data.PlainText=My+name+is+Arthur+Pitney&​Option.EntityList=Person

El elemento JSON devuelto por esta solicitud sería:

{"output_port": [{
   "Entity": [   {
   "Text": "Aurthur Pitney",
   "Type": "Person"
   }],
   "user_fields": []
}]}

Ejemplo con respuesta XML

Este ejemplo solicita una respuesta XML:

http://myserver:8080/rest/InformationExtractor/result.xml?​Data.PlainText=My+name+is+Arthur+Pitney&​Option.EntityList=Person

El elemento XML devuelto por esta solicitud sería:

<xml.InformationExtractorResponse xmlns="http://www.pb.com/spectrum/services/InformationExtractor">
   <output_port>
      <Result>
         <Entity>
            <Entity>
               <Text>Aurthur Pitney</Text>
               <Type>Person</Type>
            </Entity>
         </Entity>
         <user_fields/>
      </Result>
   </output_port>
</xml.InformationExtractorResponse>