OpenNameParser

OpenNameParser は、名前データ フィールドにある個人名、企業名、またはその他の名称を構成要素に分解します。パースされたこれらの名前要素は、名前のマッチング、名前の正規化、複数レコード名の統合など、他の自動化処理に使用できます。

OpenNameParser は、次の処理を行います。

  • 名前が担う機能を示すために、その名前のタイプを特定します。名前エンティティ タイプは、個人名と企業名の 2 つのグループに分かれます。それぞれのグループには、さらに複数のサブグループがあります。
  • パーシングに使う構文を把握するために、名前の形式を特定します。個人名は、通常、自然な (署名) 順序または逆の順序に従います。企業名は、通常、階層型の順序に従います。
  • 名前を構成する各要素が名前全体に占める構文上の関連性を識別するために、要素を特定してラベル付けします。個人名の構文は、敬称、名、ミドルネーム、姓、接尾語、アカウントを示す用語、その他の個人名要素で構成されます。企業名の構文は、企業名や接尾語などで構成されます。
  • 結合された個人名と企業名をパースし、それらを 1 つのレコードとして残すか、複数のレコードに分割します。例えば、結合された名前は、 "Mr.and Mrs.John Smith" や "Baltimore Gas & Electric dba Constellation Energy"です。
  • 出力をレコードまたはリストとしてパースします。
  • パーシングによる訂正の信頼度を示すパーシング スコアを割り当てます。