データを豊かにする

既存のインデックスからのデータを取り込み中のドキュメントに追加するために、enrich processorを使用できます。

たとえば、enrich processorを使用して次のことができます:

  • 知られているIPアドレスに基づいてウェブサービスやベンダーを特定する
  • 商品IDに基づいて小売注文に商品情報を追加する
  • メールアドレスに基づいて連絡先情報を補足する
  • ユーザーの座標に基づいて郵便番号を追加する

enrich processorの動作

ほとんどのプロセッサは自己完結型で、取り込み中のドキュメントの既存のデータのみを変更します。

ingest process

enrich processorは新しいデータを取り込み中のドキュメントに追加し、いくつかの特別なコンポーネントを必要とします:

enrich process

  • enrich policy
  • 正しいenrichデータを正しい取り込み中のドキュメントに追加するために使用される設定オプションのセット。
    enrich policyには次のものが含まれます:

    • enrichデータをドキュメントとして保存する1つ以上のソースインデックスのリスト
    • プロセッサがenrichデータを取り込み中のドキュメントに一致させる方法を決定するポリシータイプ
    • 取り込み中のドキュメントと一致させるために使用されるソースインデックスからの一致フィールド
    • 取り込み中のドキュメントに追加したいソースインデックスからのenrichデータを含むenrichフィールド
      enrich processorで使用する前に、enrich policyは実行される必要があります。実行されると、enrich policyはポリシーのソースインデックスからのenrichデータを使用して、enrich indexと呼ばれる合理化されたシステムインデックスを作成します。プロセッサはこのインデックスを使用して、取り込み中のドキュメントを一致させて豊かにします。

  • source index
  • 取り込み中のドキュメントに追加したいenrichデータを保存するインデックス。これらのインデックスは通常のElasticsearchインデックスと同様に作成および管理できます。enrich policyでは複数のソースインデックスを使用できます。また、複数のenrich policyで同じソースインデックスを使用することもできます。

  • enrich index
  • 特定のenrich policyに関連付けられた特別なシステムインデックス。
    取り込み中のドキュメントをソースインデックスのドキュメントに直接一致させることは遅く、リソースを多く消費する可能性があります。これを加速するために、enrich processorはenrich indexを使用します。
    enrich indicesはソースインデックスからのenrichデータを含みますが、合理化を助けるためのいくつかの特別な特性があります:
    • それらはシステムインデックスであり、Elasticsearchによって内部的に管理され、enrich processorsおよびES|QL ENRICHコマンドとの使用を意図しています。
    • それらは常に.enrich-*で始まります。
    • それらは読み取り専用であり、直接変更することはできません。
    • それらは強制マージされており、高速な取得を実現しています。