Elasticsearchにおけるデータストリームライフサイクル設定

これらは、データストリームライフサイクルを構成するために利用可能な設定です。

クラスターレベルの設定

  • data_streams.lifecycle.poll_interval
  • (動的, 時間単位の値) Elasticsearchが組み込みライフサイクルを持つすべてのデータストリームに対して次のアクションを確認する頻度。デフォルトは 5m です。

  • cluster.lifecycle.default.rollover
  • (動的, 文字列) このプロパティは、データストリームが lifecycle が設定されているときにロールオーバーをトリガーする条件を構成するキー値ペア形式の文字列を受け入れます。このプロパティは実装の詳細であり、変更される可能性があります。現在、デフォルトは max_age=auto,max_primary_shard_size=50gb,min_docs=1,max_primary_shard_docs=200000000 であり、これは次の条件のいずれかが満たされるとデータストリームがロールオーバーすることを意味します:

    • いずれかのプライマリシャードが50GBのサイズに達する、
    • または、いずれかのプライマリシャードが200,000,000ドキュメントを含む
    • または、インデックスがデータストリームの保持時間に依存する特定の年齢に達する、
    • かつ少なくとも1つのドキュメントを持つ。

  • data_streams.lifecycle.target.merge.policy.merge_factor
  • (動的, 整数) データストリームライフサイクルは、ターゲットバックインデックスのためにluceneマージポリシーファクターを更新することによってテールマージを実装します。マージファクターは、マージすべきセグメントの数と、特定のティアで見つかることが期待される最大セグメント数の両方です。この設定は、データストリームライフサイクルがターゲットインデックスに設定する値を制御します。デフォルトは 16 です。この値は、ターゲットインデックスの index.merge.policy.merge_factor インデックス設定の下で表示されます。

  • data_streams.lifecycle.target.merge.policy.floor_segment
  • (動的) データストリームライフサイクルは、ターゲットバックインデックスのためにluceneマージポリシーフロアセグメントを更新することによってテールマージを実装します。このフロアセグメントサイズは、インデックスが非常に小さなセグメントの長いテールを持つのを防ぐ方法です。この設定は、データストリームライフサイクルがターゲットインデックスに設定する値を制御します。デフォルトは 100MB です。

  • data_streams.lifecycle.signalling.error_retry_interval
  • (動的, 整数) インデックスがエラーステップで進行していないことを示すために、データストリームライフサイクルがエラーステップでインデックスに対して実行しなければならない再試行の回数を表します(つまり、エラーステップでスタックしています)。現在の信号メカニズムは error レベルのログステートメントですが、将来的には信号メカニズムを拡張することができます。デフォルトは10回の再試行です。

インデックスレベルの設定

以下のインデックスレベルの設定は、データストリームのバックインデックスに通常構成されます。

  • index.lifecycle.prefer_ilm
  • (動的, ブール値) この設定は、バックインデックスがインデックスライフサイクル管理 (ILM) ポリシーを持ち、データストリームにも組み込みライフサイクルがある場合に、どの機能がデータストリームのバックインデックスを管理しているかを決定します。true の場合、このインデックスはILMによって管理され、false の場合、バックインデックスはデータストリームライフサイクルによって管理されます。デフォルトは true です。

  • index.lifecycle.origination_date
  • (動的, 長整数) 指定された場合、これはこのバックインデックスがロールオーバーされた後にバックインデックス生成年齢を計算するために使用されるタイムスタンプです。生成年齢はデータ保持を決定するために使用されるため、古いデータを含むバックインデックスを作成し、データの元のタイムスタンプに基づいて保持期間やライフサイクルの他の部分が適用されることを保証したい場合にこの設定を使用できます。ミリ秒単位のUnixエポック値として指定されます。