変化点の集約

この機能は技術プレビュー中であり、将来のリリースで変更または削除される可能性があります。Elasticは問題を修正するために取り組みますが、技術プレビューの機能は公式GA機能のサポートSLAの対象ではありません。

メトリックにおけるスパイク、ディップ、および変化点を検出する兄弟パイプラインです。兄弟のマルチバケット集約によって提供される値の分布が与えられた場合、この集約は、統計的に有意であれば、スパイクまたはディップのバケットおよび/または値の分布における最大の変化が発生するバケットを示します。

時間ベースのデータの変化を検出するために変化点の集約を使用することをお勧めしますが、任意のメトリックを使用してバケットを作成することもできます。

パラメータ

  • buckets_path
  • (必須、文字列) 変化点を検出するための値のセットを含むバケットへのパス。バケット化された値は少なくとも22個必要です。1,000未満が推奨されます。構文については、buckets_path 構文を参照してください。

構文

単独でのchange_point集約は次のようになります:

Js

  1. {
  2. "change_point": {
  3. "buckets_path": "date_histogram>_count"
  4. }
  5. }
テスト対象の値を含むバケット。

レスポンスボディ

  • bucket
  • (オプション、オブジェクト) 発見された変化点を示すバケットの値。変化点が見つからなかった場合は返されません。バケット内のすべての集約も返されます。
    バケットのプロパティ
    • key
    • (値) 一致したバケットのキー。文字列または数値の可能性があります。
    • doc_count
    • (数値) バケットのドキュメント数。
  • type
  • (オブジェクト) 発見された変化点のタイプとその関連値。可能なタイプ:
    • dip: この変化点で有意なディップが発生します
    • distribution_change: 値の全体的な分布が有意に変化しました
    • non_stationary: 変化点はありませんが、値は定常分布からのものではありません
    • spike: このポイントで有意なスパイクが発生します
    • stationary: 変化点は見つかりませんでした
    • step_change: 変化は値の分布における統計的に有意なステップアップまたはダウンを示します
    • trend_change: このポイントで全体的なトレンドの変化が発生しています

以下の例は、Kibanaのサンプルデータログデータセットを使用しています。

Js

  1. GET kibana_sample_data_logs/_search
  2. {
  3. "aggs": {
  4. "date":{
  5. "date_histogram": {
  6. "field": "@timestamp",
  7. "fixed_interval": "1d"
  8. },
  9. "aggs": {
  10. "avg": {
  11. "avg": {
  12. "field": "bytes"
  13. }
  14. }
  15. }
  16. },
  17. "change_points_avg": {
  18. "change_point": {
  19. "buckets_path": "date>avg"
  20. }
  21. }
  22. }
  23. }
1日間の長さのバケットを作成する日付ヒストグラム集約。
各バケット内のbytesフィールドの平均値を計算するdate集約の兄弟集約。
変化点検出集約の構成オブジェクト。
変化点を検出するための集約値のパス。この場合、
変化点集約の入力はdateの兄弟集約であるavgの値です。

リクエストは、次のようなレスポンスを返します:

Js

  1. "change_points_avg" : {
  2. "bucket" : {
  3. "key" : "2023-04-29T00:00:00.000Z",
  4. "doc_count" : 329,
  5. "avg" : {
  6. "value" : 4737.209726443769
  7. }
  8. },
  9. "type" : {
  10. "dip" : {
  11. "p_value" : 3.8999455212466465e-10,
  12. "change_point" : 41
  13. }
  14. }
  15. }
変化点であるバケットキー。
そのバケット内のドキュメント数。
バケット内の集約値。
発見された変化のタイプ。
p_valueは変化の極端さを示します; 値が低いほど、
より大きな変化を示します。
変化が発生する特定のバケット(インデックスは0から始まります)。