Avg aggregation

文書から抽出された数値の平均を計算する single-value メトリクス集約です。これらの値は、文書内の特定の数値または ヒストグラム フィールドから抽出できます。

データが学生の試験成績(0から100の間)を表す文書で構成されていると仮定すると、次のようにしてスコアの平均を計算できます:

Python

  1. resp = client.search(
  2. index="exams",
  3. size="0",
  4. aggs={
  5. "avg_grade": {
  6. "avg": {
  7. "field": "grade"
  8. }
  9. }
  10. },
  11. )
  12. print(resp)

Ruby

  1. response = client.search(
  2. index: 'exams',
  3. size: 0,
  4. body: {
  5. aggregations: {
  6. avg_grade: {
  7. avg: {
  8. field: 'grade'
  9. }
  10. }
  11. }
  12. }
  13. )
  14. puts response

Js

  1. const response = await client.search({
  2. index: "exams",
  3. size: 0,
  4. aggs: {
  5. avg_grade: {
  6. avg: {
  7. field: "grade",
  8. },
  9. },
  10. },
  11. });
  12. console.log(response);

Console

  1. POST /exams/_search?size=0
  2. {
  3. "aggs": {
  4. "avg_grade": { "avg": { "field": "grade" } }
  5. }
  6. }

上記の集約は、すべての文書の平均成績を計算します。集約タイプは avg で、field 設定は平均が計算される文書の数値フィールドを定義します。上記は次の結果を返します:

Console-Result

  1. {
  2. ...
  3. "aggregations": {
  4. "avg_grade": {
  5. "value": 75.0
  6. }
  7. }
  8. }

集約の名前(上記の avg_grade)は、返されたレスポンスから集約結果を取得するためのキーとしても機能します。

Script

試験が非常に難しかったとしましょう。成績の修正を適用する必要があります。 ランタイムフィールド の平均を計算して修正された平均を取得します:

Python

  1. resp = client.search(
  2. index="exams",
  3. size="0",
  4. runtime_mappings={
  5. "grade.corrected": {
  6. "type": "double",
  7. "script": {
  8. "source": "emit(Math.min(100, doc['grade'].value * params.correction))",
  9. "params": {
  10. "correction": 1.2
  11. }
  12. }
  13. }
  14. },
  15. aggs={
  16. "avg_corrected_grade": {
  17. "avg": {
  18. "field": "grade.corrected"
  19. }
  20. }
  21. },
  22. )
  23. print(resp)

Ruby

  1. response = client.search(
  2. index: 'exams',
  3. size: 0,
  4. body: {
  5. runtime_mappings: {
  6. 'grade.corrected' => {
  7. type: 'double',
  8. script: {
  9. source: "emit(Math.min(100, doc['grade'].value * params.correction))",
  10. params: {
  11. correction: 1.2
  12. }
  13. }
  14. }
  15. },
  16. aggregations: {
  17. avg_corrected_grade: {
  18. avg: {
  19. field: 'grade.corrected'
  20. }
  21. }
  22. }
  23. }
  24. )
  25. puts response

Js

  1. const response = await client.search({
  2. index: "exams",
  3. size: 0,
  4. runtime_mappings: {
  5. "grade.corrected": {
  6. type: "double",
  7. script: {
  8. source: "emit(Math.min(100, doc['grade'].value * params.correction))",
  9. params: {
  10. correction: 1.2,
  11. },
  12. },
  13. },
  14. },
  15. aggs: {
  16. avg_corrected_grade: {
  17. avg: {
  18. field: "grade.corrected",
  19. },
  20. },
  21. },
  22. });
  23. console.log(response);

Console

  1. POST /exams/_search?size=0
  2. {
  3. "runtime_mappings": {
  4. "grade.corrected": {
  5. "type": "double",
  6. "script": {
  7. "source": "emit(Math.min(100, doc['grade'].value * params.correction))",
  8. "params": {
  9. "correction": 1.2
  10. }
  11. }
  12. }
  13. },
  14. "aggs": {
  15. "avg_corrected_grade": {
  16. "avg": {
  17. "field": "grade.corrected"
  18. }
  19. }
  20. }
  21. }

Missing value

missing パラメータは、値が欠落している文書がどのように扱われるべきかを定義します。デフォルトでは無視されますが、値があるかのように扱うことも可能です。

Python

  1. resp = client.search(
  2. index="exams",
  3. size="0",
  4. aggs={
  5. "grade_avg": {
  6. "avg": {
  7. "field": "grade",
  8. "missing": 10
  9. }
  10. }
  11. },
  12. )
  13. print(resp)

Ruby

  1. response = client.search(
  2. index: 'exams',
  3. size: 0,
  4. body: {
  5. aggregations: {
  6. grade_avg: {
  7. avg: {
  8. field: 'grade',
  9. missing: 10
  10. }
  11. }
  12. }
  13. }
  14. )
  15. puts response

Js

  1. const response = await client.search({
  2. index: "exams",
  3. size: 0,
  4. aggs: {
  5. grade_avg: {
  6. avg: {
  7. field: "grade",
  8. missing: 10,
  9. },
  10. },
  11. },
  12. });
  13. console.log(response);

Console

  1. POST /exams/_search?size=0
  2. {
  3. "aggs": {
  4. "grade_avg": {
  5. "avg": {
  6. "field": "grade",
  7. "missing": 10
  8. }
  9. }
  10. }
  11. }
grade フィールドに値がない文書は、値が 10 の文書と同じバケットに入ります。

Histogram fields

ヒストグラムフィールド に対して平均が計算されると、集約の結果は values 配列内のすべての要素の加重平均であり、counts 配列内の同じ位置の数を考慮します。

たとえば、異なるネットワークのレイテンシメトリクスを持つ事前集約されたヒストグラムを保存する次のインデックスの場合:

Python

  1. resp = client.index(
  2. index="metrics_index",
  3. id="1",
  4. document={
  5. "network.name": "net-1",
  6. "latency_histo": {
  7. "values": [
  8. 0.1,
  9. 0.2,
  10. 0.3,
  11. 0.4,
  12. 0.5
  13. ],
  14. "counts": [
  15. 3,
  16. 7,
  17. 23,
  18. 12,
  19. 6
  20. ]
  21. }
  22. },
  23. )
  24. print(resp)
  25. resp1 = client.index(
  26. index="metrics_index",
  27. id="2",
  28. document={
  29. "network.name": "net-2",
  30. "latency_histo": {
  31. "values": [
  32. 0.1,
  33. 0.2,
  34. 0.3,
  35. 0.4,
  36. 0.5
  37. ],
  38. "counts": [
  39. 8,
  40. 17,
  41. 8,
  42. 7,
  43. 6
  44. ]
  45. }
  46. },
  47. )
  48. print(resp1)
  49. resp2 = client.search(
  50. index="metrics_index",
  51. size="0",
  52. aggs={
  53. "avg_latency": {
  54. "avg": {
  55. "field": "latency_histo"
  56. }
  57. }
  58. },
  59. )
  60. print(resp2)

Ruby

  1. response = client.index(
  2. index: 'metrics_index',
  3. id: 1,
  4. body: {
  5. 'network.name' => 'net-1',
  6. latency_histo: {
  7. values: [
  8. 0.1,
  9. 0.2,
  10. 0.3,
  11. 0.4,
  12. 0.5
  13. ],
  14. counts: [
  15. 3,
  16. 7,
  17. 23,
  18. 12,
  19. 6
  20. ]
  21. }
  22. }
  23. )
  24. puts response
  25. response = client.index(
  26. index: 'metrics_index',
  27. id: 2,
  28. body: {
  29. 'network.name' => 'net-2',
  30. latency_histo: {
  31. values: [
  32. 0.1,
  33. 0.2,
  34. 0.3,
  35. 0.4,
  36. 0.5
  37. ],
  38. counts: [
  39. 8,
  40. 17,
  41. 8,
  42. 7,
  43. 6
  44. ]
  45. }
  46. }
  47. )
  48. puts response
  49. response = client.search(
  50. index: 'metrics_index',
  51. size: 0,
  52. body: {
  53. aggregations: {
  54. avg_latency: {
  55. avg: {
  56. field: 'latency_histo'
  57. }
  58. }
  59. }
  60. }
  61. )
  62. puts response

Js

  1. const response = await client.index({
  2. index: "metrics_index",
  3. id: 1,
  4. document: {
  5. "network.name": "net-1",
  6. latency_histo: {
  7. values: [0.1, 0.2, 0.3, 0.4, 0.5],
  8. counts: [3, 7, 23, 12, 6],
  9. },
  10. },
  11. });
  12. console.log(response);
  13. const response1 = await client.index({
  14. index: "metrics_index",
  15. id: 2,
  16. document: {
  17. "network.name": "net-2",
  18. latency_histo: {
  19. values: [0.1, 0.2, 0.3, 0.4, 0.5],
  20. counts: [8, 17, 8, 7, 6],
  21. },
  22. },
  23. });
  24. console.log(response1);
  25. const response2 = await client.search({
  26. index: "metrics_index",
  27. size: 0,
  28. aggs: {
  29. avg_latency: {
  30. avg: {
  31. field: "latency_histo",
  32. },
  33. },
  34. },
  35. });
  36. console.log(response2);

Console

  1. PUT metrics_index/_doc/1
  2. {
  3. "network.name" : "net-1",
  4. "latency_histo" : {
  5. "values" : [0.1, 0.2, 0.3, 0.4, 0.5],
  6. "counts" : [3, 7, 23, 12, 6]
  7. }
  8. }
  9. PUT metrics_index/_doc/2
  10. {
  11. "network.name" : "net-2",
  12. "latency_histo" : {
  13. "values" : [0.1, 0.2, 0.3, 0.4, 0.5],
  14. "counts" : [8, 17, 8, 7, 6]
  15. }
  16. }
  17. POST /metrics_index/_search?size=0
  18. {
  19. "aggs": {
  20. "avg_latency":
  21. { "avg": { "field": "latency_histo" }
  22. }
  23. }
  24. }

各ヒストグラムフィールドに対して、avg 集約は values 配列内の各数値 \u0026lt;1\u0026gt; を、その関連するカウントが counts 配列内にあるもの \u0026lt;2\u0026gt; で掛け算します。最終的に、すべてのヒストグラムのこれらの値の平均を計算し、次の結果を返します:

Console-Result

  1. {
  2. ...
  3. "aggregations": {
  4. "avg_latency": {
  5. "value": 0.29690721649
  6. }
  7. }
  8. }