集約関数
入力値のセットから 単一 の結果を計算するための関数です。Elasticsearch SQLは、グループ化(暗黙的または明示的)とともにのみ集約関数をサポートします。
一般的な目的
AVG
概要:
Sql
AVG(numeric_field)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明: 入力値の平均(算術平均)を返します。
Sql
SELECT AVG(salary) AS avg FROM emp;
avg
---------------
48248.55
Sql
SELECT AVG(salary / 12.0) AS avg FROM emp;
avg
---------------
4020.7125
COUNT
概要:
Sql
COUNT(expression)
入力:
フィールド名、ワイルドカード(* )または任意の数値。COUNT(*) またはCOUNT(<literal>) の場合、すべての値が考慮され、null または欠損値も含まれます。COUNT(<field_name>) の場合、null 値は考慮されません。 |
出力: 数値
説明: 入力値の合計数(カウント)を返します。
Sql
SELECT COUNT(*) AS count FROM emp;
count
---------------
100
COUNT(ALL)
概要:
Sql
COUNT(ALL field_name)
入力:
フィールド名。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: 数値
説明: すべての非NULL入力値の合計数(カウント)を返します。COUNT(<field_name>)
とCOUNT(ALL <field_name>)
は同等です。
Sql
SELECT COUNT(ALL last_name) AS count_all, COUNT(DISTINCT last_name) count_distinct FROM emp;
count_all | count_distinct
---------------+------------------
100 |96
Sql
SELECT COUNT(ALL CASE WHEN languages IS NULL THEN -1 ELSE languages END) AS count_all, COUNT(DISTINCT CASE WHEN languages IS NULL THEN -1 ELSE languages END) count_distinct FROM emp;
count_all | count_distinct
---------------+---------------
100 |6
COUNT(DISTINCT)
概要:
Sql
COUNT(DISTINCT field_name)
入力:
フィールド名 |
出力: 数値。このフィールドにnull
値のみが含まれている場合、関数はnull
を返します。そうでない場合、関数はこのフィールドのnull
値を無視します。
説明: 入力値の異なる非NULL値の合計数を返します。
Sql
SELECT COUNT(DISTINCT hire_date) unique_hires, COUNT(hire_date) AS hires FROM emp;
unique_hires | hires
----------------+---------------
99 |100
Sql
SELECT COUNT(DISTINCT DATE_TRUNC('YEAR', hire_date)) unique_hires, COUNT(DATE_TRUNC('YEAR', hire_date)) AS hires FROM emp;
unique_hires | hires
---------------+---------------
14 |100
FIRST/FIRST_VALUE
概要:
Sql
FIRST(
field_name
[, ordering_field_name])
入力:
集約の対象フィールド | |
並べ替えに使用されるオプションのフィールド |
出力: 入力と同じ型
説明: ordering_field_name
列でソートされたfield_name
入力列の最初の非null
値(存在する場合)を返します。ordering_field_name
が提供されていない場合、field_name
列のみがソートに使用されます。例:
| a | b |
| :— | :— |
| 100 | 1 |
| 200 | 1 |
| 1 | 2 |
| 2 | 2 |
| 10 | null |
| 20 | null |
| null | null |
Sql
SELECT FIRST(a) FROM t
結果は次のようになります:
FIRST(a) |
1 |
そして
Sql
SELECT FIRST(a, b) FROM t
結果は次のようになります:
FIRST(a, b) |
100 |
Sql
SELECT FIRST(first_name) FROM emp;
FIRST(first_name)
--------------------
Alejandro
Sql
SELECT gender, FIRST(first_name) FROM emp GROUP BY gender ORDER BY gender;
gender | FIRST(first_name)
------------+--------------------
null | Berni
F | Alejandro
M | Amabile
Sql
SELECT FIRST(first_name, birth_date) FROM emp;
FIRST(first_name, birth_date)
--------------------------------
Remzi
Sql
SELECT gender, FIRST(first_name, birth_date) FROM emp GROUP BY gender ORDER BY gender;
gender | FIRST(first_name, birth_date)
--------------+--------------------------------
null | Lillian
F | Sumant
M | Remzi
#### Sql
``````sql
SELECT gender, FIRST_VALUE(first_name, birth_date) FROM emp GROUP BY gender ORDER BY gender;
gender | FIRST_VALUE(first_name, birth_date)
--------------+--------------------------------------
null | Lillian
F | Sumant
M | Remzi
`
Sql
SELECT gender, FIRST_VALUE(SUBSTRING(first_name, 2, 6), birth_date) AS "first" FROM emp GROUP BY gender ORDER BY gender;
gender | first
---------------+---------------
null |illian
F |umant
M |emzi
`````FIRST`````は、フィールドが[キーワードとして保存されている](a85566ae42da41c4.md#before-enabling-fielddata)場合を除き、[`````text`````](/read/elasticsearch-8-15/a85566ae42da41c4.md)型の列で使用できません。
## LAST/LAST_VALUE
**概要:**
#### Sql
``````sql
LAST(
field_name
[, ordering_field_name])
`
入力:
集約の対象フィールド | |
並べ替えに使用されるオプションのフィールド |
出力: 入力と同じ型
説明: FIRST/FIRST_VALUE
の逆です。field_name
入力列の最後の非null
値(存在する場合)をordering_field_name
列で降順にソートして返します。ordering_field_name
が提供されていない場合、field_name
列のみがソートに使用されます。例:
| a | b |
| :— | :— |
| 10 | 1 |
| 20 | 1 |
| 1 | 2 |
| 2 | 2 |
| 100 | null |
| 200 | null |
| null | null |
Sql
SELECT LAST(a) FROM t
結果は次のようになります:
LAST(a) |
200 |
そして
Sql
SELECT LAST(a, b) FROM t
結果は次のようになります:
LAST(a, b) |
2 |
Sql
SELECT LAST(first_name) FROM emp;
LAST(first_name)
-------------------
Zvonko
Sql
SELECT gender, LAST(first_name) FROM emp GROUP BY gender ORDER BY gender;
gender | LAST(first_name)
------------+-------------------
null | Patricio
F | Xinglin
M | Zvonko
Sql
SELECT LAST(first_name, birth_date) FROM emp;
LAST(first_name, birth_date)
-------------------------------
Hilari
Sql
SELECT gender, LAST(first_name, birth_date) FROM emp GROUP BY gender ORDER BY gender;
gender | LAST(first_name, birth_date)
-----------+-------------------------------
null | Eberhardt
F | Valdiodio
M | Hilari
#### Sql
``````sql
SELECT gender, LAST_VALUE(first_name, birth_date) FROM emp GROUP BY gender ORDER BY gender;
gender | LAST_VALUE(first_name, birth_date)
-----------+-------------------------------------
null | Eberhardt
F | Valdiodio
M | Hilari
`
Sql
SELECT gender, LAST_VALUE(SUBSTRING(first_name, 3, 8), birth_date) AS "last" FROM emp GROUP BY gender ORDER BY gender;
gender | last
---------------+---------------
null |erhardt
F |ldiodio
M |lari
`````LAST`````は、フィールドが[`````text`````](/read/elasticsearch-8-15/a85566ae42da41c4.md)型の場合を除き、`````saved as a keyword`````句で使用できません。
## MAX
**概要:**
#### Sql
``````sql
MAX(field_name)
`
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: 入力と同じ型
説明: フィールドfield_name
の入力値の中で最大の値を返します。
Sql
SELECT MAX(salary) AS max FROM emp;
max
---------------
74999
Sql
SELECT MAX(ABS(salary / -12.0)) AS max FROM emp;
max
-----------------
6249.916666666667
## MIN
**概要:**
#### Sql
``````sql
MIN(field_name)
`
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: 入力と同じ型
説明: フィールドfield_name
の入力値の中で最小の値を返します。
Sql
SELECT MIN(salary) AS min FROM emp;
min
---------------
25324
## SUM
**概要:**
#### Sql
``````sql
SUM(field_name)
`
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: 整数入力の場合はbigint
、浮動小数点の場合はdouble
説明: フィールドfield_name
の入力値の合計を返します。
Sql
SELECT SUM(salary) AS sum FROM emp;
sum
---------------
4824855
Sql
SELECT ROUND(SUM(salary / 12.0), 1) AS sum FROM emp;
sum
---------------
402071.3
統計
KURTOSIS
概要:
Sql
KURTOSIS(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の分布の形状を定量化します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, KURTOSIS(salary) AS k FROM emp;
min | max | k
---------------+---------------+------------------
25324 |74999 |2.0444718929142986
#### Sql
``````sql
SELECT KURTOSIS(salary / 12.0), gender FROM emp GROUP BY gender
`
MAD
概要:
Sql
MAD(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の変動性を測定します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, AVG(salary) AS avg, MAD(salary) AS mad FROM emp;
min | max | avg | mad
---------------+---------------+---------------+---------------
25324 |74999 |48248.55 |10096.5
Sql
SELECT MIN(salary / 12.0) AS min, MAX(salary / 12.0) AS max, AVG(salary/ 12.0) AS avg, MAD(salary / 12.0) AS mad FROM emp;
min | max | avg | mad
------------------+-----------------+---------------+-----------------
2110.3333333333335|6249.916666666667|4020.7125 |841.3750000000002
PERCENTILE
概要:
Sql
PERCENTILE(
field_name,
percentile[,
method[,
method_parameter]])
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
|
数値式(定数であり、フィールドに基づいてはならない)。もしnull の場合、関数はnull を返します。 |
|
パーセンタイルアルゴリズムのためのオプションの文字列リテラル。可能な値: tdigest またはhdr 。デフォルトはtdigest です。 |
|
パーセンタイルアルゴリズムを構成するオプションの数値リテラル。compression のためのtdigest またはnumber_of_significant_value_digits のためのhdr を構成します。デフォルトはバックエンドアルゴリズムと同じです。 |
出力: double
数値
説明:
フィールドfield_name
の入力値のnth パーセンタイル(numeric_exp
パラメータで表される)を返します。
Sql
SELECT languages, PERCENTILE(salary, 95) AS "95th" FROM emp
GROUP BY languages;
languages | 95th
---------------+-----------------
null |74482.4
1 |71122.8
2 |70271.4
3 |71926.0
4 |69352.15
5 |56371.0
Sql
SELECT languages, PERCENTILE(salary / 12.0, 95) AS "95th" FROM emp
GROUP BY languages;
languages | 95th
---------------+------------------
null |6206.866666666667
1 |5926.9
2 |5855.949999999999
3 |5993.833333333333
4 |5779.345833333333
5 |4697.583333333333
Sql
SELECT
languages,
PERCENTILE(salary, 97.3, 'tdigest', 100.0) AS "97.3_TDigest",
PERCENTILE(salary, 97.3, 'hdr', 3) AS "97.3_HDR"
FROM emp
GROUP BY languages;
languages | 97.3_TDigest | 97.3_HDR
---------------+-----------------+---------------
null |74720.036 |74992.0
1 |72316.132 |73712.0
2 |71792.436 |69936.0
3 |73326.23999999999|74992.0
4 |71753.281 |74608.0
5 |61176.16000000001|56368.0
PERCENTILE_RANK
概要:
Sql
PERCENTILE_RANK(
field_name,
value[,
method[,
method_parameter]])
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
|
数値式(定数であり、フィールドに基づいてはならない)。もしnull の場合、関数はnull を返します。 |
|
パーセンタイルアルゴリズムのためのオプションの文字列リテラル。可能な値: tdigest またはhdr 。デフォルトはtdigest です。 |
|
パーセンタイルアルゴリズムを構成するオプションの数値リテラル。compression のためのtdigest またはnumber_of_significant_value_digits のためのhdr を構成します。デフォルトはバックエンドアルゴリズムと同じです。 |
出力: double
数値
説明:
フィールドfield_name
の入力値のnth パーセンタイルランク(numeric_exp
パラメータで表される)を返します。
Sql
SELECT languages, PERCENTILE_RANK(salary, 65000) AS rank FROM emp GROUP BY languages;
languages | rank
---------------+-----------------
null |73.65766569962062
1 |73.7291625157734
2 |88.88005607010643
3 |79.43662623295829
4 |85.70446389643493
5 |96.79075152940749
Sql
SELECT languages, PERCENTILE_RANK(salary/12, 5000) AS rank FROM emp GROUP BY languages;
languages | rank
---------------+------------------
null |66.91240875912409
1 |66.70766707667076
2 |84.13266895048271
3 |61.052992625621684
4 |76.55646443990001
5 |94.00696864111498
Sql
SELECT
languages,
ROUND(PERCENTILE_RANK(salary, 65000, 'tdigest', 100.0), 2) AS "rank_TDigest",
ROUND(PERCENTILE_RANK(salary, 65000, 'hdr', 3), 2) AS "rank_HDR"
FROM emp
GROUP BY languages;
languages | rank_TDigest | rank_HDR
---------------+---------------+---------------
null |73.66 |80.0
1 |73.73 |73.33
2 |88.88 |89.47
3 |79.44 |76.47
4 |85.7 |83.33
5 |96.79 |95.24
SKEWNESS
概要:
Sql
SKEWNESS(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の非対称分布を定量化します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, SKEWNESS(salary) AS s FROM emp;
min | max | s
---------------+---------------+------------------
25324 |74999 |0.2707722118423227
#### Sql
``````sql
SELECT SKEWNESS(ROUND(salary / 12.0, 2), gender FROM emp GROUP BY gender
`
STDDEV_POP
概要:
Sql
STDDEV_POP(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の母集団標準偏差を返します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, STDDEV_POP(salary) AS stddev FROM emp;
min | max | stddev
---------------+---------------+------------------
25324 |74999 |13765.125502787832
Sql
SELECT MIN(salary / 12.0) AS min, MAX(salary / 12.0) AS max, STDDEV_POP(salary / 12.0) AS stddev FROM emp;
min | max | stddev
------------------+-----------------+-----------------
2110.3333333333335|6249.916666666667|1147.093791898986
STDDEV_SAMP
概要:
Sql
STDDEV_SAMP(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値のサンプル標準偏差を返します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, STDDEV_SAMP(salary) AS stddev FROM emp;
min | max | stddev
---------------+---------------+------------------
25324 |74999 |13834.471662090747
Sql
SELECT MIN(salary / 12.0) AS min, MAX(salary / 12.0) AS max, STDDEV_SAMP(salary / 12.0) AS stddev FROM emp;
min | max | stddev
------------------+-----------------+-----------------
2110.3333333333335|6249.916666666667|1152.872638507562
SUM_OF_SQUARES
概要:
Sql
SUM_OF_SQUARES(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の二乗和を返します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, SUM_OF_SQUARES(salary) AS sumsq
FROM emp;
min | max | sumsq
---------------+---------------+----------------
25324 |74999 |2.51740125721E11
Sql
SELECT MIN(salary / 24.0) AS min, MAX(salary / 24.0) AS max, SUM_OF_SQUARES(salary / 24.0) AS sumsq FROM emp;
min | max | sumsq
------------------+------------------+-------------------
1055.1666666666667|3124.9583333333335|4.370488293767361E8
VAR_POP
概要:
Sql
VAR_POP(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値の母集団分散を返します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, VAR_POP(salary) AS varpop FROM emp;
min | max | varpop
---------------+---------------+----------------
25324 |74999 |1.894786801075E8
Sql
SELECT MIN(salary / 24.0) AS min, MAX(salary / 24.0) AS max, VAR_POP(salary / 24.0) AS varpop FROM emp;
min | max | varpop
------------------+------------------+------------------
1055.1666666666667|3124.9583333333335|328956.04185329855
VAR_SAMP
概要:
Sql
VAR_SAMP(field_name)
入力:
数値フィールド。このフィールドにnull 値のみが含まれている場合、関数はnull を返します。そうでない場合、関数はこのフィールドのnull 値を無視します。 |
出力: double
数値
説明:
フィールドfield_name
の入力値のサンプル分散を返します。
Sql
SELECT MIN(salary) AS min, MAX(salary) AS max, VAR_SAMP(salary) AS varsamp FROM emp;
min | max | varsamp
---------------+---------------+----------------
25324 |74999 |1.913926061691E8
Sql
SELECT MIN(salary / 24.0) AS min, MAX(salary / 24.0) AS max, VAR_SAMP(salary / 24.0) AS varsamp FROM emp;
min | max | varsamp
------------------+------------------+----------------
1055.1666666666667|3124.9583333333335|332278.830154847