ジオハッシュグリッド集約
複数のバケット集約で、geo_point
と geo_shape
の値をグリッドを表すバケットにグループ化します。結果として得られるグリッドはまばらで、マッチするデータを持つセルのみを含みます。各セルは、ユーザーが定義可能な精度の ジオハッシュ でラベル付けされます。
- 高精度のジオハッシュは長い文字列の長さを持ち、わずかな面積をカバーするセルを表します。
- 低精度のジオハッシュは短い文字列の長さを持ち、それぞれが大きな面積をカバーするセルを表します。
この集約で使用されるジオハッシュは、1から12の間で精度を選択できます。
長さ12の最高精度のジオハッシュは、1平方メートル未満の土地をカバーするセルを生成し、高精度のリクエストはRAMと結果サイズの観点から非常にコストがかかる可能性があります。高い詳細レベルをリクエストする前に、集約をより小さな地理的エリアにフィルタリングする方法については、以下の例を参照してください。
geohash_grid
を使用して、明示的にマッピングされた geo_point
または geo_shape
フィールドを集約することができます。geo_point
フィールドが配列を含む場合、geohash_grid
はすべての配列値を集約します。
シンプルな低精度リクエスト
Python
resp = client.indices.create(
index="museums",
mappings={
"properties": {
"location": {
"type": "geo_point"
}
}
},
)
print(resp)
resp1 = client.bulk(
index="museums",
refresh=True,
operations=[
{
"index": {
"_id": 1
}
},
{
"location": "POINT (4.912350 52.374081)",
"name": "NEMO Science Museum"
},
{
"index": {
"_id": 2
}
},
{
"location": "POINT (4.901618 52.369219)",
"name": "Museum Het Rembrandthuis"
},
{
"index": {
"_id": 3
}
},
{
"location": "POINT (4.914722 52.371667)",
"name": "Nederlands Scheepvaartmuseum"
},
{
"index": {
"_id": 4
}
},
{
"location": "POINT (4.405200 51.222900)",
"name": "Letterenhuis"
},
{
"index": {
"_id": 5
}
},
{
"location": "POINT (2.336389 48.861111)",
"name": "Musée du Louvre"
},
{
"index": {
"_id": 6
}
},
{
"location": "POINT (2.327000 48.860000)",
"name": "Musée d'Orsay"
}
],
)
print(resp1)
resp2 = client.search(
index="museums",
size="0",
aggregations={
"large-grid": {
"geohash_grid": {
"field": "location",
"precision": 3
}
}
},
)
print(resp2)
Ruby
response = client.indices.create(
index: 'museums',
body: {
mappings: {
properties: {
location: {
type: 'geo_point'
}
}
}
}
)
puts response
response = client.bulk(
index: 'museums',
refresh: true,
body: [
{
index: {
_id: 1
}
},
{
location: 'POINT (4.912350 52.374081)',
name: 'NEMO Science Museum'
},
{
index: {
_id: 2
}
},
{
location: 'POINT (4.901618 52.369219)',
name: 'Museum Het Rembrandthuis'
},
{
index: {
_id: 3
}
},
{
location: 'POINT (4.914722 52.371667)',
name: 'Nederlands Scheepvaartmuseum'
},
{
index: {
_id: 4
}
},
{
location: 'POINT (4.405200 51.222900)',
name: 'Letterenhuis'
},
{
index: {
_id: 5
}
},
{
location: 'POINT (2.336389 48.861111)',
name: 'Musée du Louvre'
},
{
index: {
_id: 6
}
},
{
location: 'POINT (2.327000 48.860000)',
name: "Musée d'Orsay"
}
]
)
puts response
response = client.search(
index: 'museums',
size: 0,
body: {
aggregations: {
"large-grid": {
geohash_grid: {
field: 'location',
precision: 3
}
}
}
}
)
puts response
Js
const response = await client.indices.create({
index: "museums",
mappings: {
properties: {
location: {
type: "geo_point",
},
},
},
});
console.log(response);
const response1 = await client.bulk({
index: "museums",
refresh: "true",
operations: [
{
index: {
_id: 1,
},
},
{
location: "POINT (4.912350 52.374081)",
name: "NEMO Science Museum",
},
{
index: {
_id: 2,
},
},
{
location: "POINT (4.901618 52.369219)",
name: "Museum Het Rembrandthuis",
},
{
index: {
_id: 3,
},
},
{
location: "POINT (4.914722 52.371667)",
name: "Nederlands Scheepvaartmuseum",
},
{
index: {
_id: 4,
},
},
{
location: "POINT (4.405200 51.222900)",
name: "Letterenhuis",
},
{
index: {
_id: 5,
},
},
{
location: "POINT (2.336389 48.861111)",
name: "Musée du Louvre",
},
{
index: {
_id: 6,
},
},
{
location: "POINT (2.327000 48.860000)",
name: "Musée d'Orsay",
},
],
});
console.log(response1);
const response2 = await client.search({
index: "museums",
size: 0,
aggregations: {
"large-grid": {
geohash_grid: {
field: "location",
precision: 3,
},
},
},
});
console.log(response2);
コンソール
PUT /museums
{
"mappings": {
"properties": {
"location": {
"type": "geo_point"
}
}
}
}
POST /museums/_bulk?refresh
{"index":{"_id":1}}
{"location": "POINT (4.912350 52.374081)", "name": "NEMO Science Museum"}
{"index":{"_id":2}}
{"location": "POINT (4.901618 52.369219)", "name": "Museum Het Rembrandthuis"}
{"index":{"_id":3}}
{"location": "POINT (4.914722 52.371667)", "name": "Nederlands Scheepvaartmuseum"}
{"index":{"_id":4}}
{"location": "POINT (4.405200 51.222900)", "name": "Letterenhuis"}
{"index":{"_id":5}}
{"location": "POINT (2.336389 48.861111)", "name": "Musée du Louvre"}
{"index":{"_id":6}}
{"location": "POINT (2.327000 48.860000)", "name": "Musée d'Orsay"}
POST /museums/_search?size=0
{
"aggregations": {
"large-grid": {
"geohash_grid": {
"field": "location",
"precision": 3
}
}
}
}
コンソール結果
{
...
"aggregations": {
"large-grid": {
"buckets": [
{
"key": "u17",
"doc_count": 3
},
{
"key": "u09",
"doc_count": 2
},
{
"key": "u15",
"doc_count": 1
}
]
}
}
}
高精度リクエスト
詳細なバケットをリクエストする際(通常は「ズームイン」マップを表示するため)、geo_bounding_box のようなフィルターを適用して対象エリアを狭める必要があります。さもなければ、数百万のバケットが作成され、返される可能性があります。
Python
resp = client.search(
index="museums",
size="0",
aggregations={
"zoomed-in": {
"filter": {
"geo_bounding_box": {
"location": {
"top_left": "POINT (4.9 52.4)",
"bottom_right": "POINT (5.0 52.3)"
}
}
},
"aggregations": {
"zoom1": {
"geohash_grid": {
"field": "location",
"precision": 8
}
}
}
}
},
)
print(resp)
Ruby
response = client.search(
index: 'museums',
size: 0,
body: {
aggregations: {
"zoomed-in": {
filter: {
geo_bounding_box: {
location: {
top_left: 'POINT (4.9 52.4)',
bottom_right: 'POINT (5.0 52.3)'
}
}
},
aggregations: {
"zoom1": {
geohash_grid: {
field: 'location',
precision: 8
}
}
}
}
}
}
)
puts response
Js
const response = await client.search({
index: "museums",
size: 0,
aggregations: {
"zoomed-in": {
filter: {
geo_bounding_box: {
location: {
top_left: "POINT (4.9 52.4)",
bottom_right: "POINT (5.0 52.3)",
},
},
},
aggregations: {
zoom1: {
geohash_grid: {
field: "location",
precision: 8,
},
},
},
},
},
});
console.log(response);
コンソール
POST /museums/_search?size=0
{
"aggregations": {
"zoomed-in": {
"filter": {
"geo_bounding_box": {
"location": {
"top_left": "POINT (4.9 52.4)",
"bottom_right": "POINT (5.0 52.3)"
}
}
},
"aggregations": {
"zoom1": {
"geohash_grid": {
"field": "location",
"precision": 8
}
}
}
}
}
}
geohash_grid
集約によって返されたジオハッシュは、ズームインにも使用できます。前の例で返された最初のジオハッシュ u17
にズームインするには、top_left
と bottom_right
の両方のコーナーとして指定する必要があります:
Python
resp = client.search(
index="museums",
size="0",
aggregations={
"zoomed-in": {
"filter": {
"geo_bounding_box": {
"location": {
"top_left": "u17",
"bottom_right": "u17"
}
}
},
"aggregations": {
"zoom1": {
"geohash_grid": {
"field": "location",
"precision": 8
}
}
}
}
},
)
print(resp)
Ruby
response = client.search(
index: 'museums',
size: 0,
body: {
aggregations: {
"zoomed-in": {
filter: {
geo_bounding_box: {
location: {
top_left: 'u17',
bottom_right: 'u17'
}
}
},
aggregations: {
"zoom1": {
geohash_grid: {
field: 'location',
precision: 8
}
}
}
}
}
}
)
puts response
Js
const response = await client.search({
index: "museums",
size: 0,
aggregations: {
"zoomed-in": {
filter: {
geo_bounding_box: {
location: {
top_left: "u17",
bottom_right: "u17",
},
},
},
aggregations: {
zoom1: {
geohash_grid: {
field: "location",
precision: 8,
},
},
},
},
},
});
console.log(response);
コンソール
POST /museums/_search?size=0
{
"aggregations": {
"zoomed-in": {
"filter": {
"geo_bounding_box": {
"location": {
"top_left": "u17",
"bottom_right": "u17"
}
}
},
"aggregations": {
"zoom1": {
"geohash_grid": {
"field": "location",
"precision": 8
}
}
}
}
}
}
コンソール結果
{
...
"aggregations": {
"zoomed-in": {
"doc_count": 3,
"zoom1": {
"buckets": [
{
"key": "u173zy3j",
"doc_count": 1
},
{
"key": "u173zvfz",
"doc_count": 1
},
{
"key": "u173zt90",
"doc_count": 1
}
]
}
}
}
}
ジオハッシュをサポートしていないシステムで「ズームイン」するためには、バケットキーを利用可能なジオハッシュライブラリの1つを使用してバウンディングボックスに変換する必要があります。たとえば、JavaScriptの場合は、node-geohash ライブラリを使用できます:
Js
var geohash = require('ngeohash');
// bbox will contain [ 52.03125, 4.21875, 53.4375, 5.625 ]
// [ minlat, minlon, maxlat, maxlon]
var bbox = geohash.decode_bbox('u17');
追加のバウンディングボックスフィルタリングを伴うリクエスト
geohash_grid
集約は、提供された境界と交差するセルを考慮する bounds
パラメータをサポートしています。bounds
パラメータは、Geo Bounding Box Query で指定された境界のすべての同じ 受け入れられた形式 でバウンディングボックスを受け入れます。このバウンディングボックスは、集約前にポイントをフィルタリングする追加の geo_bounding_box
クエリとともに、またはそれなしで使用できます。これは独立したバウンディングボックスであり、追加の geo_bounding_box
クエリと交差したり、等しい場合や、離れている場合があります。
Python
resp = client.search(
index="museums",
size="0",
aggregations={
"tiles-in-bounds": {
"geohash_grid": {
"field": "location",
"precision": 8,
"bounds": {
"top_left": "POINT (4.21875 53.4375)",
"bottom_right": "POINT (5.625 52.03125)"
}
}
}
},
)
print(resp)
Ruby
response = client.search(
index: 'museums',
size: 0,
body: {
aggregations: {
"tiles-in-bounds": {
geohash_grid: {
field: 'location',
precision: 8,
bounds: {
top_left: 'POINT (4.21875 53.4375)',
bottom_right: 'POINT (5.625 52.03125)'
}
}
}
}
}
)
puts response
Js
const response = await client.search({
index: "museums",
size: 0,
aggregations: {
"tiles-in-bounds": {
geohash_grid: {
field: "location",
precision: 8,
bounds: {
top_left: "POINT (4.21875 53.4375)",
bottom_right: "POINT (5.625 52.03125)",
},
},
},
},
});
console.log(response);
コンソール
POST /museums/_search?size=0
{
"aggregations": {
"tiles-in-bounds": {
"geohash_grid": {
"field": "location",
"precision": 8,
"bounds": {
"top_left": "POINT (4.21875 53.4375)",
"bottom_right": "POINT (5.625 52.03125)"
}
}
}
}
}
コンソール結果
{
...
"aggregations": {
"tiles-in-bounds": {
"buckets": [
{
"key": "u173zy3j",
"doc_count": 1
},
{
"key": "u173zvfz",
"doc_count": 1
},
{
"key": "u173zt90",
"doc_count": 1
}
]
}
}
}
赤道でのセルの寸法
以下の表は、さまざまな文字列長のジオハッシュでカバーされるセルのメトリック寸法を示しています。セルの寸法は緯度によって異なり、したがってこの表は赤道での最悪のシナリオに対するものです。
ジオハッシュの長さ | 面積の幅 x 高さ |
1 | 5,009.4km x 4,992.6km |
2 | 1,252.3km x 624.1km |
3 | 156.5km x 156km |
4 | 39.1km x 19.5km |
5 | 4.9km x 4.9km |
6 | 1.2km x 609.4m |
7 | 152.9m x 152.4m |
8 | 38.2m x 19m |
9 | 4.8m x 4.8m |
10 | 1.2m x 59.5cm |
11 | 14.9cm x 14.9cm |
12 | 3.7cm x 1.9cm |
geo_shape フィールドの集約
Geoshape フィールドの集約は、ポイントと同様に機能しますが、単一の形状が複数のタイルでカウントされる可能性があります。形状の任意の部分がそのタイルと交差する場合、その形状はマッチする値のカウントに寄与します。以下はこれを示す画像です:
オプション
フィールド | 必須。インデックスされたジオポイントまたはジオシェイプの値を含むフィールド。明示的に geo_point または geo_shape フィールドとしてマッピングされている必要があります。フィールドが配列を含む場合、geohash_grid はすべての配列値を集約します。 |
精度 | オプション。結果のセル/バケットを定義するために使用されるジオハッシュの文字列の長さ。デフォルトは5です。精度は、上記の整数精度レベルで定義できます。[1,12] の範囲外の値は拒否されます。 代わりに、精度レベルは「1km」、「10m」のような距離測定から近似できます。精度レベルは、セルが指定されたサイズ(対角線)の必要な精度を超えないように計算されます。これにより、サポートされている12レベルを超える精度レベルが導かれる場合(例:距離が5.6cm未満の場合)、値は拒否されます。 |
バウンズ | オプション。バケット内のポイントをフィルタリングするためのバウンディングボックス。 |
サイズ | オプション。返されるジオハッシュバケットの最大数(デフォルトは10,000)。結果がトリミングされる場合、バケットは含まれるドキュメントのボリュームに基づいて優先されます。 |
shard_size | オプション。最終結果で返されるトップセルのより正確なカウントを可能にするため、集約は各シャードから max(10,(size x number-of-shards)) バケットを返すことをデフォルトとします。このヒューリスティックが望ましくない場合、このパラメータを使用して各シャードから考慮される数をオーバーライドできます。 |