ウォッチャーアクション
ウォッチの条件が満たされると、そのアクションが実行されますが、スロットリングされている場合は実行されません。ウォッチは複数のアクションを実行できます。アクションは一度に一つずつ実行され、各アクションは独立して実行されます。アクションを実行中に発生した失敗は、アクションの結果とウォッチの履歴に記録されます。
ウォッチにアクションが定義されていない場合、アクションは実行されません。ただし、watch_record
はウォッチの履歴に書き込まれます。
アクションは実行コンテキスト内のペイロードにアクセスできます。これを使用して、必要に応じて実行をサポートできます。たとえば、ペイロードはテンプレート化されたメール本文のモデルとして機能する場合があります。
ウォッチャーは以下のアクションをサポートしています:
確認とスロットリング
ウォッチの実行中、条件が満たされると、構成されたアクションごとにスロットリングするかどうかの決定が行われます。アクションのスロットリングの主な目的は、同じウォッチに対して同じアクションの実行が多すぎるのを防ぐことです。
たとえば、アプリケーションのログエントリでエラーを検出するウォッチがあるとします。このウォッチは5分ごとにトリガーされ、過去1時間のエラーを検索します。この場合、エラーがあると、ウォッチがチェックされ、そのアクションが同じエラーに基づいて複数回実行される期間があります。その結果、システム管理者は同じ問題について複数の通知を受け取ることになり、煩わしいことがあります。
この問題に対処するために、ウォッチャーは時間ベースのスロットリングをサポートしています。アクションの構成の一部としてスロットリング期間を定義して、アクションがどのくらいの頻度で実行されるかを制限できます。スロットリング期間を設定すると、ウォッチャーはスロットリング期間内にすでに実行された場合、アクションの再実行を防ぎます(now - throttling period
)。
以下のスニペットは、上記のシナリオに対するウォッチを示しています - email_administrator
アクションにスロットル期間を関連付けています:
Python
resp = client.watcher.put_watch(
id="error_logs_alert",
metadata={
"color": "red"
},
trigger={
"schedule": {
"interval": "5m"
}
},
input={
"search": {
"request": {
"indices": "log-events",
"body": {
"size": 0,
"query": {
"match": {
"status": "error"
}
}
}
}
}
},
condition={
"compare": {
"ctx.payload.hits.total": {
"gt": 5
}
}
},
actions={
"email_administrator": {
"throttle_period": "15m",
"email": {
"to": "[email protected]",
"subject": "Encountered {{ctx.payload.hits.total}} errors",
"body": "Too many error in the system, see attached data",
"attachments": {
"attached_data": {
"data": {
"format": "json"
}
}
},
"priority": "high"
}
}
},
)
print(resp)
Js
const response = await client.watcher.putWatch({
id: "error_logs_alert",
metadata: {
color: "red",
},
trigger: {
schedule: {
interval: "5m",
},
},
input: {
search: {
request: {
indices: "log-events",
body: {
size: 0,
query: {
match: {
status: "error",
},
},
},
},
},
},
condition: {
compare: {
"ctx.payload.hits.total": {
gt: 5,
},
},
},
actions: {
email_administrator: {
throttle_period: "15m",
email: {
to: "[email protected]",
subject: "Encountered {{ctx.payload.hits.total}} errors",
body: "Too many error in the system, see attached data",
attachments: {
attached_data: {
data: {
format: "json",
},
},
},
priority: "high",
},
},
},
});
console.log(response);
コンソール
PUT _watcher/watch/error_logs_alert
{
"metadata" : {
"color" : "red"
},
"trigger" : {
"schedule" : {
"interval" : "5m"
}
},
"input" : {
"search" : {
"request" : {
"indices" : "log-events",
"body" : {
"size" : 0,
"query" : { "match" : { "status" : "error" } }
}
}
}
},
"condition" : {
"compare" : { "ctx.payload.hits.total" : { "gt" : 5 }}
},
"actions" : {
"email_administrator" : {
"throttle_period": "15m",
"email" : {
"to" : "[email protected]",
"subject" : "Encountered {{ctx.payload.hits.total}} errors",
"body" : "Too many error in the system, see attached data",
"attachments" : {
"attached_data" : {
"data" : {
"format" : "json"
}
}
},
"priority" : "high"
}
}
}
}
次のemail_administrator アクションの実行の間には少なくとも15分の間隔があります。 |
|
詳細については、メールアクションを参照してください。 |
ウォッチレベルでスロットリング期間を定義することもできます。ウォッチレベルのスロットリング期間は、ウォッチで定義されたすべてのアクションのデフォルトのスロットリング期間として機能します:
Python
resp = client.watcher.put_watch(
id="log_event_watch",
trigger={
"schedule": {
"interval": "5m"
}
},
input={
"search": {
"request": {
"indices": "log-events",
"body": {
"size": 0,
"query": {
"match": {
"status": "error"
}
}
}
}
}
},
condition={
"compare": {
"ctx.payload.hits.total": {
"gt": 5
}
}
},
throttle_period="15m",
actions={
"email_administrator": {
"email": {
"to": "[email protected]",
"subject": "Encountered {{ctx.payload.hits.total}} errors",
"body": "Too many error in the system, see attached data",
"attachments": {
"attached_data": {
"data": {
"format": "json"
}
}
},
"priority": "high"
}
},
"notify_pager": {
"webhook": {
"method": "POST",
"host": "pager.service.domain",
"port": 1234,
"path": "/{{watch_id}}",
"body": "Encountered {{ctx.payload.hits.total}} errors"
}
}
},
)
print(resp)
Js
const response = await client.watcher.putWatch({
id: "log_event_watch",
trigger: {
schedule: {
interval: "5m",
},
},
input: {
search: {
request: {
indices: "log-events",
body: {
size: 0,
query: {
match: {
status: "error",
},
},
},
},
},
},
condition: {
compare: {
"ctx.payload.hits.total": {
gt: 5,
},
},
},
throttle_period: "15m",
actions: {
email_administrator: {
email: {
to: "[email protected]",
subject: "Encountered {{ctx.payload.hits.total}} errors",
body: "Too many error in the system, see attached data",
attachments: {
attached_data: {
data: {
format: "json",
},
},
},
priority: "high",
},
},
notify_pager: {
webhook: {
method: "POST",
host: "pager.service.domain",
port: 1234,
path: "/{{watch_id}}",
body: "Encountered {{ctx.payload.hits.total}} errors",
},
},
},
});
console.log(response);
コンソール
PUT _watcher/watch/log_event_watch
{
"trigger" : {
"schedule" : { "interval" : "5m" }
},
"input" : {
"search" : {
"request" : {
"indices" : "log-events",
"body" : {
"size" : 0,
"query" : { "match" : { "status" : "error" } }
}
}
}
},
"condition" : {
"compare" : { "ctx.payload.hits.total" : { "gt" : 5 }}
},
"throttle_period" : "15m",
"actions" : {
"email_administrator" : {
"email" : {
"to" : "[email protected]",
"subject" : "Encountered {{ctx.payload.hits.total}} errors",
"body" : "Too many error in the system, see attached data",
"attachments" : {
"attached_data" : {
"data" : {
"format" : "json"
}
}
},
"priority" : "high"
}
},
"notify_pager" : {
"webhook" : {
"method" : "POST",
"host" : "pager.service.domain",
"port" : 1234,
"path" : "/{{watch_id}}",
"body" : "Encountered {{ctx.payload.hits.total}} errors"
}
}
}
}
次のアクションの実行の間には少なくとも15分の間隔があります。 ( email_administrator およびnotify_pager アクションの両方に適用されます) |
アクションまたはウォッチレベルでスロットリング期間を定義しない場合、グローバルデフォルトのスロットリング期間が適用されます。最初は5秒に設定されています。グローバルデフォルトを変更するには、xpack.watcher.execution.default_throttle_period
設定をelasticsearch.yml
で構成します:
Yaml
xpack.watcher.execution.default_throttle_period: 15m
ウォッチャーは確認ベースのスロットリングもサポートしています。ウォッチ条件がtrue
の間、ack watch APIを使用してウォッチを確認することで、ウォッチアクションが再度実行されないようにできます。これは本質的にウォッチャーに「通知を受け取り、処理しています。このエラーについて再度通知しないでください」と伝えます。確認されたウォッチアクションは、ウォッチの条件がfalse
に評価されるまでacked
状態に留まります。その際、アクションの状態はawaits_successful_execution
に変更されます。
アクションを確認するには、ack watch APIを使用します:
Python
resp = client.watcher.ack_watch(
watch_id="<id>",
action_id="<action_ids>",
)
print(resp)
Js
const response = await client.watcher.ackWatch({
watch_id: "<id>",
action_id: "<action_ids>",
});
console.log(response);
コンソール
POST _watcher/watch/<id>/_ack/<action_ids>
ウォッチの<id>
はウォッチのIDで、<action_ids>
は確認したいアクションIDのカンマ区切りリストです。すべてのアクションを確認するには、actions
パラメータを省略します。
以下の図は、ウォッチの実行中に各アクションに対して行われたスロットリングの決定を示しています:
OpenJDKでのSSL/TLSの使用
各ディストリビューターはOpenJDKをパッケージ化する方法を自由に選択できるため、同じバージョンであっても、異なるLinuxディストリビューションの下で異なる部分を含むOpenJDKディストリビューションが存在する可能性があります。
これにより、jira
、pagerduty
、slack
、またはwebhook
のようなTLSを使用するアクションや入力に問題が発生する可能性があります。CA証明書が不足しているためです。TLSエンドポイントに接続するウォッチを作成する際にTLSエラーが発生した場合は、プラットフォーム用の最新のOpenJDKディストリビューションにアップグレードしてみてください。それでも問題が解決しない場合は、Oracle JDKにアップグレードしてみてください。