データフレーム分析APIの説明
データフレーム分析の設定について説明します。
リクエスト
GET _ml/data_frame/analytics/_explain
POST _ml/data_frame/analytics/_explain
GET _ml/data_frame/analytics/<data_frame_analytics_id>/_explain
POST _ml/data_frame/analytics/<data_frame_analytics_id>/_explain
前提条件
次の権限が必要です:
- クラスター:
monitor_ml
(machine_learning_user
ビルトインロールがこの権限を付与します) - ソースインデックス:
read
,view_index_metadata
説明
このAPIは、既存のデータフレーム分析設定またはまだ作成されていない設定についての説明を提供します。以下の説明が提供されます:
- 分析に含まれるフィールドと含まれないフィールド、その理由
- 必要とされるメモリの推定量。この推定値は、後で
model_memory_limit
設定の適切な値を決定する際に使用できます。
オブジェクトフィールドやソースフィルタリングによって除外されたフィールドは、説明に含まれません。
パスパラメータ
<data_frame_analytics_id>
- (オプション、文字列)データフレーム分析ジョブの識別子。
リクエストボディ
データフレーム分析ジョブの作成で説明されているデータフレーム分析設定。id
とdest
は、このAPIの文脈では提供する必要はありません。
レスポンスボディ
APIは、以下を含むレスポンスを返します:
field_selection
- (配列)フィールド名でソートされた各フィールドの選択を説明するオブジェクトの配列。
- `````is_included
- (ブール値)フィールドが分析に含まれるように選択されているかどうか。
is_required
- (ブール値)フィールドが必須かどうか。
feature_type
- (文字列)このフィールドの分析における特徴タイプ。
categorical
またはnumerical
の可能性があります。 mapping_types
- (文字列)フィールドのマッピングタイプ。
name
- (文字列)フィールド名。
reason
- (文字列)フィールドが分析に含まれない理由。
memory_estimation
- (オブジェクト)メモリ推定を含むオブジェクト。
- `````expected_memory_with_disk
- (文字列)ディスクへのオーバーフローが許可されているという仮定の下での推定メモリ使用量。
expected_memory_with_disk
は通常、expected_memory_without_disk
よりも小さく、ディスクを使用することでデータフレーム分析を行うために必要な主メモリを制限できます。 expected_memory_without_disk
- (文字列)すべてのデータフレーム分析がメモリ内で行われるべきであるという仮定の下での推定メモリ使用量(つまり、ディスクへのオーバーフローなし)。
例
Python
resp = client.ml.explain_data_frame_analytics(
source={
"index": "houses_sold_last_10_yrs"
},
analysis={
"regression": {
"dependent_variable": "price"
}
},
)
print(resp)
Js
const response = await client.ml.explainDataFrameAnalytics({
source: {
index: "houses_sold_last_10_yrs",
},
analysis: {
regression: {
dependent_variable: "price",
},
},
});
console.log(response);
コンソール
POST _ml/data_frame/analytics/_explain
{
"source": {
"index": "houses_sold_last_10_yrs"
},
"analysis": {
"regression": {
"dependent_variable": "price"
}
}
}
コンソール-結果
{
"field_selection": [
{
"field": "number_of_bedrooms",
"mappings_types": ["integer"],
"is_included": true,
"is_required": false,
"feature_type": "numerical"
},
{
"field": "postcode",
"mappings_types": ["text"],
"is_included": false,
"is_required": false,
"reason": "[postcode.keyword] is preferred because it is aggregatable"
},
{
"field": "postcode.keyword",
"mappings_types": ["keyword"],
"is_included": true,
"is_required": false,
"feature_type": "categorical"
},
{
"field": "price",
"mappings_types": ["float"],
"is_included": true,
"is_required": true,
"feature_type": "numerical"
}
],
"memory_estimation": {
"expected_memory_without_disk": "128MB",
"expected_memory_with_disk": "32MB"
}
}