Amazon Bedrock推論サービス
## リクエスト
`````PUT /_inference/<task_type>/<inference_id>
パスパラメータ
<inference_id>
- (必須、文字列)推論エンドポイントの一意の識別子。
<task_type>
- (必須、文字列)モデルが実行する推論タスクのタイプ。
利用可能なタスクタイプ:completion
,text_embedding
.
リクエストボディ
service
- (必須、文字列)指定されたタスクタイプに対してサポートされているサービスのタイプ。この場合、
amazonbedrock
。 service_settings
- (必須、オブジェクト)推論モデルをインストールするために使用される設定。
これらの設定はamazonbedrock
サービスに特有です。access_key
- (必須、文字列)Amazon Bedrockを使用し、推論リクエストのためのモデルにアクセスする権限を持つ有効なAWSアクセスキー。
secret_key
- (必須、文字列)
access_key
とペアになっている有効なAWSシークレットキー。アクセスキーとシークレットキーを作成または管理するには、AWSドキュメントのIAMユーザーのアクセスキーの管理を参照してください。
アクセスキーとシークレットキーは、推論モデルの作成時に一度だけ提供する必要があります。推論APIを取得するは、アクセスキーまたはシークレットキーを取得しません。推論モデルを作成した後は、関連付けられたキーのペアを変更することはできません。異なるアクセスキーとシークレットキーのペアを使用したい場合は、推論モデルを削除し、同じ名前と更新されたキーで再作成してください。
provider
- (必須、文字列)デプロイメントのためのモデルプロバイダー。いくつかのプロバイダーは特定のタスクタイプのみをサポートしている場合があります。サポートされているプロバイダーには次のものが含まれます:
amazontitan
-text_embedding
およびcompletion
タスクタイプで利用可能anthropic
-completion
タスクタイプのみで利用可能ai21labs
-completion
タスクタイプのみで利用可能cohere
-text_embedding
およびcompletion
タスクタイプで利用可能meta
-completion
タスクタイプのみで利用可能mistral
-completion
タスクタイプのみで利用可能
model
- (必須、文字列)基盤となるモデルに基づくカスタムモデルのベースモデルIDまたはARN。ベースモデルIDは、Amazon BedrockモデルIDドキュメントで見つけることができます。モデルIDは選択したプロバイダーで利用可能でなければならず、IAMユーザーはモデルにアクセスできる必要があります。
region
- (必須、文字列)モデルまたはARNがデプロイされているリージョン。モデルごとの利用可能なリージョンのリストは、AWSリージョンによるモデルサポートドキュメントで見つけることができます。
rate_limit
- (オプション、オブジェクト)デフォルトでは、
amazonbedrock
サービスは、1分あたりのリクエスト数を240
に設定します。これにより、Amazon Bedrockから返されるレート制限エラーの数を最小限に抑えることができます。これを変更するには、サービス設定内のこのオブジェクトのrequests_per_minute
設定を設定します:
テキスト
"rate_limit": {
"requests_per_minute": <<number_of_requests>>
}
- (オプション、オブジェクト)推論タスクを構成するための設定。これらの設定は、指定した`````<task_type>`````に特有です。
`````task_settings`````は`````completion`````タスクタイプのためのものです
- `````max_new_tokens
- (オプション、整数)生成される出力トークンの最大数を設定します。デフォルトは64です。
temperature
- (オプション、浮動小数点数)結果の明らかな創造性を制御する0.0から1.0の間の数値。温度0.0ではモデルは最も決定論的であり、温度1.0では最もランダムです。
top_p
またはtop_k
が指定されている場合は使用しないでください。 top_p
- (オプション、浮動小数点数)
temperature
の代替。0.0から1.0の範囲の数値で、低確率トークンを排除します。Top-pは、確率の合計が特定の値を超えないトップトークンを選択するために核サンプリングを使用し、多様性と一貫性の両方を確保します。temperature
が指定されている場合は使用しないでください。 top_k
- (オプション、浮動小数点数)
anthropic
、cohere
、mistral
プロバイダーのみで利用可能。temperature
の代替。最も可能性の高いK個の単語にサンプルを制限し、一貫性と変動性のバランスを取ります。temperature
が指定されている場合は使用しないでください。
- .
task_settings
はtext_embedding
タスクタイプのためのものです
詳細text_embedding
タスクタイプにはtask_settings
は利用できません。
Amazon Bedrockサービスの例
以下の例は、amazon_bedrock_embeddings
という推論エンドポイントを作成してtext_embedding
タスクタイプを実行する方法を示しています。
Amazon Bedrockベースモデルからアクセスできるチャット完了および埋め込みモデルを選択してください。
Python
resp = client.inference.put(
task_type="text_embedding",
inference_id="amazon_bedrock_embeddings",
inference_config={
"service": "amazonbedrock",
"service_settings": {
"access_key": "<aws_access_key>",
"secret_key": "<aws_secret_key>",
"region": "us-east-1",
"provider": "amazontitan",
"model": "amazon.titan-embed-text-v2:0"
}
},
)
print(resp)
Js
const response = await client.inference.put({
task_type: "text_embedding",
inference_id: "amazon_bedrock_embeddings",
inference_config: {
service: "amazonbedrock",
service_settings: {
access_key: "<aws_access_key>",
secret_key: "<aws_secret_key>",
region: "us-east-1",
provider: "amazontitan",
model: "amazon.titan-embed-text-v2:0",
},
},
});
console.log(response);
コンソール
PUT _inference/text_embedding/amazon_bedrock_embeddings
{
"service": "amazonbedrock",
"service_settings": {
"access_key": "<aws_access_key>",
"secret_key": "<aws_secret_key>",
"region": "us-east-1",
"provider": "amazontitan",
"model": "amazon.titan-embed-text-v2:0"
}
}
次の例は、amazon_bedrock_completion
という推論エンドポイントを作成してcompletion
タスクタイプを実行する方法を示しています。
Python
resp = client.inference.put(
task_type="completion",
inference_id="amazon_bedrock_completion",
inference_config={
"service": "amazonbedrock",
"service_settings": {
"access_key": "<aws_access_key>",
"secret_key": "<aws_secret_key>",
"region": "us-east-1",
"provider": "amazontitan",
"model": "amazon.titan-text-premier-v1:0"
}
},
)
print(resp)
Js
const response = await client.inference.put({
task_type: "completion",
inference_id: "amazon_bedrock_completion",
inference_config: {
service: "amazonbedrock",
service_settings: {
access_key: "<aws_access_key>",
secret_key: "<aws_secret_key>",
region: "us-east-1",
provider: "amazontitan",
model: "amazon.titan-text-premier-v1:0",
},
},
});
console.log(response);
コンソール
PUT _inference/completion/amazon_bedrock_completion
{
"service": "amazonbedrock",
"service_settings": {
"access_key": "<aws_access_key>",
"secret_key": "<aws_secret_key>",
"region": "us-east-1",
"provider": "amazontitan",
"model": "amazon.titan-text-premier-v1:0"
}
}