推論API

この機能は技術プレビュー中であり、将来のリリースで変更または削除される可能性があります。Elasticは問題を修正するために取り組みますが、技術プレビューの機能は公式GA機能のサポートSLAの対象ではありません。

推論APIを使用すると、組み込みの機械学習モデル(ELSER、E5)、Elandを通じてアップロードされたモデル、Cohere、OpenAI、Azure、Google AI Studio、またはHugging Faceなどの特定のサービスを利用できます。組み込みモデルおよびElandを通じてアップロードされたモデルについては、推論APIはトレーニングされたモデルを使用および管理するための代替手段を提供します。ただし、これらのモデルを使用するために推論APIを使用する予定がない場合や、非NLPモデルを使用したい場合は、機械学習トレーニングモデルAPIを使用してください。

推論APIを使用すると、推論エンドポイントを作成し、Amazon Bedrock、Anthropic、Azure AI Studio、Cohere、Google AI、Mistral、OpenAI、またはHuggingFaceなどの異なるプロバイダーの機械学習モデルをサービスとして利用できます。推論モデルを管理し、推論を実行するには、次のAPIを使用します:

図13. Elastic推論のランドスケープの表現

推論エンドポイントを使用すると、手動デプロイメントなしで対応する機械学習モデルを使用し、セマンティックテキストを通じてデータの取り込み時に適用できます。

プロバイダーからモデルを選択するか、ElasticによってトレーニングされたリトリーバルモデルであるELSERを使用し、次に推論APIの作成を使用して推論エンドポイントを作成します。今、セマンティックテキストを使用してデータに対してセマンティック検索を実行します。