文字フィルターのリファレンス

文字フィルターは、トークナイザーに渡される前に文字のストリームを前処理するために使用されます。

文字フィルターは、元のテキストを文字のストリームとして受け取り、文字を追加、削除、または変更することによってストリームを変換できます。たとえば、文字フィルターはヒンドゥー・アラビア数字(٠‎١٢٣٤٥٦٧٨‎٩‎)をアラビア・ラテン数字(0123456789)に変換したり、ストリームからHTML要素のような<b>を削除したりするために使用できます。

Elasticsearchには、カスタムアナライザーを構築するために使用できるいくつかの組み込みの文字フィルターがあります。