Многоязычный стемминг в стоге сена с ElasticSearch


Я хотел бы установить язык stemming для каждого пользователя в Django Haystack с ElasticSearch в качестве бэкенда.

В нашей модели Django у нас есть объекты изображений, которые содержат разделенный запятыми тег charfield для английского, испанского, немецкого языков...: tags_en, tags_es, tags_de и т. д.

Испанские пользователи должны искать только в тегах tags_es, а запросы должны строиться также на испанском языке.

Я не смог найти ничего о такой функции, и я не возражаю против закалки внутри Haystack's Elasticsearch в бэкэнде. Вы можете указать мне правильное направление? Если есть решение для стога сена с Солром, это тоже нормально.

1 4

1 ответ:

Для тех, кто сталкивается с той же проблемой: вот учебник о том, как сделать мультиязыковой стемминг с Django/Haystack и ElasticSearch:

Растягивающая задняя часть ElasticSearch стога сена

Вот еще один учебник, показывающий аналогичную реализацию на основе Solr:

Многоязычный поиск в Django с Haystack