fuzzy-search

Я новичок в elasticsearch и искал fuzzy query search. Я сделал новый индекс продуктов с объектами / записями значений, как это { "_index": "products", "_type": "product", "_id": "10", "_score": 1, "_source": { "value": [ ...

У меня есть очень большой список слов (около 200k): ["cat", "the dog", "elephant", "the angry tiger"] Я создал это регулярное выражение с нечеткостью: regex = "(cat){e<3}|(the dog){e<3}|(elephant){e<3}|(the angry tiger){e<3}" У меня есть входные предложения: sentence1 = "The doog is runn...

Когда требуется аппроксимированное сравнение между строками, основное расстояние Левенштейна может помочь. Он измеряет количество модификаций строки, необходимых для того, чтобы равняться другой строке: "aaaa" vs "aaab" => 1 "abba" vs "aabb" => 2 "aaaa" vs "a" => 3 При использовании Dictionar...

Я ищу алгоритм подобия строк, который дает лучшие результаты на строках переменной длины, чем те, которые обычно предлагаются (расстояние Левенштейна, soundex и т. д.). например, заданная строка A: "Robert", затем строка B: "Эми Робертсон" было бы лучше, чем Строка C: "Richard" также, предпочтительно, э...