levenshtein-distance

У меня есть следующая реализация, но я хочу добавить порог, поэтому, если результат будет больше, чем он, просто прекратите вычисления и вернитесь. Как бы я это сделал? EDIT: вот мой текущий код, threshold еще не используется...цель состоит в том, что он используется public static int DamerauLevenshte...

Я использую алгоритм расстояния Левенштейна в C++ для сравнения двух строк, чтобы измерить, насколько они близки друг к другу. Однако простой алгоритм расстояния Левенштейна не различает границы слов, разделенные пробелами. Это приводит к вычислению меньшего расстояния, чем я хочу. Я сравниваю названия, чт...

Недавно мы столкнулись с интересной проблемой на работе, где мы обнаружили дубликаты пользовательских данных, представленных в нашей базе данных. Мы поняли, что расстояние Левенштейна между большинством этих данных было просто разницей между двумя рассматриваемыми строками. Это означает, что если мы просто до...

У меня есть список объектов Tweet (homegrown class), и я хочу удалить его. почти что дубликаты, основанные на их тексте, с использованием расстояния Левенштейна. Я уже удалил идентичные дубликаты, хешируя тексты твитов, но теперь я хочу удалить тексты, которые идентичны, но имеют до 2-3 различных символов . П...

Возможно ли включить расстояние Левенштейна в запрос регулярного выражения? Кроме объединения между перестановками. Например, поиск "hello" с L. d. 1 .ello | h.llo | he.lo | hel.o | hell. Это очень глупо и непригодно для больших чисел Л. д. ...

Я написал программу, которая принимает вопрос от пользователя. Затем он сопоставляет этот вопрос со списком предопределенных вопросов и возвращает ответ. Он должен быть точным и совпадать только с вопросами, которые близки к (нечеткие совпадения) или точно то, что ввел пользователь. Мой SSSCE: Http://ideon...

Возможный дубликат:Как исправить ошибки в этой реализации Дамерау-Левенштейна? У меня есть следующее Цитон код (адаптированный из проекта bpbio ), который выполняет вычисление расстояния редактирования Дамерау-Левенштейна : #---------------------------------------------------------------------------...

После нескольких дней поиска я почти готов отказаться от поиска предварительно скомпилированных двоичных файлов для Python 2.7 (Windows 64-bit) библиотекиPython Levenshtein , поэтому я не пытаюсь скомпилировать ее сам. Я установил самую последнюю версию MinGW32 (версия 0.5-beta-20120426-1) и установил ее в к...

какой алгоритм обычно используется при реализации проверки орфографии, которая сопровождается предложениями word? сначала я подумал, что имеет смысл проверять каждое новое слово, введенное (если оно не найдено в словаре), против него расстояние Левенштейна...

меня интересует алгоритм вычисления расстояния Левенштейна в T-SQL....