stemming

Я ищу библиотеку Java для извлечения ключевых слов из блока текста. Процесс должен быть следующим: Stop word cleaning - > stemming - > поиск ключевых слов на основе статистической информации английской лингвистики-означает, что если слово появляется в тексте больше раз, чем в английском языке с точки...

Я хотел бы установить язык stemming для каждого пользователя в Django Haystack с ElasticSearch в качестве бэкенда. В нашей модели Django у нас есть объекты изображений, которые содержат разделенный запятыми тег charfield для английского, испанского, немецкого языков...: tags_en, tags_es, tags_de и т. д. Ис...

обработка естественного языка (НЛП), особенно для английского языка, превратилась в стадию, когда стемминг стал бы архаичной технологией, если бы существовали "совершенные" лемматизаторы. Это потому, что стеммеры изменяют поверхностную форму слова/токена в некоторые бессмысленные стебли. модули [in]: hav...