nltk

Я пытаюсь обрабатывать различные тексты регулярными выражениями и NLTK python-который находится в http://www.nltk.org/book - . я пытаюсь создать генератор случайных текстов, и у меня возникли трудности с проблемой. Во-первых, вот мой алгоритм: Введите предложение в качестве входных данных - это называется...

Я наткнулся на эту страницу, где ответчики предположили, что я могу просто использовать nltk на машине, не имея доступа root. Я пытаюсь следовать этому совету, но делаю что-то не так. Я скачал исходник из здесь (файл с именем setuptools-0. 6c11.смола.gz), а затем я извлек его в папку под названием nltk. Т...

Я установил некоторые nltk-пакеты в python3 NLTK (через nltk.download()), попробовал их и-не нуждаясь в них - хочу удалить их сейчас. Как я могу удалить, например, пакет large_grammars из моей nltk-установки? (Я не хочу удалять полную NLTK-установку!) ...

У меня есть следующий код. Я знаю, что могу использовать функцию apply_freq_filter для фильтрации словосочетаний, которые меньше, чем число частот. Однако я не знаю, как получить частоты всех N-граммовых кортежей (в моем случае bi-gram) в документе, прежде чем я решу, какую частоту установить для фильтрации. ...

Я на mac, и я хотел сделать программу, чтобы определить список слов для меня. С этой целью я установил NLTK со следующими инструментами на официальном сайте для компьютеров Mac/Unix. Установка numpy не удалась, не уверен, влияет ли это на что-нибудь. Но в любом случае, отрабатывая некоторый пример кода из з...

Как найти список со всеми возможными тегами pos, используемыми инструментарием Natural Language Toolkit (nltk)?...

Я хочу проверить в программе Python, если слово находится в словаре английского языка. Я считаю, что интерфейс nltk wordnet может быть способом пойти, но я понятия не имею, как использовать его для такой простой задачи. def is_english_word(word): pass # how to I implement is_english_word? is_english_wo...

Мой Код: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') сообщение об ошибке: [ec2-user@ip-172-31-31-31 sentiment]$ python mapper_local_v1.0.py Traceback (most recent call last): File "mapper_local_v1.0.py", line 16, in <module> tokenizer = nltk.data.load('nl...

Я считал, что часто ответ на мой титул-это пойти и прочитать документы, но я пробежал через nltk book но это не дает ответа. Я вроде как новичок в python. у меня есть куча .txt файлы и я хочу иметь возможность использовать функции корпуса, которые NLTK предоставляет для корпуса nltk_data. Я пробовал Plaint...

я последовал за учебник, который был доступен в Часть 1 & Часть 2. К сожалению, у автора не было времени для заключительного раздела, который включал использование косинусного сходства, чтобы фактически найти расстояние между двумя документами. Я следил за примерами в статье с помощью следующей ссылки из ...