Как удалить данные / модели из nltk dowloader?


Я установил некоторые nltk-пакеты в python3 NLTK (через nltk.download()), попробовал их и-не нуждаясь в них - хочу удалить их сейчас.

Как я могу удалить, например, пакет large_grammars из моей nltk-установки? (Я не хочу удалять полную NLTK-установку!)

1 2

1 ответ:

По умолчанию пакеты NLTK / data сохраняются в каталоге nltk_data.

Во-первых, вы должны найти, где может находиться каталог:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

Проверьте точное местоположение nltk_data:

>>> import os
>>> next(p for p in nltk.data.path if os.path.exists(p))
'/home/alvas/nltk_data'

В linux просто перейдите в каталог командной строки:

$ cd /home/alvas/nltk_data/
$ ls
corpora  grammars  tokenizers
$ cd grammars/
$ ls
large_grammars  large_grammars.zip
$ rm -rf large_grammars 
$ rm large_grammars.zip