corpus

Я работал с NTLK Python для общего анализа языка, и недавно я хотел бы создать корпус специально для переводов. Я не смог понять корпусные варианты и структуры, используемые NTLK для переводов. Есть много материала о том, как читать или использовать ресурсы корпуса, но я не могу найти ничего подробно о соз...

Мой вопрос довольно тесно связан с Этим, но я решил открыть другой поток вопросов. Я надеюсь, что это нормально. Я также создаю спам-фильтр, используя NLTK в Python, но я только начал. Интересно, какой корпус спама я могу использовать и как его импортировать? Я не нашел никаких "встроенных в nltk" корпусо...

Может ли кто-нибудь сказать мне разницу между корпусами ,корпус и лексикон в NLTK ? Что такое набор данных фильма ? Что такое Wordnet ?...

Я считал, что часто ответ на мой титул-это пойти и прочитать документы, но я пробежал через nltk book но это не дает ответа. Я вроде как новичок в python. у меня есть куча .txt файлы и я хочу иметь возможность использовать функции корпуса, которые NLTK предоставляет для корпуса nltk_data. Я пробовал Plaint...