Чтение содержимого pdf с помощью vim [закрыто]


Как мы можем прочитать содержимое pdf-файла, используя команду vim в терминале? Я пробовал использовать pdftk, распаковывая его, но все равно он не работает для меня. Есть ли какой-либо другой способ расшифровать или декодировать pdf, чтобы мы могли читать терминал в любом вкусе Linux, используя vim.

3 3

3 ответа:

Если вы хотите прочитать pdf как текст, вы можете попробовать команду pdftotext, хотя это не всегда будет красиво. Если вы хотите, чтобы vim открывал pdf-файлы в PDF-ридере, вы можете использовать что-то в своем .vimrc like

au BufRead *.pdf sil exe "!xdg-open " . shellescape(expand("%:p")) | bd | let &ft=&ft | redraw!

Этот вопрос является более или менее дубликатом этого.
Однако, следуя ответам @Conner и @Eric, утилита pdftotext является рекомендуемым подходом, если Вы только заинтересованы в содержании текста.

Возможный подход к pdftotext можно найти, например, здесь .
Существует также довольно новый Vim плагин для упрощения этих шагов. Этот плагин можно найти здесь или здесь

Вы также можете написать некоторые ftplugin выполнение функций препроцессора для извлечения текста из заданного pdf-файла. Тем не менее, вы не сможете ничего изменить в pdf с помощью предлагаемых инструментов.

Некоторые текстовые файлы pdf могут быть извлечены с помощью pdf2txt, а затем переданы в vim. Конечно, вы потеряете большую часть форматирования, графики и т. д.