Как конвертировать pdf в doc файл на java


Необходимо преобразовать pdf-файл в doc-файл. Я нашел другой тип примера для создания pdf-файла, но не получил pdf в doc.

2 2

2 ответа:

То, что вы просите, на самом деле очень трудно

Я рекомендую вам начать здесь и искать хорошую библиотеку синтаксического анализа. тогда вы должны были бы записать его .формат doc. Неизбежно будет потеряно много форматирования и дополнительной информации. было бы намного проще вывести в формат docx, но я предполагаю, что это не то, что вы ищете.

Я вижу несколько возможных решений:

  1. Davisor Publishor 6.2 , вероятно, можно использовать, но он коммерческий, и кажется, что генерирует только txt из pdf... просто взгляните

  2. Проанализируйте pdf с помощью iText, а затем генерация doc с помощью Apache POI - еще один способ попробовать (бесплатный ;)

  3. Ищите инструменты командной строки, например конвертировать PDF в DOC и выполнить их из java

В противном случае взгляните на Кона. ответ, есть ссылка на список с библиотеками обработки Java pdf, возможно, какая-то библиотека может сделать это напрямую или может быть использована для разбора pdf (лучше, чем iText), а затем просто использовать Apache POI для генерации doc. Надеюсь, это поможет ;)