Как конвертировать pdf в doc файл на java
Необходимо преобразовать pdf-файл в doc-файл. Я нашел другой тип примера для создания pdf-файла, но не получил pdf в doc.
2 ответа:
То, что вы просите, на самом деле очень трудно
Я рекомендую вам начать здесь и искать хорошую библиотеку синтаксического анализа. тогда вы должны были бы записать его .формат doc. Неизбежно будет потеряно много форматирования и дополнительной информации. было бы намного проще вывести в формат docx, но я предполагаю, что это не то, что вы ищете.
Я вижу несколько возможных решений:
Davisor Publishor 6.2 , вероятно, можно использовать, но он коммерческий, и кажется, что генерирует только txt из pdf... просто взгляните
Проанализируйте pdf с помощью iText, а затем генерация doc с помощью Apache POI - еще один способ попробовать (бесплатный ;)
Ищите инструменты командной строки, например конвертировать PDF в DOC и выполнить их из java
В противном случае взгляните на Кона. ответ, есть ссылка на список с библиотеками обработки Java pdf, возможно, какая-то библиотека может сделать это напрямую или может быть использована для разбора pdf (лучше, чем iText), а затем просто использовать Apache POI для генерации doc. Надеюсь, это поможет ;)