загрузите веб-страницу и зависимости, включая изображения css [закрыто]
часто мне нужно загрузить веб-страницу, а затем отредактировать ее в автономном режиме. Я попробовал несколько инструментов, и основная функция, которой им не хватает, - это загрузка изображений, на которые ссылаются файлы CSS.
есть ли инструмент (для Linux), который будет загружать все, чтобы веб-страница отображала то же самое в автономном режиме (за исключением AJAX)?
7 ответов:
wget --page-requisites http://example.com/your/page.html
такой вариант вызывает wget для загрузки всех файлов, которые необходимы для правильного отображения данной html-страницы. Это включает в себя такие вещи, как встроенные изображения, звуки и ссылочные таблицы стилей.
EDIT: meder прав: stock wget не анализирует и не загружает css-изображения. Однако существует патч, который добавляет эту функцию: [1,2]обновление: патч, упомянутый выше был объединен в wget 1.12, выпущен 22-Sep-2009:
** Added support for CSS. This includes: - Parsing links from CSS files, and from CSS content found in HTML style tags and attributes. - Supporting conversion of links found within CSS content, when --convert-links is specified. - Ensuring that CSS files end in the ".css" filename extension, when --convert-links is specified.
Это можно сделать через Firefox, смотрите эту форму
- щелкните правой кнопкой мыши
- просмотр информации о странице
- выберите вкладку медиа
- выделить все файлы
- Сохранить как
Ссылка -http://www.webdeveloper.com/forum/showthread.php?t=212610
wget-отличный выбор для вас. Просто для получения дополнительной информации, версия wget на windows в настоящее время нет официального релиза на gnu для wget версии 1.12. Текущая версия 1.11
wget версии 1.11 не удается загрузить изображения / шрифты в файлы css. К счастью, вы можете найти сборки 1.14 с этой страницы. Он исправил эти проблемы.
http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html
Я столкнулся с той же проблемой на днях, работая на клиента. Еще один инструмент, который работает очень хорошо это HTTrack. Программное обеспечение доступно в версии командной строки для Windows и Linux. Для Linux они готовые пакеты для большинства из наиболее распространенных операционных систем здесь
для моих целей он работал лучше, чем wget с некоторыми из добавленных функций/коммутаторов, которые исправляют ссылки внутри html-файла.
текущей версии оперы (12) позволяет сохранить страницу как HTML с изображениями.
таким образом, Opera также загружает изображения, на которые ссылаются в файлах CSS, и соответствующим образом адаптирует URL-адреса изображений в CSS.