загрузите веб-страницу и зависимости, включая изображения css [закрыто]


часто мне нужно загрузить веб-страницу, а затем отредактировать ее в автономном режиме. Я попробовал несколько инструментов, и основная функция, которой им не хватает, - это загрузка изображений, на которые ссылаются файлы CSS.

есть ли инструмент (для Linux), который будет загружать все, чтобы веб-страница отображала то же самое в автономном режиме (за исключением AJAX)?

7 62

7 ответов:

wget --page-requisites http://example.com/your/page.html

такой вариант вызывает wget для загрузки всех файлов, которые необходимы для правильного отображения данной html-страницы. Это включает в себя такие вещи, как встроенные изображения, звуки и ссылочные таблицы стилей.

EDIT: meder прав: stock wget не анализирует и не загружает css-изображения. Однако существует патч, который добавляет эту функцию: [1,2]

обновление: патч, упомянутый выше был объединен в wget 1.12, выпущен 22-Sep-2009:

** Added support for CSS. This includes:
 - Parsing links from CSS files, and from CSS content found in HTML
   style tags and attributes.
 - Supporting conversion of links found within CSS content, when
   --convert-links is specified.
 - Ensuring that CSS files end in the ".css" filename extension,
   when --convert-links is specified.

Это можно сделать через Firefox, смотрите эту форму

  1. щелкните правой кнопкой мыши
  2. просмотр информации о странице
  3. выберите вкладку медиа
  4. выделить все файлы
  5. Сохранить как

Ссылка -http://www.webdeveloper.com/forum/showthread.php?t=212610

wget-отличный выбор для вас. Просто для получения дополнительной информации, версия wget на windows в настоящее время нет официального релиза на gnu для wget версии 1.12. Текущая версия 1.11

wget версии 1.11 не удается загрузить изображения / шрифты в файлы css. К счастью, вы можете найти сборки 1.14 с этой страницы. Он исправил эти проблемы.

http://opensourcepack.blogspot.com/2010/05/wget-112-for-windows.html

Я столкнулся с той же проблемой на днях, работая на клиента. Еще один инструмент, который работает очень хорошо это HTTrack. Программное обеспечение доступно в версии командной строки для Windows и Linux. Для Linux они готовые пакеты для большинства из наиболее распространенных операционных систем здесь

для моих целей он работал лучше, чем wget с некоторыми из добавленных функций/коммутаторов, которые исправляют ссылки внутри html-файла.

текущей версии оперы (12) позволяет сохранить страницу как HTML с изображениями.

таким образом, Opera также загружает изображения, на которые ссылаются в файлах CSS, и соответствующим образом адаптирует URL-адреса изображений в CSS.

В Firefox:

File - > Save Page As->Web Page, Complete

сохраняет все javascript и изображения и css. Больше ничего не требуется :)

wget