Как браузеры загружают веб-страницы и обрабатывают их HTML-разметку?

как браузеры загружают веб-страницы и обрабатывают их html-разметку?

Структура глобальной сети

Глобальная сеть состоит из множества устройств. Их взаимодействие друг с другом решает различные задачи: загрузка веб-страниц с HTML-разметкой, передача видео, обмен короткими сообщениями и т.д. Они могут использовать устоявшиеся протоколы[1] связи или реализовывать собственные.

Схема принципа взаимодействия устройств в глобальной сети
Рис 1. Абстрактное представление связей устройств (паутина).

Например, программа Skype имеет собственный механизм передачи сообщений по сети. Он настолько сложный и секретный, что сообщение невозможно подделать с помощью сторонней программы.

Устройства, работающие в сети, делятся на два типа. Они могут быть серверами[2] или клиентами[3]. Если рассматривать клиент-серверное взаимодействие относительно работы с веб-страницами, то ваш компьютер с установленным на нем браузером является клиентом. Он запрашивает страницы из сети. Эти запросы обрабатывают сервера. В простом определении сервер - это компьютер, в котором хранятся HTML-файлы различных сайтов. Ответ на запрос клиента он может осуществить за счет специальной программы «веб-сервер».

Заметка
Не путайте два этих понятия. Сервер — это компьютер, а Веб-сервер — программа, отвечающая на запросы клиентов по протоколу HTTP.

Основным протоколом, используемым для работы с веб-страницами, является HyperText Transfer Protocol (рус. протокол передачи гипертекста, сокр. HTTP). Он описывает четкий регламент передачи HTML-разметки по сети, как должен быть сформирован запрос на загрузку страницы, как происходит процесс её передачи и какие статусы должен отдавать сервер.

Принцип работы браузера

Браузер — это клиентская программа, позволяющая в простой форме посылать запросы серверам на загрузку веб-страниц. В задачи браузера помимо простейших операций по связи с серверами входит: обработка полученной HTML-разметки, интерпретация стилей и скриптов, контроль ошибок и по возможности их исправление, хранение пользовательской информации. Браузеры, представленные различными компаниями, могут по-разному реализовывать эти механизмы или игнорировать какие-либо из них. Такие возможности, объединенные в виде программы, называется браузерным движком[4].

Ниже мы приводим упрощенную схему этапов загрузки веб-страницы браузером. Из неё намеренно удалены такие сложные моменты как: работа с DNS, формирование HTTP-заголовков и др. Вам, как начинающим изучать WEB и работу с HTML, не нужно углубляться в такие подробности.

Схема этапов загрузки и обработки браузером HTML страницы
Рис 2. Упрощенная схема рабочего процесса браузера.

Этапы рабочего процесса браузера:

  1. При вводе имени сайта в адресной строке, клике по ссылке в поисковой системе или на любом сайте, браузер посылает запрос серверу на загрузку определенной страницы.
  2. Сервер получает запрос и проверяет, есть ли такая страница.
  3. Сервер осуществляет передачу HTML-разметки страницы браузеру.
  4. Браузер обрабатывает разметку и выводит результат пользователю.

Термины, использованные в статье

  1. Протоколы передачи данных — набор соглашений, которые позволяют единообразным способом передавать сообщения между программами
  2. Сервер — специальный компьютер, основная задача которого – выполнение сервисного программного обеспечения.
  3. Клиент — компьютер, выполняющий роль потребителя ресурсов сервера. Он может делегировать выполнение задач серверу и использовать готовый результат.
  4. Браузерный движок — совокупность программных механизмов, реализованных производителем браузера. Эти механизмы нацелены на преобразование HTML-разметки, стилей и скриптов в интерактивное представление, с которым взаимодействует пользователь.

Последние публикации