Блокировать индексирование определенных html-элементов поисковыми системами


В целях стилизации я хочу вставить на страницу фиктивный текст, но он не должен быть связан с реальным содержанием. Есть ли способ заблокировать его для поисковых систем, или я должен использовать старые добрые изображения для этого?

Или можно было бы загрузить его динамически через javascript? потому что я слышал, что google будет читать определенное количество javascript.

4 2

4 ответа:

Я был бы крайне осторожен с любым трюком, который вы решите. Скорее всего, google подумает, что вы пытаетесь показать пользователю другой контент, чем ему.

Я всегда считал, что Google действительно работает, отрисовывая страницу (возможно, используя какую-то серверную версию движка рендеринга Chrome), а затем считывает результат с помощью программного обеспечения OCR, чтобы подтвердить, что текст в исходном коде соответствует тому, что пользователь увидит с включенными JS и фреймами. Google всегда так делал открыто предупредив веб-мастеров, чтобы они не пытались подавать роботам различный контент для пользователей, OCR был бы идеальным способом выяснить это (особенно если ваш "верификатор" использовал строку пользовательского агента IE и обходил IP-диапазоны, не зарегистрированные Google).

Короткий ответ тогда, служить украшением либо:

  • iframe
  • Объект
  • изображение SVG

Поскольку вы четко связываете документ с вашей страницей, google, вероятно, будет рассматривать его как отдельный ресурс и оценивайте вещи соответственно, особенно если один и тот же текст появляется на каждой странице. Что приводит меня к следующему:

Собираетесь ли вы использовать один и тот же текстовый декор на всех/большинстве страниц? Если это так, Google почти наверняка будет относиться к нему как к "витрине" и игнорировать его (очевидно, он делает это с меню и т. д.).

Можете ли вы показать содержимое в iframe без границ и заблокировать src iframe (полностью отдельную "страницу") от поисковых систем?

В качестве альтернативы добавьте содержимое с помощью javascript, сохранив javascript в a .файл js, который вы блокируете от двигателей?

Если вы загружаете этот текст через AJAX, он, вероятно, не будет индексирован - последний раз, когда я проверял, GoogleBot фактически не выполняет JS (как и другие пауки (но некоторые спам-боты, по-видимому, могут и делают)).

Предостережение: ответ AJAX, вероятно, должен содержать заголовок X-Robots-Tag: noindex, если его URL-адрес действительно где-то связан.

Я бы предположил, что загрузка содержимого после завершения загрузки страницы (когда документ.готовые пожары событий, например) было бы довольно безопасным способом сделать то, о чем вы говорите. Хотя я не уверен в этом на 100%.