Блокировать индексирование определенных html-элементов поисковыми системами
В целях стилизации я хочу вставить на страницу фиктивный текст, но он не должен быть связан с реальным содержанием. Есть ли способ заблокировать его для поисковых систем, или я должен использовать старые добрые изображения для этого?
Или можно было бы загрузить его динамически через javascript? потому что я слышал, что google будет читать определенное количество javascript.
4 ответа:
Я был бы крайне осторожен с любым трюком, который вы решите. Скорее всего, google подумает, что вы пытаетесь показать пользователю другой контент, чем ему.
Я всегда считал, что Google действительно работает, отрисовывая страницу (возможно, используя какую-то серверную версию движка рендеринга Chrome), а затем считывает результат с помощью программного обеспечения OCR, чтобы подтвердить, что текст в исходном коде соответствует тому, что пользователь увидит с включенными JS и фреймами. Google всегда так делал открыто предупредив веб-мастеров, чтобы они не пытались подавать роботам различный контент для пользователей, OCR был бы идеальным способом выяснить это (особенно если ваш "верификатор" использовал строку пользовательского агента IE и обходил IP-диапазоны, не зарегистрированные Google).Короткий ответ тогда, служить украшением либо:
- iframe
- Объект
- изображение SVG
Поскольку вы четко связываете документ с вашей страницей, google, вероятно, будет рассматривать его как отдельный ресурс и оценивайте вещи соответственно, особенно если один и тот же текст появляется на каждой странице. Что приводит меня к следующему:
Собираетесь ли вы использовать один и тот же текстовый декор на всех/большинстве страниц? Если это так, Google почти наверняка будет относиться к нему как к "витрине" и игнорировать его (очевидно, он делает это с меню и т. д.).
Можете ли вы показать содержимое в iframe без границ и заблокировать src iframe (полностью отдельную "страницу") от поисковых систем?
В качестве альтернативы добавьте содержимое с помощью javascript, сохранив javascript в a .файл js, который вы блокируете от двигателей?
Если вы загружаете этот текст через AJAX, он, вероятно, не будет индексирован - последний раз, когда я проверял, GoogleBot фактически не выполняет JS (как и другие пауки (но некоторые спам-боты, по-видимому, могут и делают)).
Предостережение: ответ AJAX, вероятно, должен содержать заголовок
X-Robots-Tag: noindex
, если его URL-адрес действительно где-то связан.