Почему поисковые системы не индексируют мой контент?

  

Это общая, сообщество wiki catch-all вопрос и ответная пара, предназначенная для решения любых вопросов   о причинах, по которым сайт или конкретное содержимое сайта не отображаются   в результатах поисковой системы.

     

Если ваш вопрос был закрыт как дубликат этого вопроса, и вы   считают, что представленная здесь информация не обеспечивает достаточного   ответьте, пожалуйста, откройте обсуждение Pro Webmasters Meta .

Мой сайт (или определенные страницы на моем сайте) не отображается в результатах поиска.

Почему мой контент не проиндексирован и что я могу сделать с ним?

26 голосов | спросил 3 revs, 2 users 65%
danlefree
1 Jam1000000amThu, 01 Jan 1970 03:00:00 +030070 1970, 03:00:00

2 ответа


31

Существует ряд причин, по которым ваш контент может не отображаться в поиске однако, важно отметить, что поисковая система index может содержать страницы, которые он не отображает в своем результаты страница .

Как определить, действительно ли ваш контент индексирован

На самом деле может быть сложно определить, индексирован ли ваш контент.

  • Найдите все документы с вашего сайта и посмотрите, сколько из них перечислено.
    • Google: введите site:example.com (где example.com - ваш домен, после двоеточия не должно быть пробелов.)
    • Bing: введите site: example.com
    • Yahoo: введите site: example.com (или используйте расширенную форму поиска)
  • Найдите конкретный документ по уникальному предложению от восьми до двенадцати слов и найдите это предложение в кавычках. Например, чтобы найти этот документ, вы можете выбрать «количество причин, по которым ваш контент может не отображаться в результатах поиска»
  • В дополнение к выше, поиск ключевых слов с помощью inurl: и intitle: вы можете попробовать что-то вроде ключевого слова keyword with another keyword inurl:example.com это приведет к тому, что страницы upi будут проиндексированы только для указанного домена.

    • Войдите в инструменты для веб-мастеров, чтобы просмотреть статистику самой поисковой системы о том, сколько страниц проиндексировано с сайта.
    • Инструменты Google для веб-мастеров - Информация доступна в разделе «Здоровье», «Состояние индекса», , Если вы отправили карты сайта, вы также можете увидеть, сколько документов в каждом файле карты сайта было проиндексировано.
    • Bing Инструменты для веб-мастеров

В некоторых случаях документы могут не индексироваться через один из эти методы, но документы можно найти в индексе, используя другие методы. Например, инструменты для веб-мастеров могут сообщать о том, что несколько документов индексируются, даже если вы можете искать их предложения и находить документы в поисковой системе. В этом случае документы фактически проиндексирован.

Как индексируется контент

Прежде чем индексировать контент поисковых систем, они должны найти его, используя веб-искатель . Вы должны проверить журналы своего веб-сервера, чтобы узнать, поисковые системы (идентифицированные их агентом пользователя - например, Googlebot , Bing /MSNbot ) посещают ваш сайт.

Более крупные поисковые системы, такие как Google и Bing, обычно обходят сайты часто, но сканер может не знать о новом сайте. Ты можешь уведомлять поисковые системы о существовании вашего сайта зарегистрировавшись в качестве своего веб-мастера ( Google Webmaster Инструменты , Bing Webmaster Инструменты ) или, если поиск двигатель не предоставляет этого объекта, предоставляя ссылку на его сканеры (например, Yahoo ).

Как долго ваш сайт /контент был в сети?

Поисковые системы могут индексировать контент очень однако после того, как оно было обнаружено, эти обновления иногда задерживаются. Меньшие поисковые системы также могут быть менее отзывчивыми и требуют недель для индексации новый контент.

Если ваш контент был только в сети в течение нескольких дней и не имеет любые ссылки с других сайтов (или ссылки на них принадлежат сайтам, которые сканеры часто не посещаются), вероятно, он не индексируется. Если ваш сайт не проживает более нескольких месяцев, поисковые системы может не доверять ему достаточно, чтобы индексировать много контента из него.

Выделил ли контент веб-мастер?

Этот шаг особенно важен, если вы берете сайт с кто-то еще, и есть проблема с конкретной страницей или каталогом: проверить robots.txt и META роботы исключения иудалите их, если вы хотите, чтобы сканеры индексировали контент исключая.

Есть ли техническая проблема, препятствующая индексированию вашего контента?

Если у вас есть установленный сайт, но конкретный контент не является индексируется (на веб-сайтах, где контент проживает) инструменты для веб-мастеров, предоставляемые Google и Bing, могут предоставлять полезную диагностическую информацию.

Google Сканирование Ошибки документация содержит обширную информацию об общих проблемах для Интернета которые не позволяют индексировать контент и, если вы используете Инструменты Google для веб-мастеров, вы получите предупреждение, если любой из этих проблемы обнаруживаются на вашем сайте.

Исправить ошибки и неправильные конфигурации как можно быстрее, чтобы обеспечить что весь контент вашего сайта индексируется.

Является ли контент низким качеством?

Поисковые системы не индексируют большинство страниц, которые они сканируют. Они только индексируют контент самого высокого качества. Поисковые системы не будут индексировать контент, если:

  • Это спам, тарабарщина или глупость.
  • Он найден в другом месте. Когда поисковые системы находят дубликат контента, они выбирают только один из дубликатов для индексации. Обычно это оригинал, который имеет большую репутацию и ссылки.
  • Он тонкий. Для этого требуется несколько строк исходного текста. Предпочтительно гораздо больше. Автоматически созданные страницы с небольшим количеством контента, например страница для каждого из ваших пользователей, вряд ли будут проиндексированы.
  • У него недостаточно репутации или ссылок. Страница может быть слишком глубоко погребена на вашем сайте для ранжирования. Любая страница без внешних ссылок и более нескольких кликов на домашней странице вряд ли будет проиндексирована.
ответил Leon Rossouw 4 FebruaryEurope/MoscowbMon, 04 Feb 2013 14:07:16 +0400000000pmMon, 04 Feb 2013 14:07:16 +040013 2013, 14:07:16
0

Если у вас есть файл robots.txt в корневом каталоге, он может сказать Google не индексировать ваш сайт.

Вы проверили это?

Обычно безопасно просто удалять (или переименовывать) эти файлы, поскольку это похоже на то, что вы хотите индексировать.

ВАЖНО: Это может быть нарушитель транзакций, если вы пытаетесь заставить Google Adsense работать на вашем сайте.

Независимо от того, где вы размещаете свой специальный код, если вы не проиндексированы, вам сообщают, что ваш сайт отключен, поэтому они не могут его проверить.

ответил Leon Rossouw 4 FebruaryEurope/MoscowbMon, 04 Feb 2013 14:07:16 +0400000000pmMon, 04 Feb 2013 14:07:16 +040013 2013, 14:07:16

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132