Как уведомить Google об истекшем контенте?

Мы запускаем сайт классифицированных объявлений.

Когда пользователи удаляют свои объявления, они хотят, чтобы индексированная страница была удалена мгновенно из Google.

Мы видели 2 дополнительных стратегии:

  • Добавление noarchive (Craigslist - единственный, кто делает это).
  • Добавление удаленных объявлений в карту сайта с датой удаления, используемой как <lastmod>.

У нас есть приличное количество страниц, которые сканируются /индексируются Google (+ 15'000'000). Поэтому важно, чтобы добавленные и удаленные объявления обрабатывались в приоритетном порядке и оперативно. Модифицированные объявления или страницы категорий могут быть обработаны следующим образом.

Как мы можем это сделать?

1 голос | спросил Toto 12 MarpmWed, 12 Mar 2014 19:52:53 +04002014-03-12T19:52:53+04:0007 2014, 19:52:53

1 ответ


2

Я собираюсь предположить, что в какой-то момент есть одна страница на объявление и что есть страницы, которые классифицируют и публикуют объявления.

С этим сделайте то, что я делаю, очистите страницу-сортировку. Когда объявление будет удалено, сделайте страницу, обращенную к публике, что-то очевидное; «продано», «объявление удалено» и т. д., но вы также можете сделать его полезной целевой страницей. Например, больше велосипедов для продажи и перечислите несколько. Оттуда вы можете обновить страницу с помощью механизма, который предупреждает Google о том, чтобы не индексировать страницу, такую ​​как <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> В противном случае удалите страницу и скажите Google, что страница ушла с ошибкой 404 или 410 (предпочтительная). Конечно, вы можете сделать то и другое, сначала воспользоваться первым вариантом для захвата и спасения ценного трафика, а затем удалить страницу через короткий период.

Noarchive - это не то же самое, что noindex. Это просто означает, что не нужно создавать архивную копию. С noarchive Google все равно будет индексировать страницу, но с помощью noindex Google не только не индексирует страницу, но также удалит страницу, если она существует, а также не будет архивировать страницу.

Использование указывает, что страница была изменена. Было бы предположение, что страница все еще существует, если вы измените эту дату. Но если вы пытаетесь указать, что страница удалена, к сожалению, файлы Sitemap не имеют для этого механизма. Лучшее, что вы можете сделать, это просто удалить страницу с карты сайта. Однако это должен быть очень простой механизм для создания.

Кроме этого, нечего делать, кроме как ждать. Google использует механизм TTL (время для жизни), чтобы знать, как часто можно посещать страницу или сайт. Если ваш сайт часто изменяется, тогда TTL мал, что, вероятно, Google быстро найдет изменения и быстро обновит индекс. Вы не можете заставить Google прийти к Мухаммеду.

ответил closetnoc 12 MarpmWed, 12 Mar 2014 21:03:20 +04002014-03-12T21:03:20+04:0009 2014, 21:03:20

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132