Google Site Search (коммерческий) не индексирует файлы в файле Sitemap

У меня есть клиент, для которого мы купили Google Site Search. Он хорошо работает для страниц HTML, обслуживаемых CMS, но файлы не надежно индексируются.

Я написал сценарий для создания XML-канала (sitemap) всех файлов в CMS, которые я подключил к Инструментам Google для веб-мастеров для сайта. В нем говорится, что для этого URL-адреса сайта 923 были отправлены, но только 26 были проиндексированы.

Клиент опирается в основном на поиск в файлах, поэтому мы решили использовать поиск Google, поэтому это немного проблема.

Многие из файлов не связаны с какой-либо страницей на сайте, поскольку они старые и, следовательно, не заслуживают наличия собственной страницы. Но они все равно должны быть доступны с помощью поиска в целях архивирования.

XML-файл архива файлов можно найти по адресу www.sniffer.org.uk/file-archive, а стандартную XML-карту сайта (страниц) можно найти по адресу: www.sniffer.org.uk/sitemap.xml.

2 голоса | спросил melat0nin 7 FebruaryEurope/MoscowbThu, 07 Feb 2013 19:09:18 +0400000000pmThu, 07 Feb 2013 19:09:18 +040013 2013, 19:09:18

1 ответ


1

Я не вижу большой проблемы с индексацией.

Если я ищу в google для сайта: www.sniffer.org.uk, он показывает 2640 индексированных страниц и документов. Есть много документов PDF и RTF, индексированных при щелчке по страницам результатов поиска.

Я обнаружил, что проверил около пяти файлов из файла sitemap.xml и десяти файлов из файлового архива. Во всех случаях я открыл документ или страницу, скопировал предложение из него. Поместите его в кавычки и выполните поиск в Google. Вот пример, который я попробовал из файлового архива: https : //www.google.com/search д =% 22redeveloped + корпус + требует + 22% модифицированную

Одна проблема, с которой я столкнулся, - это страница в файле sitemap.xml, которая составляет 404 на веб-сайте: http://www.sniffer.org.uk/?cID=253

Когда я сделал этот поиск: https://www.google.com/search?q=%22which+soil+issues+are+addressed+in+other+countries%22 Google, похоже, индексирует только копию документа на другой сайт. Он не вернул http://www.sniffer.org. ик /файлов /5713/4183/7996 /UKLQ01.pdf

ответил Stephen Ostermiller 7 FebruaryEurope/MoscowbThu, 07 Feb 2013 19:34:32 +0400000000pmThu, 07 Feb 2013 19:34:32 +040013 2013, 19:34:32

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132