Разделение файла Sitemap по типу содержимого

В настоящее время мне поручено отправлять каждую неделю Sitemap для сайта в поисковые системы.

У нас есть модуль, который предлагает создание Sitemap, но мы находим, что его использование не очень хорошо работает, поскольку не все страницы включены, и он не разбивает карту сайта по контенту.

Я использовал различные (онлайн и офлайн) инструменты для создания файлов Sitemap, которые не являются проблемой. Проблема в том, что после каждого поколения (которое занимает большую часть каждого понедельника) мне приходится вручную просматривать карту сайта и классифицировать ссылки на продукты, страницы, категории и подкатегории.

Я успешно экспериментировал с XSL, чтобы разбить файл Sitemap, но он по-прежнему является трудоемким процессом.

Кто-нибудь знает о хорошем методе разделения карты сайта?

В настоящее время существует около 20 000 ссылок (iirc).

1 голос | спросил James 6 Jpm1000000pmMon, 06 Jan 2014 18:03:11 +040014 2014, 18:03:11

2 ответа


1

Нельзя выпускать готовые продукты, которые будут делать то, что вы хотите. Вы можете написать сценарий, чтобы сделать это. Это не было бы слишком сложно на языке Perl или Python.

Если вы указали файлы Sitemap в одной строке, это было бы намного проще. Вам нужно будет подключить XML-синтаксический анализатор вместо простого чтения файла по строкам.

Как только вы можете прочитать файл в строке в сценарии, вы поместите их в разные ковши, используя те же критерии, которые вы используете для этого вручную.

ответил Stephen Ostermiller 10 Jpm1000000pmFri, 10 Jan 2014 15:48:00 +040014 2014, 15:48:00
1

Я не могу думать ни о чем, что используется карта сайта, для чего требуется разделение контента по типу контента. Можете ли вы вникнуть в это немного и дать нам более подробную картину того, что создается, как оно используется и почему оно хотело бы быть отредактированным?

Большое беспокойство - это страницы, которые не создаются - это контент, который Google и другие поисковые системы не видят (или видят только в том случае, если они следуют ссылкам со страниц на карте сайта). Это было бы там, где я бы потратил время прежде всего.

В связи с этим существует вероятность того, что вы также используете вариант своей карты сайта, чтобы помочь людям находить вещи на вашем сайте. Это обычно не полезно с сайтом размером с ваш, что поднимет вопрос о том, как люди перемещаются, что они ищут, как вы передаете «запах информации» и т. Д.

Мы часто думаем о веб-сайтах как о местах, где люди приземляются на домашней странице, а затем бродят. В действительности, они приземляются на странице, которую предлагала поисковая система или ссылка, отвечали на вопрос или отвечали потребностям, а затем делали небольшое исследование (или, чаще всего, переход на другой сайт). Таким образом, я также поднимаю возможность того, что есть проблема с архитектурой и /или SEO, но это отвлекает нас от вопроса, как его просили, и анализирует информацию о том, как люди используют сайт, а затем используя эту как руководство для дальнейшего развития.

Короче - карта сайта - это ярлык, разработанный, чтобы помочь поисковым системам найти ваш контент. Вам нужно лучше понять, почему вы не получаете список всего сайта, и что вы надеетесь достичь, отредактировав его.

ответил Ari Davidow 8 PM00000090000004531 2014, 21:59:45

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132