Дублировать теги заголовков и метаописания после удаления расширения .html из файлов

Google Webmaster Tools /Search Console дает мне ошибки в отношении повторяющихся тегов заголовков и метаописания.

Этот веб-сайт является статическим HTML-сайтом. Все документы имеют расширение .html. Чтобы удалить .html из всех документов, я использую следующий код в файле .htaccess :

RewriteCond %{REQUEST_FILENAME} !-f
RewriteRule ^([^\.]+)$ $1.html [NC,L]

Итак, например http://example.com/about.html становится http://example.com/about Теперь Google думает, что есть две отдельные страницы -  хотя это только один. Может кто-нибудь объяснить мне, как это решить?

5 голосов | спросил Alex 14 Mayam17 2017, 09:52:23

2 ответа


2

Если ваши URL-адреса .html уже были проиндексированы в то время, когда вы изменили свои URL-адреса (и удалили .html), тогда единственный способ сохранить ваш SEO и избежать дублирования контента с самого начала - реализовать 301 переадресацию из .html на ваш желаемый URL.

(Предполагается, что вы изменили все URL-адреса в своем приложении на нужные «без расширения» URL-адреса.)

Что-то вроде следующего вверху вашего файла .htaccess:

RewriteCond %{ENV:REDIRECT_STATUS} ^$
RewriteRule (.+)\.html$ /$1 [R=301,L]

Проверка на REDIRECT_STATUS заключается в том, чтобы избежать цикла перенаправления, гарантируя перезаписанный запрос (в .html) не перенаправляется (при вызове внутренней перезаписи REDIRECT_STATUS) установлено значение 200)


  

Чтобы удалить код .html из всех документов, я использую следующий код в .htaccess файл

Кроме того: Я думаю, это, вероятно, именно то, как вы его описываете, но это не то, что делает этот фрагмент кода. Вы «удалите ---- +: = 10 =: + ----" из URL, физически изменив URL-адреса в своем приложении (не с помощью .html). Затем вы используете .htaccess для внутренне переписывать URL-адрес обратно на фактический путь к файловой системе (с помощью .htaccess) - и это делает ваш фрагмент кода. Он повторно добавляет расширение .html, он не удаляет его.

ответил MrWhite 15 Mayam17 2017, 00:43:51
5

Давайте назначим www.example.com/about - ваш основной URL и этот URL, который вы хотите индексировать в Google.

И www.example.com/about.html - Является вашим дублирующим URL-адресом и что вы не хотите индексировать его в Google.

Итак, существует два идеальных решения. Вы можете использовать любой или оба.

1) Использовать 301 перенаправление с example.com/about.html на example.com/около , Поэтому Google будет индексировать только конечную или перенаправленную версию URL.

2) Использовать канонический тег ссылки в разделе главы.

Ваши страницы дублируются, поэтому ваш канонический тег ссылки будет таким же на всех этих страницах.

www.example.com/about/
www.example.com/about
www.example.com/about.html
www.example.com/about/index.html

Поэтому, когда вы помещаете ниже канонического тега ссылки, все вышеперечисленные страницы будут вставлять те же теги канонической ссылки, как и заголовок /описание веб-страницы одинаково для всех URL

<link rel="canonical" href="https://www.example.com/about" />

Итак, здесь Google будет индексировать только те канонические ссылки, другие страницы будут рассматриваться как дубликаты, а Google не будет индексировать его.

ответил Goyllo 14 Mayam17 2017, 10:13:11

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132