Должно ли сетевое оборудование быть настроено на «автосогласование» или фиксированную скорость?

У нас недавно возникла небольшая проблема с сетью, где несколько серверов будут периодически потерять сетевое подключение довольно болезненным способом (требуется жесткая перезагрузка). Это происходит примерно две недели, казалось бы, случайным образом, на разных серверах. Нет конкретной модели, которую мы могли бы различить.

После некоторого углубления в него мы увидели, что коммутатор сообщал о 100 Мбит /с для порта проблем:

Это звучит удивительно, как то, что произошло в статье Джоэла Спольского Five Whys

  Майкл провел какое-то время после вскрытия, и обнаружил, что проблема была простой проблемой конфигурации на коммутаторе. Существует несколько возможных скоростей, которые коммутатор может использовать для связи (10, 100 или 1000 мегабит в секунду). Вы можете установить скорость вручную, или вы можете позволить коммутатору автоматически согласовать максимальную скорость, с которой обе стороны могут работать. Не удалось установить автоматический переключатель. Обычно это работает, но не всегда, а утром 10 января этого не было.

У нас теперь отключено автоматическое согласование на нашем сетевом оборудовании и установите его на фиксированную скорость в 1000 Мбит /с (гигабит).

Мои вопросы для тех, у кого больше опыта работы с оборудованием на сервере:

  1. Насколько распространены проблемы автоматического согласования с современным сетевым оборудованием?
  2. Хорошо ли, стандартная сетевая практика отключает автоматическое согласование и устанавливает фиксированные скорости при настройке сети?
87 голосов | спросил Jeff Atwood 25 Jpm1000000pmMon, 25 Jan 2010 21:57:05 +030010 2010, 21:57:05

17 ответов


101
  1. Мне еще предстоит увидеть проблему с автосогласованием скорости сети, которая не вызвана (а) несоответствием руководства на одном конце ссылки и авто на другом, или (б) (кабель, порт и т. д.).

  2. Это зависит от администратора, но мой опыт показал мне, что если вы вручную укажете скорость связи и настройки дуплекса, то вы будете вынуждены работать с рассогласованием скорости. Зачем? Потому что практически невозможно документировать различные соединения между коммутаторами и серверами, а затем выполнять эту документацию при внесении изменений. Большинство сбоев, которые я видел, связаны с 1 (а), и вы только попадаете в эту ситуацию, когда вручную запускаете настройки скорости /дуплекса.

Как упоминается в документации Cisco :

  

Если вы отключите автосогласование, он скрывает капли ссылок и другие проблемы физического уровня. Отключить автосогласование только конечным устройствам, таким как более старые сетевые карты Gigabit, которые не поддерживают автосогласование Gigabit. Не запрещайте автосогласование между коммутаторами, если это абсолютно необходимо, так как проблемы физического уровня могут оставаться необнаруженными и приводят к перекрытию петель дерева.

Если вы не готовы настроить систему управления изменениями для сетевых изменений, требующих проверки скорости /дуплекса (и не забывайте об управлении потоком), или готовы иметь дело с случайными несоответствиями, которые возникают из-за того, что вручную указаны эти настройки на всех сетевых устройств, затем придерживайтесь конфигурации по умолчанию auto /auto.

В будущем подумайте о мониторинге ошибок на портах коммутатора с помощью MRTG , чтобы вы могли выявить эти проблемы, прежде чем у вас будет проблема.

Изменить: Я вижу, что многие люди ссылаются на ошибки переговоров на старом оборудовании. Да, это была проблема давным-давно, когда стандарты создавались, и не все устройства следовали за ними. Являются ли ваши сетевые адаптеры и коммутаторы менее 10 лет? Если это так, то это не будет проблемой.

ответил Doug Luxem 25 Jpm1000000pmMon, 25 Jan 2010 22:15:06 +030010 2010, 22:15:06
23
  1. Очень часто, с годами у меня было множество проблем с различными типами оборудования.

  2. На мой взгляд, если установка статическая (то есть серверная стойка), и вы не думаете, что будут изменения, это хорошая идея для настройки скоростей и дуплексов вручную. Пока это хорошо документировано, чтобы можно было предотвратить будущие проблемы.

EDIT:

Чтобы уточнить, я не сторонник использования скоростей вручную во всей вашей сети, я бы сказал, что 95% времени авто /авто - это путь. Я просто говорю, что у меня были проблемы с дуплексом /скоростью, и есть небольшие части моей сети (то есть одна из наших серверных стоек), которые имеют в основном ручные настройки. Мы работаем с очень плотно контролируемой ЛВС с отключенными неиспользуемыми портами и MAC-фильтрами на большинстве портов, поэтому отслеживание скорости не очень сложно.

ответил einstiien 25 Jpm1000000pmMon, 25 Jan 2010 22:03:42 +030010 2010, 22:03:42
15

Я считаю, что если автосогласование работало в течение часа в день или в месяц, а затем почему-то «что-то случилось», что установка ссылки на фиксированную скорость «исправляет ее», есть проблема, которая не решается, а обходится вместо этого. Думаю, я вижу, что ссылка привязана к фиксированному как временное решение, пока не будет исправлена ​​реальная проблема.

ответил dimitri.p 25 Jpm1000000pmMon, 25 Jan 2010 22:47:45 +030010 2010, 22:47:45
14

Сеть, за которую я несу ответственность (наряду с несколькими другими ребятами), состоит из ~ 40 серверов, 1000 рабочих станций (распространяется через довольно большой кампус) и ~ 1000 WAP также распространяются по большой площади с различными типов и возрастов сетевого оборудования.

Как сказал dimitri.p, когда что-то внезапно не удается остановить автосогласование, это обычно указывает на другую проблему. Установка порта вручную сродни тому, чтобы наложить бандаж на кого-то, кто был заколот в кишечнике, - это может остановить кровотечение, но там обязательно будет повреждение.

Мой обычный контрольный список:

  • Что-то изменилось на машине? водители? OS или BIOS? Возможно, autoneg был отключен в ОС?
  • Вы поменяли патч-кабели, а проверен прогон кабеля (если это ловушка работает, чем одна стойка?)
  • Вы проверили, не поврежден ли порт коммутатора или нет?
  • Может ли сетевой адаптер плохо работать?

Мы, как правило, never отключили autoneg на серверах (или что-либо еще в центре обработки данных), если это не так, когда все другие возможные причины были устранены, мы переместили порты коммутатора, изменили кабели , протестировал сетевой адаптер и т. д., и другого выбора нет. В этом случае он документируется до смерти. Это происходит очень редко, и обычно с устройствами, которые мы не можем получить, чтобы проверить настройки BIOS и ОС.

С другой стороны, рабочие станции и точки доступа - это совсем другая история. Неисправность autoneg - это классический признак плохого прогона кабеля, и во многих случаях нам приходится вручную устанавливать скорость и дуплекс до тех пор, пока не начнется сезон летних бега-новых кабелей в стене.

ответил Jason Antman 25 Jpm1000000pmMon, 25 Jan 2010 23:08:26 +030010 2010, 23:08:26
14

Итак, шаги устранения неполадок (предположим, что вы остановились после каждого и дождались появления проблемы):

  1. Проверьте журналы на коммутаторе, чтобы узнать, объясняет ли он, почему он использует 100M.
  2. Если вы все еще используете его, отключите эту крайне злую «мерцающую нагрузку на загрузку Windows», которую Джоэл все время толкает - то, как она работает, - это разбить кеш коммутатора, заставляя его обрабатывать каждый пакет. Ваш коммутатор предназначен для пересылки пакетов в аппаратное обеспечение и имеет только центральный процессор, необходимый для определения того, какой физический путь должен пройти неизвестный поток трафика (in -> asic -> out), и запрограммировать аппаратное обеспечение для его выполнения (чтение : калькулятор имеет лучший процессор, чем ваш коммутатор, не делайте глупых вещей, которые делают процессор вашего коммутатора более усердным). Балансировка нагрузки Windows работает, заставляя ваш коммутатор принять это решение и переустановить кэш оборудования для каждого пакета. Это может не решить эту конкретную проблему, но это меня из подкастов меня избило ... извините.
  3. Убедитесь, что конфигурация соответствует с обеих сторон - звучит так, как будто вы сделали это
  4. Google для ошибок autoneg на вашем коммутаторе - если вы не создали его самостоятельно, вы не единственный, кто пытается запустить autoneg на том, что вы используете
  5. Замените кабель с номинальным Cat5e или лучше - в идеале кабель, который вы знаете, работает, например, тот, на который подключена ваша рабочая станция. Не пытайтесь использовать Cat5, или какой-то дерьмо, сделанный кем-то, используйте тот, у которого есть фактические формованные концы из упаковки.
  6. Переместить порт. Поместите сервер на другой порт на том же коммутаторе.
  7. Измените сетевой адаптер - используйте другую партию, заказанную в другое время

На этом этапе вы исключили конфигурацию, к которой подключены физические порты, кабели между ними. Если это еще , некоторые другие причины могут быть:

  1. Прокладка кабелей - будьте осторожны с электромагнитными помехами от ваших силовых кабелей переменного тока, проложите их по разные стороны стойки.
  2. Охлаждение. Убедитесь, что вы находитесь в окружающей среде, это не что-то вроде 90 градусов, и ваши карты NIC не попадают в какой-то «дорогой бог, позвольте мне просто отправить этот пакет». Я слышал, но не видел, что маршрутизаторы Cisco перестают делать быстрые переходы и пересылать пакеты через CPU, когда они перегреваются, например.
  3. Замените коммутатор на что-то, что не сосать - проверьте, сколько полос пропускания вашего хоста говорит в секунду в совокупности, а затем посмотрите на номинальную емкость задней панели вашего коммутатора. 7 хостов из потенциала 48 все передающие 1.0G достаточно, чтобы остановить Cisco 3750, например. Также будьте очень осторожны с дешевыми производителями сети: D-Link, Linksys, Dell, Intel и HP. Никто, занимающийся сетью, серьезно не использует этих ребят, а не потому, что «никто не был уволен за использование Cisco», а потому, что «люди помнят, что Intel переключился с 20/48 портами с ошибкой более 2 лет» или «Я использовал исключительно ProCurve и о том, насколько злой была Cisco, до тех пор, пока я фактически не использовал Cisco, и в этот момент я перестала покупать что-нибудь меньшее ». Cisco считается сетевым поставщиком среднего уровня , так что это говорит о ребятах ниже Cisco ...? : -)

История вопроса /почему мой ответ является самым удивительным: я работаю инженером в области сетей /систем в финансовой индустрии, и вот мой опыт работы с нашей глобальной сетью (15 филиалов, 8 центров обработки данных):

Все наши LAN-порты autoneg, потому что мы контролируем оборудование на обоих концах и имеем какой-то доступ к обеим сторонам - это может быть так же просто, как получить по телефону кому-то и проверить настройки. Через три года у меня только один из наших внутренних портов завершился сбой из-за сбоя autoneg, и это было из-за плохого кабеля --- он ушел после замены кабеля.

У нас было больше проблем, когда предшественники имели жесткие коды 100 /full на своих сетевых адаптерах и не документировали этот факт. Сбросьте все, чтобы авто /авто в следующем окне главного окна и не было никаких проблем сс тех пор.

В парах мест, где у нас есть медная передача от перевозчика для нашей глобальной сети? Вы должны в значительной степени ожидать, что медное WAN /интернет-соединение будет сосать все время - отчасти потому, что вы не знаете, что находится на другой стороне. Какой-то древний переключатель Extreme, который, случается, имеет простую прошивку для autoneg, но выполняет теги MPLS? Какой-то медиаконвертер стоимостью 5 долларов, потому что ваше периферийное устройство вашего интернет-провайдера 200 тыс. Долл. Просто слишком велико, чтобы обеспечить Ethernet по витой паре? Решите заранее, как это будет обрабатываться и придерживаться этого, а затем ожидайте, что какое-нибудь твист внутри перевозчика изменит его в 10 вечера в субботу, потому что согласованная конфигурация никогда не была задокументирована, и у них есть какая-то политика.

Серьезно, тем не менее, получите передачу эф фекта от вашего интернет-провайдера.

ответил James Cape 26 Jpm1000000pmTue, 26 Jan 2010 15:37:16 +030010 2010, 15:37:16
10

Это сетевой миф. Наши сетевые парни клянутся этой глупостью, потому что еще в 1998 году переключатели Bay не будут обсуждать с Cisco или что-то в этом роде. Поэтому вместо использования по умолчанию для 99,999% оборудования на земле у нас есть это смехотворное упражнение по управлению конфигурацией и отличный козлов отпущения для тех случаев, когда обновление драйвера NIC сбрасывает настройки для автоматического согласования и что-то происходит.

Его стало более забавным, потому что многие наши серверы используют сомнительные функции, такие как объединение NIC, что мешает вам потерять доступ к сети в маловероятном случае отказа коммутатора, в то же время подвергая вас гораздо более вероятному сбою программного обеспечения. (Драйверы всегда сосут)

В защиту ребята из сети много разрывов работают с драйверами NIC Windows по умолчанию, которые обычно сосут. Если у вас возникли проблемы с автосогласованием, и ваше снаряжение не отправляется в администрацию Клинтона, обновите эти драйверы NIC.

ответил duffbeer703 26 Jam1000000amTue, 26 Jan 2010 07:16:49 +030010 2010, 07:16:49
10

Вы должны автосогласовать. Если у вас есть переключатель, который не будет автоматически согласовывать, купите лучший коммутатор.

Гигабит предполагается для автоматического согласования и включает обнаружение автоматического кроссирования (MDI-X).

100baseT не работает, если один конец установлен на автоматический, а другой - на ручной, и это соответствует спецификациям. Если вы нажмете один конец на 100 /полный, то другой конец будет автосогласован до 100 /half, что даст вам несоответствие дуплекса.

ответил Alnitak 26 Jpm1000000pmTue, 26 Jan 2010 13:12:21 +030010 2010, 13:12:21
9

Как правило, я устанавливаю серверы на фиксированные, поскольку я видел, что сетевое оборудование ведет переговоры до 10 /половиной вместо 1000 /full.

Также некоторые CoLos установили, что их переключатели не ведут переговоры, но только делают ссылку на 1000 /full.

ответил mrdenny 25 Jpm1000000pmMon, 25 Jan 2010 22:06:31 +030010 2010, 22:06:31
7

Отключение автосогласования в непроверенной начальной конфигурации сродни программированию вуду - вы меняете что-то без уважительной причины. Если после проверки вы видите, что есть ошибка дуплекса или скорости, или имеются чрезмерные ошибки на порту, затем включите другие способы устранения неполадок и, наконец, исправьте конфигурацию, если необходимо.

При обновлении драйвера или замене оборудования нет гарантий, что ваши настройки будут сохранены на стороне сервера.

Установите обе стороны ссылки для согласования или исправьте обе стороны. Когда вы исправляете настройки скорости и дуплекса на некоторых устройствах, они больше не сообщают свои возможности своим сверстникам. Я не знаю, что говорит стандарт Ethernet о том, что делать, когда одна сторона объявляет о возможностях, а другая сторона - нет, и это, вероятно, означает, что многие разработчики тоже не знают. Некоторые из них будут выбирать самый низкий общий знаменатель, который составляет 10-кратный, а другие будут считать, что все в порядке, и выберите самую быструю скорость.

Есть некоторые современные аппаратные средства, которые не поддерживают автоматическое согласование на гигабитных медных Ethernet, например (по крайней мере некоторые) коммутаторы Cisco с медными SFP.

ответил jaredg 25 Jpm1000000pmMon, 25 Jan 2010 23:43:50 +030010 2010, 23:43:50
6

Много лет назад я потратил некоторое время на то, чтобы 3com занимался технической поддержкой почти всех своих сетевых устройств. Удивительно, как часто эта проблема возникала, и это была стандартная процедура, чтобы установить все вручную.

ответил 25 Jpm1000000pmMon, 25 Jan 2010 22:12:13 +030010 2010, 22:12:13
4

У меня было много проблем с автоматическим согласованием. Многие, конечно, означают один раз в несколько месяцев, но в моей книге это слишком большая проблема.

Проблемы с автоматическим согласованием трудно найти, особенно когда люди, занимающиеся сетью, серверами, приложениями и базами данных, представляют собой четыре разные команды. Как правило, последние два будут проводить много времени взад и вперед, обвиняя друг друга в плохом выступлении и лживая о измерениях, а иногда и пинают его людям сервера, которые будут должным образом смотреть на результат «сверху» и говорят, что все отлично с сервером.

Это продолжается до тех пор, пока вопрос не перейдет к точке, где «эксперт» (на самом деле, кто-то, кто является обобщающим и, следовательно, понимает сети, оборудование, операционные системы, базы данных, фреймворки и приложения), находит проблему в течение пяти или десяти минут.

Итак, мое собственное эмпирическое правило, когда у меня есть возможность что-то сделать, заключается в том, чтобы ВСЕГДА устанавливать фиксированные скорости на рабочих серверах, коммутаторах и маршрутизаторах. Непродуктивные серверы, если они разделены настолько, что люди, которые его используют, не имеют права доступа root.

Переключение обработки доступа к настольному компьютеру /ноутбуку можно оставить для автоматического согласования, и есть исключения из этого правила. Просто упомянуть об этом, если в сети происходит много изменений, лучше оставить его на авто и следить за вещами.

Другим моментом, который может быть полезным, любой выбор, который вы делаете в отношении автосогласования , является отслеживать вещь. Просто настройте Nagios или что-то еще, чтобы следить за состоянием любого важного порта. Вы уже отслеживаете это сетевое оборудование, не так ли?

ответил Daniel C. Sobral 25 Jpm1000000pmMon, 25 Jan 2010 22:22:48 +030010 2010, 22:22:48
4

Грубый. Я видел сетевые платы 100Mb 3com, которые не будут подключаться ни к чему выше 10 МБ, если вы заставите скорость или дуплекс. Вы можете получить полную скорость, разрешив им автоматическое согласование, даже несмотря на то, что у драйвера были 100Mb Full и 100Mb Half settings.

Многие драйверы NIC не позволят вам указать 1000Mb. Единственный выбор - 10, 100, Авто. Снова заставляя вас делать Авто, если вы хотите полной скорости. например, драйвер Broadcom netXtreme 57xx Gigabit ведет себя таким образом.

Вы можете легко заставить Gigabit на коммутаторе, но я думаю, что вы будете вынуждены разрешить большинству сетевых адаптеров.

ответил pplrppl 25 Jpm1000000pmMon, 25 Jan 2010 22:12:41 +030010 2010, 22:12:41
3
  1. По моему опыту (в основном оборудование 3Com и HP, не так много Cisco), автосогласование не вызывает много проблем.

  2. Как и в mrdenny, я обычно устанавливаю серверы на самую быструю скорость (у нас все еще есть 100), полный дуплекс, , а затем выключаем авто. у нас есть смесь скоростей как на серверах, так и на рабочих станциях, я очень предпочитаю, чтобы переключатели включались автоматически и позволяли им адаптироваться к конечной точке.

ответил Ward 25 Jpm1000000pmMon, 25 Jan 2010 22:10:27 +030010 2010, 22:10:27
3

У меня были некоторые проблемы с автосогласованием в домашней установке, и проблема была связана с прокладкой, в частности, сетевые кабели, свернутые в петлю со слишком маленьким диаметром или слишком близко к силовым кабелям.

Но я считаю, что эти предложения слишком тривиальны для вашей установки. ;)

ответил macbirdie 26 Jpm1000000pmTue, 26 Jan 2010 13:00:23 +030010 2010, 13:00:23
2

Я недавно читал об этом в «Сетевом воине» Гари Донахью. На основе этой книги для автоматического согласования для правильной работы. Оба переключателя и сетевой адаптер должны быть настроены на автоматическое согласование. Установка NIC на определенный режим скорости и дуплекса и оставление сервера при автосогласовании не будет работать правильно - автоматическое согласование является протоколом, и обе стороны должны говорить, чтобы настройки работали правильно.

Если вы хотите явно настроить скорость и дуплексный режим, вам нужно сделать это на обоих концах соединения.

ответил Bob Weber 4 FebruaryEurope/MoscowbThu, 04 Feb 2010 22:54:15 +0300000000pmThu, 04 Feb 2010 22:54:15 +030010 2010, 22:54:15
2

Cisco обсуждает некоторые случаи, когда вы можете вручную настроить скорость и дуплекс, а не использовать автосогласование при использовании устройств безопасности PIX /ASA: http://www.cisco.com/ru/US/products/hw/vpndevc/ps2030/products_tech_note09186a008009491c.shtml#troubleshoot

ответил dunxd 9 J000000Friday10 2010, 02:22:20
1

Мое правило состоит в том, чтобы использовать автоматическое согласование для всех, кроме ссылок на маршрутизатор, если у вас нет проблемы (например, последние карты Broadcom ... BAH!)

Если у вас есть два маршрутизатора, подключенных через Ethernet, например, вручную установите скорость на обоих концах.

ответил Aaron C. de Bruyn 26 Jam1000000amTue, 26 Jan 2010 05:51:17 +030010 2010, 05:51:17

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132