Планирование катастрофы

Я работаю в небольшой маркетинговой компании, которая также занимается веб-дизайном и разработкой. Мы размещаем всех наших клиентов по веб-дизайну и разработке на выделенном сервере в Hostgator. У нас есть выделенный сервер с жесткими дисками RAID 1. Мы также делаем еженедельные резервные копии, которые автоматизируются с помощью cPanel и загружаются с помощью автоматизированного FTP-программного обеспечения локально.

Сегодня мы обсуждали, что будем делать, если у Hostgator произошел катастрофический провал. Возможно, сервер взорвался, у Hostgator были серьезные проблемы с сетью, ФБР сделало один из своих знаменитых рейдов «Возьмите каждый сервер, который мы видим», и т. Д. В принципе, любой сценарий, в котором ожидается расширенный отключение. Затем мы перешли на следующий уровень и задались вопросом, что бы мы сделали, если бы Hostgator имел расширенный отключение, и мы не смогли получить доступ к нашим локальным резервным копиям. Это может быть связано с пожаром, потоком и т. Д. Я знаю, что вероятность того, что наш сервер будет работать в течение более длительного периода времени и , локальные файлы, которые одновременно недоступны, удалены, но все, что требуется, это просто два плохие вещи, и это то, где мы будем стоять. (Если вы когда-либо получали плоскую шину и выяснили, что запасные части были плоскими или отсутствующими, вы знаете, насколько легко бывает, что две плохие вещи происходят одновременно).

Излишне говорить, что мы хотим быть готовыми к событиям типа «наихудший сценарий», поскольку это почти наверняка вывело бы нас из бизнеса. Итак, мои два вопроса:

  1. Что мы можем сделать, чтобы подготовиться к расширенному отключению Hostgator? Идеальный сценарий позволит быстро и быстро запускать веб-сайты наших клиентов и, надеюсь, электронные письма.

  2. Каким будет надежный резервный план, так важные данные никогда не будут потеряны? Идеальное решение будет автоматизировано.

Вы можете предположить, что стоимость не является проблемой в ваших ответах, но чем более доступными являются решения, тем лучше.

18 голосов | спросил John Conde 13 J000000Wednesday11 2011, 04:36:19

4 ответа


15

Я бы предположил, что вы:

  1. Автоматическое зеркальное отображение всего содержимого и конфигурации вашего основного сервера на вторичном сервере резервного копирования в полностью отдельной сети в другом центре обработки данных. Используйте RSync, FXP, cPanel voodoo или любой другой способ, который вы хотите автоматизировать для синхронизации.

  2. Использовать переключение DNS failover , чтобы автоматически маршрутизировать трафик на сервер резервного копирования, если сервер Hostgator окажется невосприимчивым.

Это означает, что у вас постоянно есть «горячая» резервная копия, ожидающая выхода, если произойдет самое худшее, а не «холодная» резервная копия, требующая ручного вмешательства и много скремблирования и паники. Это также означает, что ваши клиенты никогда не узнают, что их сайт опустился до вас, что может быть неприятно для всех.

Вы можете настроить отказоустойчивый DNS с помощью поставщика, например DNS Made Easy . Для каждого домена, на котором вы размещаете, вы должны установить до пяти резервных IP-адресов, по одному для каждого резервного сервера. Как только это будет сделано ...

  1. DNS Made Easy проверяет ваш основной сервер каждые две-четыре минуты и, если он не обнаруживает ответ, перенаправляет трафик на вторичный IP-адрес.

  2. DNS Made Easy продолжает проверять основной сервер. Когда он появится, он перенаправит трафик на первый сервер, или, если вы предпочитаете, сохраните его при резервном копировании, пока вы диагностируете, что пошло не так, и исправьте первичный сервер.

Конечно, это решение поднимет ваши эксплуатационные расходы, которые вам придется каким-то образом передать клиентам, но ... если вы находитесь в отрасли, где время простоя приведет вас к бизнесу, избыточный сервер, вероятно, стоит того, чтобы один раз экономить компанию.

Помимо этого:

Дубликат, дубликат, дубликат

Чем больше независимых резервных копий у вас есть, тем лучше. Я храню удаленные резервные копии на локальном жестком диске, который зеркалируется на внешний жесткий диск, в Dropbox, git-репозиторий и удаленную учетную запись FTP. Не рискуйте. Дублируйте как можно больше. Если вам нужно восстановить резервную копию вручную, лучше иметь выбор из пяти, чем один. Паранойя недооценивается.

Практика восстановления резервных копий вручную

Если вы никогда не пытались восстановить данные из одного из ваших резервных копий, как вы знаете, что они работают? Стоит сделать экстренные упражнения, чтобы узнать, что произойдет, если ваши автоматические процедуры не удастся.


ОБНОВЛЕНИЕ: Несколько других служб, которые я недавно обнаружил, которые стоит упомянуть в отношении резервного копирования, аварийного восстановления и поддержания работоспособности сайта:
  • Cloudflare, , который предоставляет функции безопасности и кеширования, чтобы поддерживать сайт, когда ваш сервер опускается. (Они отражают ваш сайт и обслуживают его из своего распределенного в глобальном масштабе кеша, а не непосредственно с вашего сервера.)
  • Codeguard , который предоставляет автоматическое резервное копирование и откат кода сайта (только FTP).
  • Автозагрузка сайта , который обеспечивает автоматическое резервное копирование и откат кода веб-сайта, данных электронной почты и информации MySQL через резервные копии cPanel. Обратите внимание, что это выполняется Hostgator, поэтому он не обязательно подходит для размещения вашего сайта с ними, но может помочь другим.

Cloudflare, в частности, выглядит так, что было бы полезно избегать простоев и вообще улучшать работу сайта.

ответил Nick 13 J000000Wednesday11 2011, 21:17:38
6

Аварийное восстановление может быть огромной задачей, особенно при работе с несколькими серверами, сайтами и базами данных. Два ключевых элемента, которые необходимо учитывать при выборе решения, - это цели времени восстановления (RTO) и цели точки восстановления (RPO).

RTO - это, по сути, ожидание того, сколько времени потребуется, пока сайты не вернутся. Если у вас есть RTO минута или две (или меньше), тогда вы должны рассматривать решение в соответствии с тем, что предложил Nick, который включает репликацию ваших файлов и данных в реальном времени в дополнительный центр обработки данных и автоматический переход на другой ресурс DNS, который мог бы делать с платной услугой или с оборудованием в обоих центрах обработки данных (например, . (Также для записи я не связан с Rackspace, но использовал их службы в прошлом).

Надеюсь, это помогло.

EDIT : подумал, что это может помочь, если вы оцениваете облачные решения. Gartner Magic Quadrant Report для инфраструктуры и службы и веб-хостинга может дать вам некоторое представление о других поставщиках решений.

ответил Rob 14 J000000Thursday11 2011, 02:54:09
2

Полное репликация сервера на другом объекте другой хостинговой компании кажется наиболее очевидным решением.

Файлы можно синхронизировать с такими инструментами, как rsync и unison. Резервные копии SQL также могут быть повторно обработаны, а затем загружены в ведомый DB по сценариям.

ответил ZJR 13 J000000Wednesday11 2011, 06:38:56
1

Убедитесь, что вы используете управление версиями всего вашего кода с репозиторием исходного кода (SVN или GIT). Вы используете SVN или GIT?

Вы можете получить учетную запись (бесплатную или оплаченную) в стороннем репозитории, например Project Locker и если вы используете весь свой код во время работы, по существу, у вас есть все резервное копирование в ваш репозиторий, который находится на третьем месте. Тем самым дальнейшее снижение ваших шансов (почти до нуля) потери всей работы сразу.

Вы можете выполнить транзакции /проверки SVN через командную строку или через клиент, например, версии (для Mac) или TortoiseSVN (для Windows).

ответил Joel Glovier 13 J000000Wednesday11 2011, 08:19:34

Похожие вопросы

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132