Авария: причины и уроки

Добрый день!

 

Если вы читаете это сообщение, значит процесс восстановления после аварии завершен и сайт вернулся к работе. Считаю нужным объясниться перед сообществом за недельный простой. И так как всё происходило:

 

0) Как вы знаете, по причине повышения курса доллара, в конце сентября сайт переехал из уютного дата-центра в Голландии в московский дата-центр компании Инфобокс. 

 

1) Вечер пятницы. Около 8 часов вечера сервер стал работать нестабильно и я решил перезагрузить его из панели управления сервером. После перезагрузки сервер не включился, и я сразу же написал в тех.поддержку с прочьбой помочь.

 

2) К сожалению понадобилась помощь верховного администратора хостинг-прощадки, который в выходные дни отсутствует. Первое сообщение от администратора последовало в 4.30 утра во вторник.

 

3) В течении дня анализировали причины и последствия сбоя. Худшие прогнозы сбылись и на сервере произошел масовый сбой файловой системы, который затронул в том числе и системные файлы. Т.е. сервер стал непригоден для запуска чего-либо.

 

4) В среду начались работы по переносу файлов, настроек и базы данных на новый сервер, подальше от дата-центра компании Инфобокс и поближе к Саратову. Спасибо хорошим людям, быстро предоставившим нам новый сервер прямо в Саратове.

 

5) В процессе переноса обнаружилось, что повреждена база данных. Последняя резервная копия базы данных датирована 18 октября. Оставшееся время заняли безуспешные попытки восстановить базу данных до последнего состояния, но к сожалению метаданные(комментарии, новости, посты, описания фотографий) потеряны за период с 18 октября до 14 ноября (дата сбоя). Внимание! Файлы фотографий не потеряны, потеряны только описания. Вытащил из резервной копии все файлы, добавленные за этот период. Нам придётся добавить их вновь. Ссылка на архив с файлами: https://s3.eu-central-1.amazonaws.com/oldsaratov.ru/backup.zip

 

6) Потеряна так же вся техническая работа за последний месяц (новая карта, фильтры, пейджинг). Будет восстановлена в ближайшее время.

 

Естественно я извлёк уроки из произошедшего:

1) Система резервного копирования файлов отработала отлично и по моим оценкам ни один файл не потерян.

 

2) Настроена система ежедневного резервного копирования базы данных во внешнее хранилище.

 

3) Наш новый хостер в ближайшее время обещал настроить еще один "контур" резервного копировани, на своё оборудование.

 

4) В следующие выходные будет произведена попытка создать оффлайн-версию сайта, которую вы сможете записать себе на жесткий диск и стать одним из "хранителей", которые помогут вернуть данные в случае глобального сбоя всех систем резервного копирования или злонамеренных действий.

 

Прошу извинений у сообщества, половина произошедшего - моя вина. Надеюсь такого больше не повторится.

В течении ближайших нескольких дней будет продолжена мелкая настройка нового сервера для поднятия производительности.

 

Обо всех проблемах сообщайте в комментариях.

 

  

 

Комментарии

От себя добавлю, что мы весьма легко отделались. Одновременно упавший СТТС восстановили по состоянию на март из резервной копии с личного винчестера бывшего админа, которую он уже успел удалить, но сумел восстановить средствами возврата удалённых файлов.

Админы делятся на тех кто делает бекапы и тех кто УЖЕ делает бекапы.

Антон, спасибо за проделанную работу! представляю сколько сил пришлось и ещё придётся вложить.

Скачал архив с файлами, нашёл там те, что добавлял или обновлял я, всё это ещё раз перезалью.

Но надо как-то отконтролировать потом, что все файлы из архива были снова залиты на сайт.

 

 

 

 

я буду у себя из папки удалять выложенные фотографии

УРА! Сайт заработал! Антон! Большое спасибо. Надо сказать, что наверное, многие, в том числе и я, привыкли каждый день заходить на сайт и его отсутствие вызвало лёгкую панику. Надеюсь, что все восстановительные работы завершатся благополучно, удачи Вам во всём!

Приятно что сайт вызывает привыкание и ломку)

Вот потому я для своих проектов выбрал Beget. Отличный аптайм, частые бекапы, круглосуточная и грамотная поддержка, отличные цены. 

 

Насчет оффл-лайн версии "Старого Саратова" - отличная идея. С удовольствием тоже стану ее обладателем-хранителем.

Ни один из тарифов нам бы не подошел, помните что у нас около 50Gb файлов.

ЗдОрово, что сайт снова работает! Пока постараюсь заново выложить фотки из архива СОМК. А затем ... будет ещё много новых фотографий, которые переснял из альбома в библиотеке на Зарубина. Посвятил этому почти всю субботу.

Спасибо за проделанную работу. От себя добавлю, что очень помогало информационное сопровождение кризисной ситуации в группе "Одноклассников".

Желающие создать собственную копию сайта могут также воспользоваться каким-нибудь менеджером закачек, например Teleport Ultra v.1.70

(им я уже делал пару раз копии "ФСС", загрузка займёт много времени, но зато этот сайт всегда будет под рукой).

 

Сайт одно время тормозил, по словам Антона, как раз в связи с тем, что кто-то пытался закачать его целиком, так что делать этого, видимо, не стоит ;).

Пожалуйста не делайте так больше, или хотя бы предупреждайте по почте info@oldsaratov.ru .

Резкие повышения нагрузки пугают нас, хостера и систему обнаружения хакерских атак (такая у нас тоже есть), которая может забанить всю вашу подсеть в автоматическом режиме.

 

Если вы предупредите - мы сможем выбрать оптимальное время для создания копии, когда нагрузка на сайт будет минимальной. Спасибо за понимание.

Так это я думаю всем понятно - такие закачки нужно делать исключительно ночью.

Вчера я делал копию уже после половины первого ночи, процесс занимает несколько часов, как раз до утра.

 

Какой объём получился у сайта в итоге?

Общий объём 7279016045 (предыдущая скачка, примерно год назад, дала на несколько сотен мегабайт меньше, 6 GB с мелочью)

Скачивал регистрированным Teleport Ultra (ограничений для этой версии почти нет, в отличие от Teleport Pro)

Выборочный просмотр показал, что вроде бы всё на месте, ничего не пропущено.

Откуда берутся упомянутые вами 50 GB непонятно, буду разбираться...

 

1) У нас хранится история изменений. Т.е. если кто-то заменил фотографию - в истории изменений вё равно можно будет увидит старую.

2) У нас хранятся оригиналы фотографий, которые иногда весят до 15мб

3) У нас каждая фотографи хранится в нескольких размерах, чтобы если вы смотрите раздел "Последние фотографии",то и сервера вам отдавались мелкие превьюшки.

4) База данных тоже весит не мало

 

Так и набирается около 50Gb.

 

Да, теперь понятно.

Всё это недоступно для менеджера закачек.

Но всё самое необходимое имеется - фотографии с комментариями и форум, а для оффлайн режима больше ничего и не нужно.

Попробую семигигабайтную версию выложить для общего доступа.

Скачать архив "ФСС" можно здесь:

https://mega.co.nz/#!SI512CYD!lvAyaGDlHVy2zh04bib9NXexbZfSV8ow1XsODn4hcng

Скорость скачки с этого файл-хостинга достаточно высокая, времени это займёт немного.

Архив упакован архиватором 7z без сжатия и без пароля. 

Запуск осуществляется файлом index.htm

AV et DJHool работают на сайте по ночам, так что это тоже не очень хорошо... Лучше, как написал админ, согласовывать.

Это, безусловно, конечно согласуем.

Антон, а фотографии в комментариях не сохранились?

сохранились, забыл про них. Вечером вытяну и выложу отдельным архивом

все фотографии из комментов + фотографии приложенные в виде аттачментов https://s3.eu-central-1.amazonaws.com/oldsaratov.ru/attachments.zip

Спасибо за сайт! Спасибо за восстановление!! Спасибо за то , что мы опять вместе!!!

Спасибо за восстановленный сайт.