2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
1 | |
Windows 2008 server R2 Накрылся crcdisk.sys. Харды в массиве RAID 10. Хардверный RAID контроллер07.04.2014, 17:12. Показов 19031. Ответов 53
Метки нет (Все метки)
Здравствуйте.
Сервер самопромзвольно уходит в ребут, как только загрузка добирается до crcdisk.sys Что произошло - не знаю. Сегодня прямо на глазах сначала стали отваливаться клиенты 1с, решил перегрузить. И всё. Запустился с загрузочника - восстановление системы. Пока жду, что он наделает. На сервере - контроллер домена, DNS, сервер 1С В массиве 4 винта. Поскольку с рейдом я впервые так коротко общаюсь- вопрос лбом. Что делать, куда смотреть, что читать. Спасибо.
0
|
07.04.2014, 17:12 | |
Ответы с готовыми решениями:
53
Windows SErver 2008 + RAID Adaptec Windows Server 2008 R2 не устанавливается с RAID Перенос Windows Server 2008 R2 c RAID на SSD Миграция Windows Server 2008 R2 на другой RAID массив сервера |
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
08.04.2014, 20:28 [ТС] | 7 |
Поскольку комментарии созвучны, отвечу сразу всем. Орать -орал. Сначала беспрерывно и невыносимо тонко. После ребута - перестал. Только короткий писк при загрузке своего BIOS. Диод - да, горит. Пользователи донесли, что ночью (предприятие работает круглосуточно) опять (в нашем здании обычное дело) вырубали свет. Я уже в UPSах замучился аккумуляторы менять. Но сейчас не об этом.
Что сейчас: При загрузке - та же беда. Черное окно, градусник microsoft, потом под вой кулеров - ребут. В безопасном трассирует загрузку до crcdisk.sys и опять перегружается. Слышал, что для Win 2008 server, краш этого файла на одном из дисков рейда -явление не уникальное. Хуже то, что я не знаю (читайте - не умею) как определять, в каком из страйпов он слетел. Еще хуже - возможно битый файл транслировался на зеркальный страйп. У меня RAID 10. Воткнул флешку с winPE. Система загрузилась, сервер поднялся. Но поднялся-то он на загрузчике, который на этой флешке. Без нее - operating system not found. Больше пробовать не стал. В общем задача теперь - убрать этот "костыль" и поднять сервер. Совсем не хорошо, что предприятие работает сутками. Особо не поэкспериментишь. Какие могут быть варианты кроме тотального бэкапа, сноса и переустановки системы? Восстановление с загрузочника (в самом начале писал) подвисло на 2 с лишним часа. Прервал. Если такая длительность это нормально - я готов ждать (перенес основные данные на локальные машины кое-как можно работать) Но многие говорят, что такой простой выход - почти исключение. Еще говорят, можно убить ветку реестра, связанную со сбойным накопителем. Не удаляется. PS С радостью бы позвал того, кто разбирается, и денег бы заплатил - нервы в любом случае дороже. Да звать некого.
0
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
08.04.2014, 20:49 [ТС] | 9 |
Почему не читал? Ничего особенного. Грузит свой БИОС (и грузил) как обычно. В конфиге - все мемберы массива OPTIMAL, собственная утилита контроллера (хватило времени все харды прочесать) не показала ничего. Инициализацию запускать не стал - очень уж страшные предупреждения.
0
|
Заблокирован
|
|
08.04.2014, 20:57 | 10 |
Но он пищал до, значит что-то было не просто так, поднимай логи винды оффлайн - грузись с дистриба никсов или bsd(меньше гемора с драйверами - почти всё железное тот же freebsd 10 знает сходу без дополнительных движений, с линуксом похуже, с виндой вообще никак), читай логи, поднимай что писал софт рейда или журнал событий(туда дублирует 90% софта и даже без софта драйвер дублирует 90%). В простом виде тебе надо mfsbsd загрузочный, рабочий интернет, настроить сеть там и установить ntfs-3g/fusefs-ntfs если надо что-то писать, ну если не надо - тупо mount_ntfs, далее слить логи *.evt из папки винды и прочитать их на любой винде.
1
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
08.04.2014, 21:02 [ТС] | 11 |
Что искать?
0
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
09.04.2014, 09:28 [ТС] | 13 |
%\System32\Config\Hardware.evtx и многих других журналов нет вообще. Видно тот кто был до меня очень любил отсекать все лишнее.
0
|
17 / 14 / 1
Регистрация: 13.03.2014
Сообщений: 69
|
||||||
09.04.2014, 10:49 | 15 | |||||
Очень похоже на логический бэд. Ибо родная рэйдовая консоль ругалась бы по любому, если б хотя бы 1 из винтов сбоил...
Посему попробуй
0
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
09.04.2014, 14:02 [ТС] | 16 |
Ага. Нашел запись
Adaptec storage manager agent: One or more logical devices contain a bad stripe. Controller1 Ну в таком общем виде мне и без журнала всё было понятно. Делать-то что?
0
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
09.04.2014, 15:06 [ТС] | 18 |
Смотрю дальше. Становится понятнее и страшнее.
Началось все давно. Пока домотал журнал до начала года. Периодически, раз в 6 суток: Ошибка:The battery-backup cache device needs a new battery: controller 1. Потом к нему добавилась пара: Предупреждение: Bad Block discovered: controller 1 (1086400)и тп. На сегодня сообщение о бэдах учащается до раза-двух в сутки Наконец 07.04 появилось это: Logical device is degraded: controller 1, logical device 0 ("r10"). Полезная запись -можно определить носитель. Потом Periodic scan found one or more degraded logical devices: controller 1. Repair as soon as possible to avoid data loss. Сейчас говорит одно и то же One or more logical devices contain a bad stripe: controller 1. То есть, на бэды он больше не ругается. Битый страйп - и всё, чего мелочиться. Вот теперь мне страшно. Если можно. последовательность шагов, чтобы я не паниковал. Задача - спасти сервак. Вводные: Server 2008R2. Контроллер домена, сервер 1с, сервер MYSQL_Express. Массивы RAID1 там просто свалка по большому счету и хранилище старых dbf RAID 10 там ВСЁ. На всякий случай. Имеюся в наличии установочные диски сервера, лицензионные естественно. Имеется еще один точно такой же по конфигурации, но под centOS сервер СУБД. Сейчас в общем-то не задействован, поскольку 1С базы разнесены пока файлово по разным машинам. Очень прошу, расскажите, как в подобной ситуации действовали бы вы, опытные админы. Можете даже в начале поста писать, что такой херни вы бы просто не допустили, и что куда я смотрел, и как я мог все прощелкать, только дальше опишите пожалуйста хоть какой-нибудь вариант. Ссылки на статьи и тех.материалы пригодятся, но этим я займусь (и занимаюсь) в фоновом режиме. А сейчас у меня судороги и паника. Спасибо. PS Вынимать диск. Понятно. Чем дольше он работает - тем больше ошибок плодит. Сделаю Целый страйп как я понимаю хранит данные. И даже возможно даст загрузить систему. А сейчас убийственный вопрос: Так вот, пока я буду менять хард, (его еще купить надо) теоретически могу я запустить систему с оставшегося страйпа? И еще. Ребилдить мне нужно будет видимо страйп, где будет заменен носитель. Или весь массив? Что будет с данными?
0
|
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
|
|
09.04.2014, 19:28 [ТС] | 20 |
Сейчас еще прочешу, в одной записи кажется было все вплоть до номера изделия.
Нашел! Failed drive: controller 1, connector 0, device 2, S/N BJA0P850206M (Vendor: FUJITSU Model: MBA3147RC). Добавлено через 18 минут Еще дважды та же запись, про то же устройство. Значит хард все-таки "нашелся". И он один. Батарейка еще. Но, допустим, я возьму ее с другого сервера, который сейчас фактически простаивает. С него же могу взять хард на замену. Условно - с этого момента аппаратная проблема вроде снимается. Значит можно ребилдить страйп? И пробовать поднять сервер? Есть конечно вариант тупо поднять сервер с нуля. Бэкапы MySQL имеются, а более на этом массиве ничего ценного и нету, слава те Господи. Потом спокойно разбираться с хромым железом....
0
|
09.04.2014, 19:28 | |
09.04.2014, 19:28 | |
Помогаю со студенческими работами здесь
20
Контроллер MegaRAID 9240-8i RAID Controller Card | SAS RAID | LSI Программный raid зеркало на Win server 2008 Добавление Raid на работающий Win Server 2008 R2 RAID Контроллер. Установка Windows 7. Искать еще темы с ответами Или воспользуйтесь поиском по форуму: |