Форум программистов, компьютерный форум, киберфорум
Windows Server
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
 
Рейтинг 4.86/100: Рейтинг темы: голосов - 100, средняя оценка - 4.86
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
1

Windows 2008 server R2 Накрылся crcdisk.sys. Харды в массиве RAID 10. Хардверный RAID контроллер

07.04.2014, 17:12. Показов 19031. Ответов 53
Метки нет (Все метки)

Author24 — интернет-сервис помощи студентам
Здравствуйте.
Сервер самопромзвольно уходит в ребут, как только загрузка добирается до crcdisk.sys
Что произошло - не знаю. Сегодня прямо на глазах сначала стали отваливаться клиенты 1с, решил перегрузить.
И всё. Запустился с загрузочника - восстановление системы. Пока жду, что он наделает. На сервере - контроллер домена, DNS, сервер 1С
В массиве 4 винта. Поскольку с рейдом я впервые так коротко общаюсь- вопрос лбом. Что делать, куда смотреть, что читать.
Спасибо.
0
Programming
Эксперт
94731 / 64177 / 26122
Регистрация: 12.04.2006
Сообщений: 116,782
07.04.2014, 17:12
Ответы с готовыми решениями:

Windows SErver 2008 + RAID Adaptec
Всем привет! Выручайте, не могу установить драйвер Adaptec во время установки Windows, выбирае его,...

Windows Server 2008 R2 не устанавливается с RAID
Здравствуйте! Не могу установить Windows Server 2008 R2. Вроде бы сделал Raid 1+0, но почему то...

Перенос Windows Server 2008 R2 c RAID на SSD
Здравствуйте! Имеется Windows Server 2008R2 на железном рэйде 10 3ware. Хочу перенести ОС на новый...

Миграция Windows Server 2008 R2 на другой RAID массив сервера
Добрый день! Задача - перенести на сервере ОС Windows Server 2008 R2 с RAID 0 (логический диск 0)...

53
Заблокирован
07.04.2014, 19:58 2
Аппаратный должен давно орать если диску капут, зови того кто разбирается, тут лезть чревато.
0
Модератор
Эксперт по компьютерным сетямЭксперт HardwareЭксперт Windows
5425 / 2432 / 162
Регистрация: 27.06.2011
Сообщений: 9,739
08.04.2014, 08:02 3
Цитата Сообщение от Dr_Quake Посмотреть сообщение
Аппаратный должен давно орать если диску капут
ну не прямо "орять", но вот диодик характерного красного цвета должен гореть, если какой то из хардов из аппаратного райда выпал...
0
Заблокирован
08.04.2014, 11:54 4
Ни разу не видел аппаратного на котором не было бы спикера. Софтрейды до 100$ не в счёт.
0
Модератор
Эксперт по компьютерным сетямЭксперт HardwareЭксперт Windows
5425 / 2432 / 162
Регистрация: 27.06.2011
Сообщений: 9,739
08.04.2014, 13:14 5
Цитата Сообщение от Dr_Quake Посмотреть сообщение
Ни разу не видел аппаратного на котором не было бы спикера. Софтрейды до 100$ не в счёт.
Спорить не буду, последний в моем распоряжении был и был умерший райд, он почему то не пищал, диод горел
0
Заблокирован
08.04.2014, 13:20 6
Если бы подох контроллер - там бы до загрузки дело не дошло...
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
08.04.2014, 20:28  [ТС] 7
Поскольку комментарии созвучны, отвечу сразу всем. Орать -орал. Сначала беспрерывно и невыносимо тонко. После ребута - перестал. Только короткий писк при загрузке своего BIOS. Диод - да, горит. Пользователи донесли, что ночью (предприятие работает круглосуточно) опять (в нашем здании обычное дело) вырубали свет. Я уже в UPSах замучился аккумуляторы менять. Но сейчас не об этом.
Что сейчас:
При загрузке - та же беда. Черное окно, градусник microsoft, потом под вой кулеров - ребут. В безопасном трассирует загрузку до crcdisk.sys и опять перегружается. Слышал, что для Win 2008 server, краш этого файла на одном из дисков рейда -явление не уникальное. Хуже то, что я не знаю (читайте - не умею) как определять, в каком из страйпов он слетел. Еще хуже - возможно битый файл транслировался на зеркальный страйп. У меня RAID 10.
Воткнул флешку с winPE. Система загрузилась, сервер поднялся. Но поднялся-то он на загрузчике, который на этой флешке. Без нее - operating system not found. Больше пробовать не стал. В общем задача теперь - убрать этот "костыль" и поднять сервер. Совсем не хорошо, что предприятие работает сутками. Особо не поэкспериментишь. Какие могут быть варианты кроме тотального бэкапа, сноса и переустановки системы?
Восстановление с загрузочника (в самом начале писал) подвисло на 2 с лишним часа. Прервал. Если такая длительность это нормально - я готов ждать (перенес основные данные на локальные машины кое-как можно работать) Но многие говорят, что такой простой выход - почти исключение.
Еще говорят, можно убить ветку реестра, связанную со сбойным накопителем. Не удаляется.

PS С радостью бы позвал того, кто разбирается, и денег бы заплатил - нервы в любом случае дороже. Да звать некого.
0
Заблокирован
08.04.2014, 20:43 8
То есть как бы что контроллер пишет ты даже не читал? Срочно в биореактор, если проблема аппаратная - ты убиваешь дальше свои данные!
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
08.04.2014, 20:49  [ТС] 9
Почему не читал? Ничего особенного. Грузит свой БИОС (и грузил) как обычно. В конфиге - все мемберы массива OPTIMAL, собственная утилита контроллера (хватило времени все харды прочесать) не показала ничего. Инициализацию запускать не стал - очень уж страшные предупреждения.
0
Заблокирован
08.04.2014, 20:57 10
Но он пищал до, значит что-то было не просто так, поднимай логи винды оффлайн - грузись с дистриба никсов или bsd(меньше гемора с драйверами - почти всё железное тот же freebsd 10 знает сходу без дополнительных движений, с линуксом похуже, с виндой вообще никак), читай логи, поднимай что писал софт рейда или журнал событий(туда дублирует 90% софта и даже без софта драйвер дублирует 90%). В простом виде тебе надо mfsbsd загрузочный, рабочий интернет, настроить сеть там и установить ntfs-3g/fusefs-ntfs если надо что-то писать, ну если не надо - тупо mount_ntfs, далее слить логи *.evt из папки винды и прочитать их на любой винде.
1
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
08.04.2014, 21:02  [ТС] 11
Что искать?
0
Заблокирован
08.04.2014, 21:23 12
Все что warn/err.
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
09.04.2014, 09:28  [ТС] 13
%\System32\Config\Hardware.evtx и многих других журналов нет вообще. Видно тот кто был до меня очень любил отсекать все лишнее.
0
Заблокирован
09.04.2014, 10:26 14
Ну там ничего и не бывает, они вообще пустые как правило. Application&&System только важны по сути.
0
17 / 14 / 1
Регистрация: 13.03.2014
Сообщений: 69
09.04.2014, 10:49 15
Очень похоже на логический бэд. Ибо родная рэйдовая консоль ругалась бы по любому, если б хотя бы 1 из винтов сбоил...
Цитата Сообщение от Дима Артёмов Посмотреть сообщение
собственная утилита контроллера (хватило времени все харды прочесать) не показала ничего.
Посему попробуй
Bash
1
chkdsk /r /f
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
09.04.2014, 14:02  [ТС] 16
Ага. Нашел запись
Adaptec storage manager agent:
One or more logical devices contain a bad stripe. Controller1

Ну в таком общем виде мне и без журнала всё было понятно.
Делать-то что?
0
Заблокирован
09.04.2014, 14:29 17
Выяснять какой диск, менять, ребилдить. Пока ты его не вынешь всё будет подвисать нафиг итд.
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
09.04.2014, 15:06  [ТС] 18
Смотрю дальше. Становится понятнее и страшнее.

Началось все давно. Пока домотал журнал до начала года.

Периодически,
раз в 6 суток:
Ошибка:The battery-backup cache device needs a new battery: controller 1.

Потом к нему добавилась пара:
Предупреждение: Bad Block discovered: controller 1 (1086400)и тп.

На сегодня сообщение о бэдах учащается до раза-двух в сутки

Наконец
07.04 появилось это:
Logical device is degraded: controller 1, logical device 0 ("r10").
Полезная запись -можно определить носитель.

Потом
Periodic scan found one or more degraded logical devices: controller 1. Repair as soon as possible to avoid data loss.

Сейчас говорит одно и то же
One or more logical devices contain a bad stripe: controller 1.

То есть, на бэды он больше не ругается. Битый страйп - и всё, чего мелочиться.

Вот теперь мне страшно.
Если можно. последовательность шагов, чтобы я не паниковал. Задача - спасти сервак.

Вводные:
Server 2008R2. Контроллер домена, сервер 1с, сервер MYSQL_Express.
Массивы
RAID1 там просто свалка по большому счету и хранилище старых dbf
RAID 10 там ВСЁ.

На всякий случай. Имеюся в наличии установочные диски сервера, лицензионные естественно.
Имеется еще один точно такой же по конфигурации, но под centOS сервер СУБД. Сейчас в общем-то не задействован, поскольку 1С базы разнесены пока файлово по разным машинам.

Очень прошу, расскажите, как в подобной ситуации действовали бы вы, опытные админы. Можете даже в начале поста писать, что такой херни вы бы просто не допустили, и что куда я смотрел, и как я мог все прощелкать, только дальше опишите пожалуйста хоть какой-нибудь вариант. Ссылки на статьи и тех.материалы пригодятся, но этим я займусь (и занимаюсь) в фоновом режиме. А сейчас у меня судороги и паника.

Спасибо.

PS
Вынимать диск. Понятно. Чем дольше он работает - тем больше ошибок плодит. Сделаю
Целый страйп как я понимаю хранит данные. И даже возможно даст загрузить систему. А сейчас убийственный вопрос: Так вот, пока я буду менять хард, (его еще купить надо)
теоретически могу я запустить систему с оставшегося страйпа? И еще. Ребилдить мне нужно будет видимо страйп, где будет заменен носитель. Или весь массив? Что будет с данными?
0
Заблокирован
09.04.2014, 17:39 19
Теоретически и если вылетел один диск из 10. Ты же обрезал сообщения лога собственно где написано что конкретно, он пишет полный путь или номер диска.
0
2 / 2 / 1
Регистрация: 16.10.2009
Сообщений: 112
09.04.2014, 19:28  [ТС] 20
Сейчас еще прочешу, в одной записи кажется было все вплоть до номера изделия.
Нашел!
Failed drive: controller 1, connector 0, device 2, S/N BJA0P850206M (Vendor: FUJITSU Model: MBA3147RC).

Добавлено через 18 минут
Еще дважды та же запись, про то же устройство. Значит хард все-таки "нашелся". И он один. Батарейка еще. Но, допустим, я возьму ее с другого сервера, который сейчас фактически простаивает. С него же могу взять хард на замену.
Условно - с этого момента аппаратная проблема вроде снимается. Значит можно ребилдить страйп? И пробовать поднять сервер?

Есть конечно вариант тупо поднять сервер с нуля. Бэкапы MySQL имеются, а более на этом массиве ничего ценного и нету, слава те Господи. Потом спокойно разбираться с хромым железом....
0
09.04.2014, 19:28
IT_Exp
Эксперт
87844 / 49110 / 22898
Регистрация: 17.06.2006
Сообщений: 92,604
09.04.2014, 19:28
Помогаю со студенческими работами здесь

Контроллер MegaRAID 9240-8i RAID Controller Card | SAS RAID | LSI
Имеется контроллер MegaRAID 9240-8i RAID Controller Card | SAS RAID | LSI (по этой ссылке раньше...

Программный raid зеркало на Win server 2008
Имеется один диск на один терабайт и еще один на 500 гб как сделать raid 1, в инете мало инфы как...

Добавление Raid на работающий Win Server 2008 R2
Добрый день! Имеется HP DL380G7 на WinServ 2008 R2. Сейчас стоит (насколько знаю) 4х500 ГБ SAS в...

RAID Контроллер. Установка Windows 7.
Здравствуйте. Есть проблема. На материнской плате IDE разъема нету, а жесткий как раз IDE - я его...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
20
Ответ Создать тему
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2024, CyberForum.ru