Форум программистов, компьютерный форум, киберфорум
Наши страницы
Серверы и серверное железо
Войти
Регистрация
Восстановить пароль
 
Рейтинг 4.67/3: Рейтинг темы: голосов - 3, средняя оценка - 4.67
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
1

Сервер IBM System x3630 M4 (Serveraid m5110) зависает

07.09.2019, 17:51. Просмотров 576. Ответов 13
Метки нет (Все метки)

Добрый день.

На ходу сервер IBM System x3630 M4 перестал отвечать и сам перезагрузился.
Установлен Serveraid M5110, raid 10, 6 дисков.
После перезагрузки долго висит надпись "connecting boot devices and adapters", затем черный экран с немигающим курсором.
Если отсоединить контроллер, система себя ведет адекватно, биос, ливсд и т.д.
Если отсоединить один из дисков, система докладывает об этом и предлагает зайти в конфигурацию, но как бы подвисает и в биосе затем контроллер не видит.
Без дисков контроллер в биосе есть и сообщает что все диски извлечены, можно сохранить его логи.
Диски в начале все живые (полностью проверку всех еще не сделал).
В логах контроллера видно, что был запущен consistency check и будто завис на 99,81%.
В тот момент и произошла перезагрузка (adapterResetRequestIsr CCRMiscCfg).
В логах каждое включение видно по этим 99,81%.
Есть сохраненный конфиг из MegaRAID Storage Manager.
Резких действий пока не делал (типа зайти и посмотреть в биосе конфигурацию, пересканировать).
Есть идея зайти утилиту конфигурации массива и там просканировать конфигурацию на дисках, если она жива и если позволит. Но это в теории, на практике такое не делал.

Что посоветуете чтобы вернуть массив?
0
QA
Эксперт
41792 / 34177 / 6122
Регистрация: 12.04.2006
Сообщений: 57,940
07.09.2019, 17:51
Ответы с готовыми решениями:

Сервер IBM x3630 M4. Ошибка: (0x 2) Unrecognised progress code
Доброго дня, друзья! Помогите решить проблему. Сервер IBM x3630 M4 после включения питания...

Как лучше настроить сервер IBM System x3550 M4
ситуация такая: в фирме стоит сервер IBM System x3550 M4 комплектация с 3-мя жёсткими дисками 3.5...

стойка с 6 серверами IBM System x 3650
Здравствуйте. В организации после объединения досталась стойка с 6 серверами IBM System x 3650...

Настройка server IBM System X3650
Привет! Имеется сервер IBM System X3650 IntelXeon 2x3Ghz,8 Gb DDR, 4HDD по 146 Gb Установить нужно...

Зависания системы на SSD на сервере IBM system x 3250 m5
Приветствую. Столкнулся с проблемой при использовании SSD дисков от Kingston. У меня небольшой...

13
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
08.09.2019, 17:27  [ТС] 2
скорее всего побилась конфигурация, но контроллер всё равно о ней знает.
вытаскиваешь диск знает, все вытащишь тоже знает.
может каким-то ПО на отдельной машине просканить?
6 портов проблема. можно ли по два диска?
0
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
09.09.2019, 11:28 3
X8,
1. Диски вытаскивать не нужно ни в коем случае, в любом состоянии, отличном от оптимального, контроллер выключает drive roaming (опознание диска массива в любом другом слоте) и пр. подобные фичи.
2. Нужно выяснить, где именно проблема (подозреваю, что на контроллере): скинуть SAS кабели, попробовать стартануть без них. Если всё заведется нормально - по уму, прошить бы на последнюю прошивку для этого контроллера и после этого подключить кабели обратно.
Ну то есть - первая задача это по-человечески добраться до управления и посмотреть - что происходит, собственно.
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
09.09.2019, 11:47  [ТС] 4
a_shats,
1. ну да диски вытаскивал, порядок записан.
2. отдельно без шлейфов до контроллера добраться можно, побегать по настройкам, визуально все норм.
http://www.cyberforum.ru/attachment....1&d=1568018166
еще не прошивал. значит свежая прошивка не навредит, и после конфигурацию должно подхватить?

логи вытащил из биос, записей много, вот кусок:
EVT#118087-09/06/19 12:25:41: 65=Consistency Check progress on VD 00/0 is 99.81%(25s)
adapterResetRequestIsr CCRMiscCfg c403ff0e timeUs: 05563fb3
EVT#118092-09/06/19 12:26:46: 345=Controller encountered a fatal error and was reset

достал похожую железку IBM serveraid M1015 / LSI SAS9220-8i
по теории может подхватить конфиг?
0
Миниатюры
Сервер IBM System x3630 M4 (Serveraid m5110) зависает  
09.09.2019, 11:47
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
09.09.2019, 11:57 5
X8,
IBM serveraid M1015 / LSI SAS9220-8i
по теории может подхватить конфиг?
Нет, этот контроллер конфиг от 5110 не подхватит.
еще не прошивал. значит свежая прошивка не навредит, и после конфигурацию должно подхватить?
1. Есть надежда, что прошивка вернет поехавшую крышу контроллеру на место. Если нет - контроллер в утиль, скорее всего.
2. Да, должно. Разве что может обозвать Foreign Configuration - но пугаться не надо, надо проверить соответствие тому, что было и принять её.
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
09.09.2019, 19:30  [ТС] 6
a_shats,
обновил прошивку успешно.
контроллер все ещё помнит диски, если запустить без них.
затем подключил диски, 2й по счету винт доложил в IMM что болен:
The drive 1 has been disabled due to a detected fault.
(ранее его сканил с mhdd - все в порядке)
так вот, подключил диски, захожу в конфигуратор, говорит есть 4 foreign drives (а дисков 6).
превью конфигурации выглядит так (скриншот).
http://www.cyberforum.ru/attachment....1&d=1568046499
расстроило меня это, дальше побоялся импортировать.
синий unconfigured good, черный unconfigured bad.
какие есть варианты?
0
Миниатюры
Сервер IBM System x3630 M4 (Serveraid m5110) зависает  
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
10.09.2019, 11:26 7
X8,
Стоп. А чего у Вас дисковые группы Not Importable ?
Возможно, стоит попробовать удалить физически из сервера Unconfigured Bad а потом еще раз посмотреть.
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
10.09.2019, 12:31  [ТС] 8
a_shats,
раньше VD был один, сейчас из-за разбившейся первой пары он быть может думает что их 2...
вытащил диск, но ситуация та же, 1 unconfigured good, 4 online, 2 группы Not Importable.
надо как-то 1й перевести в другой статус
либо обратно включить 2й диск и его перевести из bad в good.
как считаете?
0
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
10.09.2019, 13:16 9
X8,
либо обратно включить 2й диск и его перевести из bad в good.
Опасно, можно убить всё, что на массиве, если хоть какая-то запись была после того, как он отвалился в Bad.
У Вас, собственно, непонятка (две VD вместо одной) из-за первой пары RAID1, которая отвалилась полностью.
Нужно как-то перевести статус первого диска в Good (не Unconfigured).
Честно говоря, сейчас даже не очень понимаю, как это сделать.
И пересобрать массив без инициализации - без второго диска - не получится, т.к. именно второй диск, судя по всему, свернул чем-то крышу контроллеру.

UPD: Если данные на массиве очень нужны - я бы советовал уже нести весь массив в какую-нибудь компанию по восстановлению данных "как есть", ничего не делая.
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
10.09.2019, 14:30  [ТС] 10
a_shats,
хм, значит варианты такие:
подсоединить все диски и перевести все в good, но опасно.
создать по новой RAID10 с настройками по умолчанию и не делать инициализацию. массив при этом выживает?
нести на восстановление.
есть ПО типа r.saver и r-studio, в них есть возможность собрать виртуальный массив и сканировать. или что-то посерьезней типа UFS Explorer.
0
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
10.09.2019, 15:47 11
Я бы поменял порядок приоритетов В зависимости от ценности данных.
Ну т.е. сначала всё ж нести на восстановление.
Если данные не настолько ценны - то попробовать на SAS HBA (в том же порядке ID) собрать виртуальный массив R-Studio и сбэкапиться с него.
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
12.09.2019, 08:37  [ТС] 12
a_shats,
это конечно так, да)
мораль: естественно бэкапы, обновление прошивок (но страшно на работающей боевой системе).
и ещё я теперь боюсь делать consistency check и не доверяю этому Serveraid M5110.
0
a_shats
892 / 363 / 80
Регистрация: 11.03.2015
Сообщений: 1,296
12.09.2019, 11:33 13
X8,
естественно бэкапы, обновление прошивок (но страшно на работающей боевой системе).
Не страшно при наличии бэкапов и регулярного (а не когда уже пригорает) обновления прошивок
и ещё я теперь боюсь делать consistency check и не доверяю этому Serveraid M5110.
Тоже зря. Ситуевина съезжания крыши у контроллера - она, мягко говоря, не сильно частая, а полагаться на один любой контроллер/накопитель/и т.п. вообще в серверах никогда не стоит.
Ну и еще, на будущее: сисадмины делятся на тех, кто уже делает бэкапы, и тех, кто не забывает проверять возможность восстановления с них
0
X8
0 / 0 / 0
Регистрация: 12.03.2012
Сообщений: 21
13.09.2019, 11:48  [ТС] 14
массив собрался с помощью diskinternals raid recovery, визуально проверил структуру и текстовики, читаются (preview).
на 5 дисках кстати, под 6 просто места нет. на плате 6 портов.
но кушать просит.
0
13.09.2019, 11:48
Answers
Эксперт
37091 / 29110 / 5898
Регистрация: 17.06.2006
Сообщений: 43,301
13.09.2019, 11:48

Сервер IBM 336
Cервер IBM xSeries 336 (8837)/2x Xeon 3.2Ghz/2GB/ С двумя сказевыми винтами.

Сервер IBM глюки с оперативной памятью
При установке в сервер дополнительной планки памяти выдает не весь объем. (24 из 32 которые...

Сервер IBM x3550 не видит SAS диски
Добрый день ! В цод стоит сервер ibm x3550 с 2 SAS дисками. На сервере крутился windows data...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
14
Ответ Создать тему
Опции темы

КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin® Version 3.8.9
Copyright ©2000 - 2019, vBulletin Solutions, Inc.
Рейтинг@Mail.ru