• Записи 1554
  • Теги 117
  • Комментарии 3292

Лог жизни

Похоже, второй NVMe-диск всё же перестал работать

Мда, только я обрадовался, что после переформатирования второй NVMe-диск вроде работает без всяких сбоев, как сегодня случилось непредвиденное. Сначала компьютер завис, а после перезагрузки — наглухо встал. Сначала я подумал, что проблема в видеокарте, так как последнее сообщение, которое появлялось в консоли, было про неё. Переключил монитор на встроенную, попытался отключить запуск дискретной через ком. строку ядра, но ничего не поменялось. Разобрал комп, снял видеокарту, сообщение, связанное с ней исчезло, но компьютер всё равно наглухо вставал при загрузке. Перезапустившись в emergency mode, я обнаружил, что он наглухо застревает на попытке смонтировать второй NVMe и начинает всё более и более долгий отсчёт, который иногда прерывается сообщениями о фатальных ошибках в kernel thread. Но вот что странно: из под GRUB второй NVMe вполне нормально читается, да и btrfs check тоже выполняется без ошибок.
В общем, только когда отключил этот диск и закомментировал соответствующую запись в fstab (заодно и узнал про опцию nofail, которую можно прописать для второстепенных разделов, чтобы при ошибке на них загрузка не останавливалась), всё стало работать нормально. Поставил обратно видеокарту (заодно и продул её от пыли как следует) — тоже работает! Правда, играть теперь какое-то время придётся с внешнего HDD… И перепроходить одну карту в Heroes III, так как то сохранение я, похоже, не засинхронизировал. Но самое неприятное — скорее всего, придётся покупать новый NVMe (ну хоть не видеокарту).

4 комментария:

4X_Pro
0

Теперь ломаю голову, как поступить: купить новый NVMe на 1 Тб (как прежде) чтобы сэкономить (но при этом останутся переживания по поводу того, что места маловато — там оставалось свободно около 300 или 350 Гб), на 2 Тб или же взять NVMe на 1 Тб + HDD на 2 Тб (по деньгам это получается примерно одинаково). Вариант с NVME + HDD хорош тем, что на HDD можно будет выгрузить ISO-образы, backupы сайтов, всякие мануалы, оффлайн-копию Wikipedia и тому подобное, а на NVMe держать только игры и, возможно, LLM модели.

MadTechGuy
0

Больше всего меня во всей этой истории интересует, что с этим NVMe. Сколько он проработал? Он работает в режиме read-only (то есть, с него можно скопировать данные), или он вообще работоспособность утратил?

4X_Pro
0

Диск этот у меня с января 2023, т.е. 2.5. года, из них примерно пять месяцев пролежал без дела в выключенном состоянии (летом 2023 года).
По всей видимости, там происходит следующее: при обращении к некоторым ячейкам памяти зацикливается то ли контроллер диска, то ли kernel thread, отвечающий за приём данных от контроллера. В результате не приходят ни данные, ни ошибка, и в какой-то момент это приобретает лавинообразный характер, из-за чего компьютер просто наглухо виснет (даже NumLock на клавиатуре перестаёт работать).
Изначально я считал, что про произошло из-за «стекания заряда», которое случается, когда NVMe долго лежит выключенным. Но диск я полностью отформатировал, на какой-то момент проблема пропала, но теперь вот снова вернулась, причём, похоже, сбойный участок попал на какую-то критичную часть файловой системы (типа списка inodes или корневного каталога). Этой версии противоречит то, что я делал команду полного форматирования диска, и с тех пор всё, что теперь есть на диске, было записано на него заново.
Вторая версия — плохая электромагнитная помехозащищённость накопителя, так как я заметил, что сбои учащаются во время магнитных бурь.
Пожалуй, дождусь, когда электромагнитная обстановка улучшится и снова вставлю этот NVMe в компьютер и попробую смонтировать в read-only.

4X_Pro
0

Вчера попробовал подключить диск ещё раз. Увы, результат тот же самый: раздел виден, но при попытке монтировать — зависает mount просто останавливается наглухо с падением соответствующего kernel thread (видимо, ошибка такая, что в ядре просто не предусмотрели возможности её возникновения). Попробовал удалить раздел целиком и создать заново или даже сделать Secure erase через BIOS (точнее, UEFI) — безрезультатно. BIOS после где-то двух минут ожидания выдал Failed.
В общем, похоже, придётся признать потерю и покупать новый NVME… Видимо, всё же куплю NVMe на 2 Тб, но с хорошим объёмом перезаписи, и на этом пока всё. А когда-нибудь потом, если вдруг увлекусь нейронками всерьёз или просто вдруг будут свободные деньги, которые не жалко потратить, — два HDD по 4-5 Тб и сделаю из них софтовый RAID 0 для хранения всего-всего-всего и RAID 1 — для наиболее важных личных данных.

Написать комментарий
Прикрепить файлы: (не более 4 файлов, не более 102400 Кб каждый, 102400 Кб всего)


Задать вопрос