Произошла устранимая аппаратная ошибка компонент память источник ошибки unknown error source

Сообщения: 217
Благодарности: 17

Профиль | Отправить PM | Цитировать

Купили новый сервер HP Proliant DL 580 G7. Установили Win 2008 R2 SP1 все ок. Отдельная проблема была с дровами. Только онлайн с сайта HP. Но вроде тоже все решили через их утилиты обновления, но появилась сначала ошибка Код события 18 Событие WHEA-logger (Извиняюсь полое описание 18- ой ошибки не осталось почистил логи) и
Имя журнала: System
Источник: Microsoft-Windows-WHEA-Logger
Дата: 21.03.2011 10:06:38
Код события: 47
Категория задачи:Отсутствует
Уровень: Предупреждение
Ключевые слова:
Пользователь: LOCAL SERVICE
Компьютер: hyperv2.ckbmp.ru
Описание:
Произошла устранимая аппаратная ошибка.

Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера

Дополнительые сведения см. в подробном представлении этой записи.
Xml события:

47
0
3
0
0
0x8000000000000000

12405299

System
hyperv2.ckbmp.ru

1
<00000000-0000-0000-0000-000000000000>

0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0
873
435045521002FFFFFFFF03000200000002000000690300002506070015030B14000000000000000000000 0000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4E BD4F8905D9EAE6B92E6CB0100000000455200000000000000000000000000000000000058010000490000000102000001000 0001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000 000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB000000000000000000000 0000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF 94257459C33565E5CC3F7E800000000000000000000000000000000020000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000057010000000000000002000000000000A506010000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000007000000000000000000000000000000000000000000000 00000000000000000000000000000000001000000010000008D99F68496E7CB0107000000000000000000000000000000000 00000080000009F000100000200CC00D7656F0400000080110000000000C0000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000

Первая ошибка решилась обновлением биоса. Ошибка известная только на сайте мелкомягких не нашлось заплатки на Win 2008 R2 x64. Обновление биоса спасло. А вот по второй ришлось помучиться. Как видно в ошибке пишет про память. Менял местами проверял Memtest-ом Никаких решений. Мемтест кажет что все ок, но это и понятно так как память регистровая ошибки сама проверяет. Короче решения в нете не нашел. Начал копать в итоге даже тех поддержка HP не смогла мне внятно обьяснить что да как. Начал решать проблему с биоса и опа в точку. Короче эта ошиба появлеться когда идет несоответствие питания с процами и памятью. Переключил питание на High Perfomance. Уже пару часов ошибок не видно хотя раньше каждые 15-20 минут появлялись. Написал этот пост для того чтобы хотябы одно решение было в инете . Может кому поможет

——-
Никак не могу собраться с мыслями, то я занят, то они.

Источник

Ошибки kernel: CPU 1: Machine Check: 0 Bank 0: d020000000100011

Проц AMD Ryzen 5 3500X 6-Core Processor. Без разгона. BIOS на мат.плату последний стоит.

с недавних пор начали сыпаться ошибки в лог. Причину их понять не могу:

Имеет смысл сдать по гарантии, само вряд ли пройдёт. До этого можно попробовать сбросить настройки UEFI и отключить XMP-профиль памяти, чтобы она работала на каких-нибудь 2666 МГц.

XMP стоит, к слову. Вроде на 3000 Mhz.

Corrected error, no action required

не понятно, почему этого раньше не было (пару месяцев назад), а сейчас появилось.

Сдай проц по гарантии.

Материнская плата какая? Zen2 не очень хорошо работают на старых чипсетах, особенно на ранних ревизиях плат из начала 17 года.

Зачем? Никаких проблем при эксплуатации нету. Не хочу комп разбирать. Раньше этой ошибки точно не было. Появилась она недавно.

ASRock B450M Pro4 Биос последний прошит.

Тогда скорее всего дело не вней. Как я понял, ошибка по L2-кэшу на одном из ядер. Но т.к. ecc кэша отрабатывает штатно, то не уверен, что такой процессор будет просто поменять. Только если напрямую через производителя.

Как ты думаешь, когда проц вместо выполнения 1 инструкции срет исключение, печатает всю эту портянку в лог — у тебя производительность не падает ни разу?

BIOS на мат.плату последний стоит.

не понятно, почему этого раньше не было (пару месяцев назад) а сейчас появилось.

Раньше этой ошибки точно не было. Появилась она недавно.

Три вопроса тогда.

За эти два месяца обновлял ли ядро?

Перепрошивал ли биос?

В простое посмотри будут ли сыпаться логи, когда температура проца минимальна.

И под нагрузкой посмотри, есть ли разница.

Попробуй разные ядра.

Возьми лайв твоего дистрибутива и с него посмотри как будет ситуация развиваться.

За эти два месяца обновлял ли ядро?

Да, все официальные арчевовские ядра обновлял своевременно.

Да, пробовал 4 последние версии биоса, в том числе тот, на котором ошибки тогда давно не было. Но на всех них ошибка воспроизводится сейчас.

Нет, вот сейчас протестю.

Я вот вспомнил, что вроде это появилось после обновления amd-ucode какой-то версии.

Если таким сыпет, action как раз явно required. Игнорировать можно было бы, если бы это была одна такая ошибка за месяц.

Ясно. Инет даёт кучу мнений по этим ошибкам, начиная от битых планок оперативки до хардварных проблем с деградацией процессора в силу его перегрева — на сайте амд есть топик, где у 5-6х человек такие же проблемы. Кому-то помогает перепрошивка биоса, кому-то проверка power supply voltages, кому-то простая чистка кулера с заменой термопасты, а кому-то даже замена процессора по гарантии.

вроде это появилось после обновления amd-ucode какой-то версии

Поэтому-то и нужно тестировать разными версиями ос/ядра/лайв, чтобы убедиться, что проблема не софтварная, а хардварная.

В общем.
* Отключил XPM — все тоже самое.
* Пробовал загрузиться с systemrescuecd — и уже в начале загрузки увидел тоже самое сообщение с ошибкой.
* Прогнал через memtest — ошибок нет. Скрин https://lostpic.net/image/y6LY

Какие еще будут предположения?

Прогнал через memtest — ошибок нет.

Ошибка (скорректированная) не в памяти, а в кеше L1 (который индивидуальный для каждого ядра) [Hardware Error]: cache level: L1, tx: DATA

Это либо «надо менять железо», либо кто-то умышленно портит кеш, не заботясь о коррекции ошибок (всякий микрокод, хрен-пойми чем занимающийся), либо неправильно читаются и интерпретируются сообщения об ошибках и состоянии процессора.

ps Есть ли гарантия на проц?

mcelog: ERROR: AMD Processor family 23: mcelog does not support this processor. Please use the edac_mce_amd module instead. CPU is unsupported

гарантия на проц до 11.05.2021

Загрузился с Ubuntu 20.04 и вижу:

По всей видимости, проблема аппаратная.
Даже не знаю, что еще и попробовать? Обнулить BIOS/UEFI? Но вроде я это делал.

А как по гарантии сдавать? Проблем ведь явных никаких нету.
Да и как мне несколько месяцев без проца сидеть?

mcelog does not support this processor.

Please use the edac_mce_amd module instead

Ты читать умеешь? О чем это говорит? О том что надо верить сообщениям об ошибках, которые не поддерживаются? Верить неверным?

Это запланированная деградация, сынок

Запроектированное саморазрушение сработало чуть раньше установленного срока

Предполагалось, что ЦА процессоросодержащих подделок никогда не посмотрит в лог и не станет разбираться в причинах

Но не волнуйся, они учтут свой промах, никакая информация об ошибках больше выводиться не будет…

ну поидее запрашиваешь RMA описываешь проблему, тебе говорят окей вот таой порядок действий и там либо дают проц заглушку взамен этого на время разбирательств, либо сразу меняют на новый.

Так это точно является гарантийным случаем?
На что это вообще влияет? На производительность, безопасность, стабильность?
Мне _очень_ не хочется разбирать комп до проца.

является ли это гарантийным случаем тебе должны сказать в ответ на твой RMA запрос..

я не совсем понял: кому и куда писать этот запрос?

начинаешь с продавца который выдал тебе гарантию и идёшь вверх по лесенке до производителя.

Так а это точно аппаратная проблема с процом, а не мат. платой там? Оперативкой? Может ли быть такое из-за перегрева, к примеру? Неподходящего блока питания?

Может ли быть такое из-за перегрева, к примеру? Неподходящего блока питания?

У тебя гарантия на весь комп или на запчасти?
Если на весь комп — то какая разница, если есть гарантия?!
Если на запчасти — то тогда действительно попробуй сменить временно проц на другой.

а это точно аппаратная проблема с процом

чтобы сказать наверняка, нужно сделать выемку твоего проца и протестировать в 100%-но исравном аппратном окружении. если будешь свой проц отдавать в сервис, они будут твой проц таким образом тестировать на своем оборудовании.

поэтому тебе выше вроде и рекомендовали сделать тесты памяти. хоят маловероятно, что память.

Может ли быть такое из-за перегрева, к примеру?

да, может. поэтому тебе выше опять же рекомендовали потестить проц холодным и под нагрузкой. охлади его как следует и потестируй. и поэтому тебе рекомендовали прочистить кулер и заменить термопасту. ты это сделал?

конечно. тебе опять же выше кто-то писал про вольтаж. может быть в нём дело. причин может быть масса.

а может быть вообще твой проц когда-то перегрелся и начал дегенирировать. такое тоже бывает. опять же надо тестить.

отдай проц по RMA, напиши заявку, укажи все странности и жди ответа от сервис центра.

поэтому тебе выше вроде и рекомендовали сделать тесты памяти. хоят маловероятно, что память.

Да, память гонял. Никаких проблем не было.

рекомендовали потестить проц холодным и под нагрузкой

Эта ошибка возникает при запуске компа на холодную. То есть когда он всю ночь был выключен.

поэтому тебе рекомендовали прочистить кулер и заменить термопасту. ты это сделал?

Компу 9 месяцев. Покупал все новое. Перегрева никакого нету. Ни под нагрузкой, ни без нее. Играл в 3Д-игры по-многу часов — никаких проблем не было. Ни по производительности, на по стабильности.

конечно. тебе опять же выше кто-то писал про вольтаж

Гляну в биосе, но вроде все нормально там было.

а может быть вообще твой проц когда-то перегрелся и начал дегенирировать. такое тоже бывает. опять же надо тестить.

Маловероятно. Я его сильно никогда не гонял.

У меня появилась еще идея по оффтопиком проверить на эту ошибку. Какой тулзой это можно сделать? Плюс бенчмарки погонять можно.

Меня смущает что есть _только_ эта ошибка в логе. Других никаких проявлений нету.

Как и оказалось, под офтопиком точно такая же проблемa. https://lostpic.net/image/y66R

Вывешиваю решение для тех, кто сталкивается с таким же багом в ОС:
1. в BIOS заходите на страницу усовершенствованных вариантов технологии энергосбережения процессора.
2. Отключаете функцию CPU EIST Function
3. Отключаете функцию CPU Internal Thermal Control
4. Отключаете функцию CPU Enhanced Halt (C1E)
5. Переходите на страницу управления питанием материнской платы
6. Отключаете все C-States
7. Перезагружаетесь с сохранением настроек.

Я поотключал все что можно в настойках CPU, разгона и прочих устройств, но к успеху это не привело.

собственно это оказалось реально проблема с напряжением процессора , а не ПО , хотелось бы узнать как правильно настроить биос , в том числе vcore в данный момент я включил в биосе MCE , load linde calibration — extreme , load line AC DC — extreme + выключены c-state и intel shift technology

Источник

  • Remove From My Forums
  • Вопрос

  • Сервер WIN 2008 R2 Standart, Motherboard TYAN S8230GM4NR, CPU — AMD Opteron 6172, RAM 32 GB

    После установки обновлений в системе начала появляться ошибка WHEA-Logger error code 47

    Согласно MSDN ошибка памяти, память полностью заменили, но на ошибку это не повлияло, после перезагрузки ошибка исчезает, но через 2-3 часа работы появляется снова, обновление BIOS и перенастройка схемы электропитания результатов не дали, после появления
    ошибки постепенно падает производительность системы с последующим зависанием сервера, при этом на win 2003 r2 этот же сервер работает нормально без сбоев, лицензия позволяет перейти на 2003-й, но по ряду причин это не возможно. До установки обновлений
    проблемы не было.

    Код ошибки:

    Произошла устранимая аппаратная ошибка.

    Компонент: память
    Источник ошибки: Исправленная ошибка проверки компьютера

    [ Name] Microsoft-Windows-WHEA-Logger
    [ Guid] {C26C4F3C-3F66-4E99-8F8A-39405CFED220}
    Keywords 0x8000000000000000
    [ SystemTime] 2012-08-18T12:31:11.797962000Z
    [ ActivityID] {83A563F9-DA85-4948-8715-9B573D980251}
    [ ProcessID] 800
    [ ThreadID] 7256
    FRUId {00000000-0000-0000-0000-000000000000}
    PhysicalAddress 0x2e1162be0
    RawData 435045521002FFFFFFFF03000200000002000000690300000A1F0C0012080C140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F89063D840285F66CD01000000000000000000000000000000000000000000000000580100004900000001020000010000001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E80000000000000000000000000000000002000000000000000000000000000000000000000000000002000000000000000000000000000000E02B16E102000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000007F010000000000000002040000030000910F100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000200000060A118593D7DCD01000000000000000000000000000000000000000004000000130A0800004004D4E02B16E10200000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

Ответы

  • Судя по информации из сообщения у Вас исправимая машинная ошибка, обнаруженная  в процессоре.

    Обращайтесь к поставщику сервера. MS за ваше битое железо не отвечает.


    Слава России!

    • Помечено в качестве ответа

      28 сентября 2012 г. 9:02

  • Из вашей ссылки:

    Beginning with Windows Server 2008 and Windows Vista SP1, when a hardware error occurs, the operating system creates an

    error record that describes the error condition and sends an event tracing for Windows (ETW) event that contains the error record to user mode.

    Именно поэтому

    … при этом на win 2003 r2 этот же сервер работает нормально без сбоев

    На Windows Server 2003 R2 точно не отмечается никаких внешних проявлений проблемы? Вы проверяли на 32- или на 64-битном Windows Server 2003?

    • Изменено
      osr_MVP
      11 сентября 2012 г. 7:09
    • Помечено в качестве ответа
      Yuriy Lenchenkov
      28 сентября 2012 г. 9:02

My HP Z820 workstation (BIOS v. 3.52) encounters prolonged periods of extremely frequent (several times each second) System Warnings in Windows 7 64-bit Event Viewer: (here is part of it)

Log Name:      System
Source:        Microsoft-Windows-WHEA-Logger
Date:          03/01/2014 18:11:16
Event ID:      47
Task Category: None
Level:         Warning
Keywords:     
User:          LOCAL SERVICE
Computer:      ******
Description:
A corrected hardware error has occurred.

Component: Memory
Error Source: Corrected Machine Check

 When it first happened in June 2013 it lasted for more than a month. The System Event Viewer archive filled up with all those repeated warnings (>100 GBytes in all!). Sometimes it was accompanied by BIOS error messages during start-up:

942 Memory Training Error DIMM 8 on CPU1 experienced an error during training (Code 301C).

It offered to press F1 to boot.

Then the Z820 began failing to boot or restart, and finally HP local support replaced 2 of my four 8-GByte memory units. It helped for a few months.

Last week WHEA-logger Event ID: 47 reappeared in full presence and already filled 1.7 GBytes of System Event Viewer archive. Sometimes it is inactive but then the warnings reappear. (without 942 errors this time… and no problem at boot time — yet.)

The Advisory blames Intel Xeon E7-8800/4800/2800 processors for this and offers a workaround by modifying «Minimum Processor Idle Power Package State — Package C3 State» Using the ROM-Based Setup Utility (RBSU) in the ProLiant DL580 G7 series servers BIOS.

So, my questions are:

1. Is the WHEA-logger Event ID: 47 in my Z820 related to the peculiar behavior of the dual Intel Xeon processors — in this case the initial E5-2670 type, not E7 — installed in Z820, and not a real memory hardware fault?

2. How do I apply this workaround in Z820 BIOS, where the BIOS Setup (F10) OS Power Management options are different from those in the HP Proliant Server Support Advisory?

Please advise.

My HP Z820 workstation (BIOS v. 3.52) encounters prolonged periods of extremely frequent (several times each second) System Warnings in Windows 7 64-bit Event Viewer: (here is part of it)

Log Name:      System
Source:        Microsoft-Windows-WHEA-Logger
Date:          03/01/2014 18:11:16
Event ID:      47
Task Category: None
Level:         Warning
Keywords:     
User:          LOCAL SERVICE
Computer:      ******
Description:
A corrected hardware error has occurred.

Component: Memory
Error Source: Corrected Machine Check

 When it first happened in June 2013 it lasted for more than a month. The System Event Viewer archive filled up with all those repeated warnings (>100 GBytes in all!). Sometimes it was accompanied by BIOS error messages during start-up:

942 Memory Training Error DIMM 8 on CPU1 experienced an error during training (Code 301C).

It offered to press F1 to boot.

Then the Z820 began failing to boot or restart, and finally HP local support replaced 2 of my four 8-GByte memory units. It helped for a few months.

Last week WHEA-logger Event ID: 47 reappeared in full presence and already filled 1.7 GBytes of System Event Viewer archive. Sometimes it is inactive but then the warnings reappear. (without 942 errors this time… and no problem at boot time — yet.)

The Advisory blames Intel Xeon E7-8800/4800/2800 processors for this and offers a workaround by modifying «Minimum Processor Idle Power Package State — Package C3 State» Using the ROM-Based Setup Utility (RBSU) in the ProLiant DL580 G7 series servers BIOS.

So, my questions are:

1. Is the WHEA-logger Event ID: 47 in my Z820 related to the peculiar behavior of the dual Intel Xeon processors — in this case the initial E5-2670 type, not E7 — installed in Z820, and not a real memory hardware fault?

2. How do I apply this workaround in Z820 BIOS, where the BIOS Setup (F10) OS Power Management options are different from those in the HP Proliant Server Support Advisory?

Please advise.

December 16 2014, 09:51

Category:

  • IT
  • Cancel

Проблемы с памятью

Добрый день, господа. Второй день мучаюсь проблемой:
имеется сервер с материнкой gigabyte GA-6PXSV3  (биос версии r8)  в нее воткнуты  4 планки памяти IBM 43W9453  по 8 гиг. на сервере: 2008r2  + MSSQL  с ббазой в 5 гиг и вебсервисом локальным, акронис 11.5

Когда все 4 планки установлены, при выполнении малейшей задачи (копирование файлов, запуск приложения и т.д.) начинает сыпаться ошибка памяти:

Event ID: 47  WHEA-Logger

A corrected hardware error has occurred.

Component: Memory

Error Source: Corrected Machine Check

The details view of this entry contains further information.

FRUId {00000000-0000-0000-0000-000000000000}
RawData 435045521002FFFFFFFF030002000000020000006903000019300F000F0C0E140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F890AAACCC877E18D001000000004552000000000000000000000000000000000000580100004900000001020000010000001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000200000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000057010000000000000002000000000000E4060300000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000040000000000000000000000000000000000000000000000000000000000000000000000000000000100000001000000F4C8FD8F7E18D001040000000000000000000000000000000000000007000000910001004000008C006684020000000086D25240210000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

Запись падает в лог сначала в виде предупреждения, потом в виде ошибки, потом, есесьна БСОД.
Когда убираешь 2 планки, (оставляешь 2 соответственно) -система работает на ура. данная ошибка проскакивает ОЧЕНь редко(но проскакивает) — от нагрузки не зависит.

Скьюлю использование памяти ограничено, установлены последние дрова на систему и все обновления,  потребление памяти и загрузка процессора — в низовых пределах.
Пробовал разные настройки биоса, разные режимы работы памяти ( мирроринг, индепендед  и т.д.), пробовал дефолтный биос, менял память местами, пробовал разщные слоты.
По советам из гоогления ставил настройки питания в хайперфоманс в системе и в биосе.
Мемтест86 и виндовый мемтест проходил для всей памяти сразу и по-отдельности —  без ошибок.
БП поменян на новый и более мощный.
Память резинками терта, на дефекты осмотрена  и слоты на материнке кисточками чищены и продуты.

Кто сталкивался с подобным? Это что? винда? железо? брак материнки, недостаточное питание памяти или несовместимость?

Зараннее спасибо.

Вдруг ни с того, ни с сего, посыпались в системный журнал основного КД ошибки, да не просто ошибки а с источником «WHEA-Logger», да с

событием номер 47.

Всё бы ничего, но описание ошибки напрягающее:

Произошла устранимая аппаратная ошибка. 
Компонент: память 
Источник ошибки: Исправленная ошибка проверки компьютера 

Так как описание говорит…мало, что говорит, то пришлось брать помощь гугла. Как ни странно, но проблема не редкая.

WHEA-logger — служба, предназначенная для мониторинга аппаратных неисправностей. То есть имеет место железная проблема.

Вот например на технете. Или
на hp.com. Ладно, не буду мутить
воду. Проблема заключается в неверно настроенном профиле питания процессора (после сброса биос на сервере HP DL120 его значение по-умолчанию — энергосбережение, power efficiency).

На сервере профиль питания должне быть каким? Правильно — High performance. Перезагрузка, настройка в биос параметра питания, загрузка и нет новых ошибок с таким источником:)

Tags: windows, Server, косяки, 2008, 2014, WHEA-logger, 47, R2

0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

1

Произошла устраненная аппаратная ошибка

21.07.2022, 18:19. Показов 3560. Ответов 44


Студворк — интернет-сервис помощи студентам

Приветствую. Без воды сразу рассказываю.
В журнале событий сыпятся «предупреждения» по несколько раз в секунду.

Произошла устраненная аппаратная ошибка

Сообщивший компонент: ядро процессора
Источник ошибки: Unknown Error Source
Тип ошибки: Bus/Interconnect Error
ИД APIC процессора: 0

Дополнительные сведения содержатся в подробностях этой записи.

— System

— Provider

[ Name] Microsoft-Windows-WHEA-Logger
[ Guid] {c26c4f3c-3f66-4e99-8f8a-39405cfed220}

EventID 19

Version 0

Level 3

Task 0

Opcode 0

Keywords 0x8000000000000000

— TimeCreated

[ SystemTime] 2022-07-21T14:51:02.8607271Z

EventRecordID 35579

— Correlation

[ ActivityID] {57a25031-b53f-426e-a740-393a144de8e0}

— Execution

[ ProcessID] 1920
[ ThreadID] 1700

Channel System

Computer WSWS9090

— Security

[ UserID] S-1-5-19

— EventData

ErrorSource 0
ApicId 0
MCABank 27
MciStat 0x982000000002080b
MciAddr 0x0
MciMisc 0xd01a0ffe00000000
ErrorType 10
TransactionType 256
Participation 0
RequestType 0
MemorIO 2
MemHierarchyLvl 3
Timeout 0
OperationType 256
Channel 256
Length 1163
RawData 435045521002FFFFFFFF040002000000020000008B04000002330E00150716140000000000000000 000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131 B248949139377F4BA8F1E0062805C2A3DC39439B0E9DD80100000000000000000000000000000000 0000000000000000A0010000C00000000003000001000000ADCC7698B447DB4BB65E16F193C4F3DB 00000000000000000000000000000000020000000000000000000000000000000000000000000000 60020000E00000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000 00000000000000000200000000000000000000000000000000000000000000004003000024010000 0003000000000000011D1E8AF94257459C33565E5CC3F7E800000000000000000000000000000000 02000000000000000000000000000000000000000000000064040000270000000003000000000000 A13248C3C302524CA9F19F1D5D7723FC000000000000000000000000000000000300000000000000 000000000000000000000000000000007F010000000000000002040000030000100FA20000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 000000000000000007010000000000000000000000000000100FA20000080C000B32F87EFFFB8B17 0000000000000000000000000000000000000000000000000000000000000000B3F8F31CB1C5A249 AA595EEF92FFA63C01000000000000009E07C0000400000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 01000800800100000000000000000000000000000000000000000000000000000300000002000000 8940F74B119DD80100000000000000000000000000000000000000001B0000000B08020000002098 000000000000000000000000FE0F1AD00A00000000000000000500002E0001000100025A00000000 7D000000270000000000000000000000000000000000000000000000000010000000000000001000 000000000000100000000000000010003B0000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000010000000000000000000000FF00000000000000000000000000000000000000000000 000000

— <Event xmlns=»http://schemas.microsoft.com/win/2004/08/events/event»>
— <System>
<Provider Name=»Microsoft-Windows-WHEA-Logger» Guid=»{c26c4f3c-3f66-4e99-8f8a-39405cfed220}» />
<EventID>19</EventID>
<Version>0</Version>
<Level>3</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime=»2022-07-21T14:51:02.8607271Z» />
<EventRecordID>35579</EventRecordID>
<Correlation ActivityID=»{57a25031-b53f-426e-a740-393a144de8e0}» />
<Execution ProcessID=»1920″ ThreadID=»1700″ />
<Channel>System</Channel>
<Computer>WSWS9090</Computer>
<Security UserID=»S-1-5-19″ />
</System>
— <EventData>
<Data Name=»ErrorSource»>0</Data>
<Data Name=»ApicId»>0</Data>
<Data Name=»MCABank»>27</Data>
<Data Name=»MciStat»>0x982000000002080b</Data>
<Data Name=»MciAddr»>0x0</Data>
<Data Name=»MciMisc»>0xd01a0ffe00000000</Data>
<Data Name=»ErrorType»>10</Data>
<Data Name=»TransactionType»>256</Data>
<Data Name=»Participation»>0</Data>
<Data Name=»RequestType»>0</Data>
<Data Name=»MemorIO»>2</Data>
<Data Name=»MemHierarchyLvl»>3</Data>
<Data Name=»Timeout»>0</Data>
<Data Name=»OperationType»>256</Data>
<Data Name=»Channel»>256</Data>
<Data Name=»Length»>1163</Data>
<Data Name=»RawData»>435045521002FFFFFFFF040002000000020000008B04000002330E00150716140 000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB 3C41F732CB57131B248949139377F4BA8F1E0062805C2A3DC39439B0E9DD80100000000000000000 0000000000000000000000000000000A0010000C00000000003000001000000ADCC7698B447DB4BB 65E16F193C4F3DB00000000000000000000000000000000020000000000000000000000000000000 00000000000000060020000E00000000003000000000000B0A03EDC44A19747B95B53FA242B6E1D0 00000000000000000000000000000000200000000000000000000000000000000000000000000004 0030000240100000003000000000000011D1E8AF94257459C33565E5CC3F7E800000000000000000 00000000000000002000000000000000000000000000000000000000000000064040000270000000 003000000000000A13248C3C302524CA9F19F1D5D7723FC000000000000000000000000000000000 300000000000000000000000000000000000000000000007F0100000000000000020400000300001 00FA2000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000007010000000000000000000000000000100FA20000080C000 B32F87EFFFB8B170000000000000000000000000000000000000000000000000000000000000000B 3F8F31CB1C5A249AA595EEF92FFA63C01000000000000009E07C0000400000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000001000800800100000000000000000000000000000000000000000000000000000 3000000020000008940F74B119DD80100000000000000000000000000000000000000001B0000000 B08020000002098000000000000000000000000FE0F1AD00A00000000000000000500002E0001000 100025A000000007D000000270000000000000000000000000000000000000000000000000010000 000000000001000000000000000100000000000000010003B0000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000010000000000000000000000FF00000000000000000000000000000 000000000000000000000</Data>
</EventData>
</Event>

Предупреждения эти начинают появляться если частоту оперативной памяти выставлять на 3933 или 4000 Mhz. Если частота выставлена на 3866 или любая ниже этой, то никаких предупреждений не появляется.
Кто-нибудь может разъяснить что значат эти предупреждения и влияют ли эти множества аппаратных ошибок, которые исправляет процессор на производительность и стабильность системы.
Просто система ведь запускается с частотами оперативки 3933 и 4000 и проходит тесты.

Спеки ПК :
B550M AORUS PRO-P (Rev. 1.0)
R5 5600x
Crucial Ballistix White [BL2K8G36C16U4W] 16 ГБ

Миниатюры

Произошла устраненная аппаратная ошибка
 



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 18:58

 [ТС]

2

Извиняюсь , не знаю как отредактировать. Там где указано 2000 Mhz , должно быть 4000



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

21.07.2022, 20:10

3

S1m0n толку мало с этого . Лучше полный конфиг напишите — откуда дрова брали , какие напруги и частоты стоят .



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 21:25

 [ТС]

4

Wadim_Ymniy, с чего мало толка ? Дрова на что , на оперативку ? ))



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

21.07.2022, 21:26

5

А напруги может уже напишите наконец и тайминг какие ставите ?



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 21:26

 [ТС]

6

Wadim_Ymniy, все дрова с оффсайтов гигабайт и амд



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

21.07.2022, 21:27

7

Там где указано 2000 Mhz , должно быть 4000

ты часом реальную частоту с эффективной не попутал ?



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 21:38

 [ТС]

8

Wadim_Ymniy, включён XMP профиль. Напряжение на оперативку стоит на авто ( 1,38 ). Тайминги не трогал вообще , они тоже от XMP , сейчас не за компом , точно не помню , но вроде 16-18-18-36 CR1.
UCLK == MEMCLK.

Добавлено через 4 минуты
Wadim_Ymniy, говорю же с частотой отпечатался.
Максимум что я сделал с оперативкой , это включил XMP профиль ( по умолчанию это на 3600 Mhz ) , ну потом пробовал поднимать частоту оперативки и Инфинити фабрик



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 21:41

 [ТС]

9

Вот для наглядности

Миниатюры

Произошла устраненная аппаратная ошибка
 



0



4721 / 2366 / 480

Регистрация: 09.09.2017

Сообщений: 8,700

21.07.2022, 22:08

10

Цитата
Сообщение от S1m0n
Посмотреть сообщение

Вот для наглядности

Тайминги для такой частоты малы.

Цитата
Сообщение от S1m0n
Посмотреть сообщение

ну потом пробовал поднимать частоту оперативки и Инфинити фабрик

Увеличивать надо и тайминги. А чтобы не делать наобум, есть DRAM Calculator for Ryzen.



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 22:31

 [ТС]

11

ibarg, то есть думаете это огромное количество предупреждений только лишь из за таймингов памяти ?



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

21.07.2022, 22:34

12

Да реально — тайминги подозрительно низкие : если это не ОЗУ от Г.скилл за овер 30+ тысяч , то фига с два они на 18 таймингах на 4000 работать будут и не факт что КП процессора сможет .



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 22:47

 [ТС]

13

Wadim_Ymniy, потому что это крушиал баллистикс на чипах micron e-die. Эти планки могут и на 4400 работать с таймингами ниже моих



0



4721 / 2366 / 480

Регистрация: 09.09.2017

Сообщений: 8,700

21.07.2022, 22:54

14

Цитата
Сообщение от S1m0n
Посмотреть сообщение

огромное количество предупреждений только лишь из за таймингов памяти ?

Может быть. Может и контроллер памяти дает сбои из-за высокой частоты. Может по совокупности.

Добавлено через 6 минут

Цитата
Сообщение от S1m0n
Посмотреть сообщение

Эти планки могут и на 4400 работать с таймингами ниже моих

Могут, но только с делителем частоты контроллера памяти.



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

21.07.2022, 22:58

 [ТС]

15

ibarg,

только с делителем частоты контроллера памяти.

А в чем разница , если не сложно объяснить ?



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

21.07.2022, 23:43

17

потому что это крушиал баллистикс на чипах micron e-die. Эти планки могут и на 4400 работать

не факт что мать/процц даже с делителем справятся — тут кому как везёт



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

22.07.2022, 00:32

 [ТС]

18

ibarg, Wadim_Ymniy, у меня XMP профиль на 3600 MHz. Если я допустим хочу частоты выше , чем XMP и с помощью Dram калькулятора определю нужные тайминги. Вопрос !! Нужно ли отключать XMP и выставлять частоты , тайминги или неважно включён он будет или нет ?



0



Дно пробито

4580 / 2759 / 377

Регистрация: 07.10.2020

Сообщений: 19,228

22.07.2022, 00:48

19

ХМП это предустановка — а тебе нужен кастмный рофиль .



0



0 / 0 / 0

Регистрация: 05.06.2020

Сообщений: 141

22.07.2022, 00:56

 [ТС]

20

Wadim_Ymniy,

не факт что мать/процц даже с делителем справятся

мать , кстати , поддерживает до 4400 , ну а райзенам как известно всем нужна высокая частота как минимум 3800.

Добавлено через 2 минуты
Wadim_Ymniy,

ХМП это предустановка — а тебе нужен кастмный рофиль .

я понимаю что такое XMP. Но играть с частотой и таймингами можно и с включённым профилем XMP и с выключенным , по крайне мере на моей материнке. Так вот и спрашиваю есть разница , если он будет вкл / откл , когда я хочу выставить частоты выше ?!



0



WHEA Logger: что это значит и как это исправить

ПК с Windows является продвинутым и имеет множество компонентов, которые делают его пригодным для различных целей. Однако есть несколько проблем, с которыми пользователи могут столкнуться при использовании своего ПК. WHEA Logger — это недавняя ошибка, распространенная среди пользователей Windows, обычно сопровождаемая многочисленными идентификаторами событий.

Архитектура аппаратных ошибок Windows (WHEA) — это компонент ПК с Windows, который инициирует событие трассировки событий для Windows (ETW) всякий раз, когда возникает аппаратная ошибка. Он записывает эти аппаратные ошибки в журнал системных событий всякий раз, когда они происходят.

Кроме того, WHEA Logger документирует описания многочисленных событий аппаратных ошибок, вызванных WHEA, что облегчает пользователям обнаружение ошибки. Кроме того, события аппаратных ошибок можно получить, запросив журнал системных событий или получив уведомление о событии из приложения.

Однако регистратор аппаратных ошибок Windows (WHEA) записывает аппаратные события, захваченные операционной системой. Затем он отображает их в средстве просмотра событий, используя идентификаторы событий, чтобы четко идентифицировать их на вашем ПК.

Каковы причины появления идентификаторов событий WHEA Logger?

Поскольку события ошибок WHEA сопровождаются разными идентификаторами событий, такими как 1, 17, 18, 19, 47 и т. д., они могут возникать по разным причинам. Некоторые:

  • Аппаратные сбои. Вы можете столкнуться с ошибками WHEA из-за аппаратных сбоев, таких как сбои жесткого диска, сбои памяти, проблемы с процессором и другие. Они не позволяют системе обмениваться данными с работающим оборудованием, что приводит к ошибкам.
  • Проблемы с системным драйвером. Если на вашем компьютере установлены устаревшие или поврежденные драйверы, это также может вызвать ошибки WHEA. Эти драйверы отвечают за аппаратное обеспечение вашего ПК, поэтому система может работать со сбоями, если они повреждены или недоступны.
  • Проблемы с электропитанием и перегрев. Система может работать со сбоями при нестабильном электропитании. Это может препятствовать работе оборудования, лишая его доступа к достаточной мощности для работы. Также перегрев может привести к неисправности компонентов ПК.

Другие факторы, не перечисленные выше, могут быть причиной ошибок WHEA. Тем не менее, мы обсудим некоторые исправления, чтобы решить их и заставить вашу систему работать правильно.

Как я могу исправить WHEA Logger?

Прежде чем приступать к каким-либо дополнительным действиям по устранению неполадок, попробуйте выполнить следующие действия.

  • Убедитесь, что вы подключили систему к стабильному источнику питания.
  • Отключите фоновые приложения, работающие на вашем ПК.
  • Временно отключите антивирусное программное обеспечение на вашем компьютере.
  • Перезапустите Windows в безопасном режиме и проверьте, сохраняется ли проблема.

Если вышеуказанные шаги бесполезны, перейдите к решениям, приведенным ниже:

Исправить идентификатор события WHEA-Logger 1

1. Запустите SFC и DISM для восстановления поврежденных системных файлов.

  1. Щелкните левой кнопкой мыши кнопку «Пуск», введите «Командная строка» и выберите параметр «Запуск от имени администратора».
  2. Нажмите «Да» в ответ на запрос контроля учетных записей (UAC).
  3. Введите следующее и нажмите Enter : sfc /scannow
  4. Введите следующее и нажмите Enter после каждого: DISM /Online /Cleanup-Image /RestoreHealth
  5. Перезагрузите компьютер и проверьте, сохраняется ли идентификатор события WHEA Logger 1.

Запуск сканирования SFC обнаружит и восстановит поврежденные системные файлы, которые могут вызвать проблемы с оборудованием на вашем ПК.

Исправить идентификатор события WHEA-Logger 17

2. Обновите ОС Windows

  1. Нажмите Windows + I, чтобы открыть приложение «Параметры Windows».
  2. Щелкните категорию Центра обновления Windows и выберите Проверить наличие обновлений. Дождитесь результата обновления Windows и нажмите «Установить обновление», если доступно обновление Windows.
  3. Перезагрузите компьютер.

При обновлении ОС Windows будут установлены новые обновления и исправления для исправления ошибок, затрагивающих текущую версию. Кроме того, это может решить проблемы с совместимостью оборудования, вызвавшие появление события WHEA Logger с идентификатором 17 в средстве просмотра событий.

Исправить идентификатор события WHEA-Logger 18

3. Используйте командную строку средства устранения неполадок оборудования.

  1. Щелкните левой кнопкой мыши кнопку «Пуск», введите «Командная строка» и выберите параметр «Запуск от имени администратора».
  2. Нажмите «Да» в ответ на запрос контроля учетных записей (UAC).
  3. Введите следующее и нажмите Enter , чтобы запустить средство устранения неполадок оборудования и устройств Windows: mysdt.auxiliary diagnostic device
  4. Нажмите «Далее», чтобы продолжить процесс анализа и устранения неполадок.

Исправить идентификатор события WHEA-Logger 19

4. Обновите драйверы клавиатуры.

  1. Нажмите клавиши Windows +, R чтобы открыть окно «Выполнить», введите devmgmt.msc и нажмите «ОК», чтобы открыть диспетчер устройств.
  2. Разверните запись «Клавиатура» для обновления, щелкните устройство правой кнопкой мыши и выберите «Обновить драйвер» в раскрывающемся меню.
  3. Нажмите «Автоматический поиск», чтобы найти обновленный вариант программного обеспечения драйвера.
  4. Повторите процедуру для других драйверов на вашем ПК.

Обновление драйверов устройств на вашем ПК исправит ошибки, затрагивающие устройство, и установит новые функции для повышения его производительности.

Исправить идентификатор события WHEA-Logger 47

5. Запустите утилиту проверки диска

  1. Щелкните левой кнопкой мыши кнопку «Пуск», введите «Командная строка» и выберите параметр «Запуск от имени администратора».
  2. Нажмите «Да» в ответ на запрос контроля учетных записей (UAC).
  3. Введите следующую команду и нажмите Enter : CHKDWe C:/r/x
  4. Закройте командную строку и перезагрузите компьютер, чтобы проверить, сохраняется ли событие WHEA Logger с идентификатором 47.

Выполнение команды CHKDWe позволяет системе получить контроль над диском и проверить наличие проблем с оборудованием.

Не стесняйтесь сообщить нам, какое решение сработало для вас, в разделе комментариев ниже.

Столкнувшись с более или менее серьезным сбоем в работе системы, не будет лишним внимательно изучить логи Журнала событий, нередко содержащие важные подсказки, увы, сохраненные в них события далеко не всегда бывают очевидными, как например, ошибки WHEA Logger, которые могут иметь разные коды и разные описания, причем ошибка с одним и тем же кодом в разных случаях часто имеет разные причины.

Появление в Журнале события ошибки WHEA Logger практически всегда указывает на проблемы в работе оборудования или его драйверов. Ошибки WHEA могут иметь описания «Неустранимая аппаратная ошибка» и «Устранимая аппаратная ошибка»: в первом случае их причиной, скорее всего, являются аппаратные неполадки, во втором — неполадки в работе драйверов устройств, но это необязательно. Также ошибки WHEA Logger могут иметь косвенные причины, например, некорректные настройки разгона CPU, GPU или RAM, перегрев компонентов, сбои в работе электропитания. 

Давать какие-то конкретные советы по устранению ошибок WHEA Logger довольно трудно, поскольку причины ошибки, как уже было сказано, могут быть самые разные. В таких случаях можно порекомендовать внимательно изучить лог, в частности обратить внимание на такие параметры как:

 Компонент или Сообщивший компонент. Может содержать прямое указание на некорректно работающее устройство, например, “Ядро процессора”, “Память”, “Порт PCI Express Root” (возможно, один из интерфейсов материнской платы) и так далее. 

 ID поставщика. ID устройства. Идентификаторы можно использовать для поиска устройств в Интернете, сформировав запрос типа “VendorID 0x0000” и “DeviceID 0x0000”, где 0x0000 — идентификатор поставщика и устройства.

Идентифицировать вызывающее ошибку устройство — значить решить половину задачи, по крайней мере, вы будете знать, с чем работать. Если проблемное устройство определить не удалось, можем порекомендовать выполнить ряд следующих действий, возможно, что-то из предложенного решит вашу проблему.

1. На некоторых компьютерах, особенно старых, ошибку WHEA Logger может вызывать функция быстрого запуска, включенная по умолчанию в Windows 8.1, 10 и 11. Отключите ее, перезагрузите компьютер и понаблюдайте за поведением системы. 

2. Если незадолго до появления проблемы вы выполняли разгон любых аппаратных компонентов, восстановите их конфигурацию по умолчанию. В той же мере это касается программного обеспечения, изменяющего параметры работы любых устройств, начиная от процессора и ОЗУ и заканчивая кулерами. 

3. Установите оригинальные драйвера чипсета и других устройств, скачав их с сайта производителя. Если вы испытываете трудности с поиском и установкой драйверов в ручном режиме, воспользуйтесь специальными менеджерами типа Driver Booster.

4. Выполните диагностику основных аппаратных компонентов доступными средствами Windows или сторонними утилитами. Проверьте на предмет ошибок оперативную память, жесткий диск, определите температуру CPU, GPU, диска и сравните полученные данные с нормальными показателями. Отдельного внимания заслуживает блок питания, на неисправности которого могут указывать внезапные отключения компьютера при повышении нагрузки на оборудование (запуск игр, эмуляторов, выполнение тестов, просмотр видео высокого разрешения), включение компьютера не с первого раза.

В качестве дополнительных мер можно порекомендовать проверку целостности системных файлов, а также откат к точке восстановления, на момент создания которой проблем в работе Windows замечено не было.

In this post, we look at what are the WHEA-Logger Fatal hardware and Event ID Errors as well as the associated fixes for affected PC users that may encounter the issue on their Windows 11 or Windows 10 computer.

Fix WHEA-Logger Fatal hardware and Event ID Errors

What are the WHEA Error Event Logs?

The Windows Hardware Error Architecture (WHEA) Logger is an automated service that detects hardware errors and generates Event Tracking for Windows events when such an error occurs. The system log then records these hardware errors which can be reviewed for troubleshooting purposes. The WHEA-Logger events are simply generic error codes and only indicate that there might be a hardware or driver problem.

Apart from the system crash, this event can be logged or the issue can also normally happen after a system sleep or restart, right after boot, or even while the computer is idle. Typically, you may see the following generic or specific error message in Event Viewer depending on the hardware throwing the error:

A fatal hardware error has occurred. A record describing the condition is contained in the data section of this event.

A corrected hardware error has occurred.
Reported by component: Processor Core
Error Source: Unknown Error Source
Error Type: Cache Hierarchy Error
Processor APIC ID: 0
The details view of this entry contains further information.

A fatal hardware error has occurred.
Reported by component: Processor Core
Error Source: Machine Check Exception
Error Type: Cache Hierarchy Error
Processor APIC ID: 0
The details view of this entry contains further information.

From the above error messages, you can see the processor or CPU is identified as the hardware causing the issue for the second and third instances of the error. Investigations revealed that these errors are usually related to the Kernel-Power events like the Kernel-Power Event ID 41 Task 63, Event ID 55 Kernel-Processor-Power errors on Windows PC.

If your Windows 11/10 computer keeps crashing and in Event Viewer you see the WHEA-Logger Fatal hardware with the associated Event ID 1, 17, 18, 19, 46, or 47 logged, then the generic fixes we have presented below in no particular order can be applied to resolve the issue on your system.

  1. Initial checklist
  2. Check the RAM modules
  3. Identify and manually update the faulty hardware driver
  4. Disable AMD or ATI External Events Utility (if applicable)
  5. Replace your motherboard and/or CPU

Let’s see these applicable fixes in detail.

1] Initial checklist

Initial checklist - Update BIOS

  • Make sure Windows is updated to the latest version/build. Check for available BIOS updates and do the needful. Also make sure all drivers, especially the chipset drivers are updated on your system. In addition, you may have to troubleshoot in the Clean Boot state.
  • For some affected PC users, they reported that disabling the C-state in BIOS did resolve the issue. To perform this task, you will need to check with your PC manufacturer to know the correct process to disable the C-state in BIOS as different brand computers may have a different process to disable the C-state in BIOS. Note that hibernation doesn’t work when this setting is disabled, but Sleep does.
  • Uninstall NVIDIA GeForce Experience software. As strange as it might seem, reportedly this worked for some affected PC users. So, you can give the fix a try if it applies to your circumstance whereby you have an NVIDIA GPU installed on your system.

Read: Event ID 154, The IO Operation failed due to a hardware error

2] Check the RAM modules

Check the RAM modules - Memtest Windows

Make sure you have installed the supported memory modules for your computer. If you have already, then you can run the Memtest86+ tool to test your RAM. Depending on the outcome of the memory test, if it’s a case of bad RAM, then you will have to replace the RAM modules. Otherwise, you can just reseat the module(s) and see if that solves the WHEA Logger Fatal hardware and Event ID errors on your Windows 11/10 system.

Read: MEMORY_MANAGEMENT 0x0000001A error

3] Identify and manually update the faulty hardware driver

Identify and manually update the faulty hardware driver - Driver Verifier utility

First, you can run Driver Verifier, a utility built into the Windows OS that will often find the driver/drivers that are the underlying cause of BSOD/crashes. If you have taken the necessary actions regarding the driver(s) that were identified, but the issue persists, then you can follow the steps below to specifically identify and manually update the problematic hardware driver.

  • Open Event Viewer.
  • Navigate to the Windows Event Logs/System.
  • Locate and view the WHEA-Logger errors. The Event ID could be any of the numbers we have identified above or any other number.
  • Double-click on the error in the logs then click on the DETAILS tab.
  • Expand the SYSTEM details.
  • Now, look specifically for BUS, DEVICE, and FUNCTION numbers to identify which item in the Device Manager is causing the problem.
  • Leave Event Viewer open, and now open Device Manager.
  • Scroll down to the System Devices section. You will probably see something similar to the following, but the numbers on the far right will differ. You could have one or more instances.
Intel(r)5520/5500/x58 i/o hub pci express root port 3- 340a
Intel(r)5520/5500/x58 i/o hub pci express root port 7- 340e
  • Double-click on each of these PCI Express Root Port items in Device Manager and note the location which will be something like this:
PCI bus 0, device 3, function 0.
  • Now, find the one that matches what you found in the Windows logs and cross reference the error in the Windows system log with the item in Device Manager with the same BUS, DEVICE, and FUNCTION location.
  • Double-click on that item and go to the Driver tab.
  • Click Update driver > Browse > Let me Choose.
  • From the compatible hardware driver list choose the PCI Express Standard Root Port driver.
  • Click Next to complete the driver update.

Repeat for each of the errors but only if they have a different BUS, DEVICE LOCATION. If they are all the same, then it is not necessary.

4] Disable AMD or ATI External Events Utility (if applicable)

Disable AMD or ATI External Events Utility

This fix applies if you have an AMD processor. To disable the AMD or ATI External Events Utility on your Windows 11/10 computer, follow these steps:

  • Press the Windows key + R to invoke the Run dialog.
  • In the Run dialog box, type services.msc and hit Enter to open Services.
  • In the Services window, scroll and locate the AMD External Events Utility service.
  • Double-click on the entry to edit its properties.
  • In the properties window, click the drop-down on the Startup type and select Disabled.
  • Next, click Stop under Service status to stop the service.
  • Click Apply > OK to save changes.

Check if the issue is resolved. Otherwise, try the next solution.

5] Replace your motherboard and/or CPU

At this point, if the issue persists, then it could be you have an unsupported or incompatible (it should be the one that shipped with the device or the exact replacement) MOBO and/or CPU, or it could be one or either of the hardware is faulty – if this is the case, then you will need to replace this hardware by a PC hardware technician. Otherwise, if you’re sure your motherboard and CPU are supported and compatible, then you can perform System Restore which will likely resolve the issue if it’s software related.

Hopefully, any of these suggestions should work for you!

What can cause a WHEA error?

Generally, a WHEA error indicates that a hardware issue has occurred on your Windows 11/10 computer. The known issues could be related to such things as device drivers, hard drives, processors, power supply, and bad or corrupted memory (DRAM). Hardware components contain error detection mechanisms that can detect when a hardware error condition exists – these errors can be classified as either corrected errors or uncorrected errors.

Related post: WHEA_UNCORRECTABLE_ERROR, 0x00000124 BSOD [Fixed].

Неисправимая ошибка Whea — это ошибка синего экрана, которая может появляться в любой версии Windows, включая последние.

Либо у вас аппаратный сбой, либо проблемы с драйверами, которые, вероятно, несовместимы с вашей операционной системой.

В любом случае вы не сможете использовать свой настольный ПК или ноутбук, пока не устраните проблему. Однако есть способы исправить неисправимую ошибку Whea, и это руководство покажет вам, как это сделать.

Каковы наиболее распространенные причины неисправимой ошибки Whea?

Это фатальная ошибка, и она может появиться из-за проблем как с оборудованием, так и с программным обеспечением. Наиболее распространенными причинами этой проблемы являются:

  • Настройки разгона
  • Проблемы с SSD
  • Жесткий диск не отвечает
  • Ваша оперативная память не отвечает
  • Ваша материнская плата работает неправильно

Хорошим сценарием может быть то, что после обновления вашего ПК некоторые драйверы на машине не будут работать должным образом. Но мы увидим, как проверить все это в уроке ниже.

Неисправимая ошибка Whea во время игры

WHEA (сокращение от Windows Hardware Error Architecture) была специально введена для системных ошибок, запускаемых аппаратным обеспечением.

Хотя существует множество потенциальных виновников, от конфликтов драйверов до неисправной оперативной памяти и всего, что между ними, геймеры являются особенно уязвимой категорией пользователей.

Таким образом, вы, скорее всего, столкнетесь с ошибкой Whea_Uncorrectable_Error во время игры просто потому, что вы склонны максимально нагружать свои процессорные и графические процессоры.

Разгон является обычным подозрением, но как насчет перегрева? Может ли перегрев вызвать неисправимую ошибку WHEA?

Абсолютно, на самом деле Whea Uncorrectable Error чаще появляется на устройствах с менее эффективной системой охлаждения, которая неправильно распределяет воздушный поток, необходимый для отражения негативного эффекта перегрева ЦП/низкого напряжения ЦП и разгона.

Излишне говорить, что вам лучше использовать программное обеспечение для мониторинга температуры процессора и графического процессора, чтобы в первую очередь избежать кодов остановки, таких как Whea_Uncorrectable_Error.

Каковы некоторые варианты стоп-кода неисправимой ошибки Whea?

  • WHEA_UNCORRECTABLE_ERROR Windows 10 sysprep
    • По словам пользователей, иногда эта ошибка может возникать при использовании sysprep.
  • Разгон WHEA_UNCORRECTABLE_ERROR
    • Многие пользователи сообщали, что эта ошибка начала появляться после разгона.
    • Чтобы решить эту проблему, попробуйте изменить или удалить настройки разгона.
  • WHEA_UNCORRECTABLE_ERROR hal.dll, ntoskrnl exe
    • В некоторых случаях эта ошибка может быть вызвана определенными файлами
  • WHEA_UNCORRECTABLE_ERROR перегрев
    • Если ваш компьютер перегревается, попробуйте почистить его или проверьте, правильно ли работает ваш вентилятор.
  • WHEA_UNCORRECTABLE_ERROR при запуске
    • Чтобы решить эту проблему, вам нужно будет использовать одно из наших решений ниже в безопасном режиме.
  • Обновление BIOS WHEA_UNCORRECTABLE_ERROR
    • Чтобы решить эту проблему, вам, возможно, придется вернуться к более старой версии BIOS.

1. Отключите разгон в BIOS.

  • Нажмите Windows + I, чтобы открыть приложение «Настройки».
  • Выберите Параметры встроенного ПО UEFI. Щелкните Перезагрузить.
  • После перезагрузки компьютера он должен автоматически открыть BIOS, поэтому перейдите на вкладку «Дополнительно».
  • Перейдите в «Производительность» и найдите «Разгон».

  • Убедитесь, что разгон отключен.
  • Сохраните изменения в BIOS (нажав F10 на клавиатуре) и загрузите компьютер в обычном режиме.

Если у вас возникли проблемы после этих решений, посетите наше руководство по доступу к BIOS для получения подробных инструкций и альтернативных методов.

Неисправимая ошибка Whea может быть вызвана разгоном, поэтому, если вы используете программное обеспечение для разгона, обязательно отключите его.

2. Проверьте, нет ли проблем с оборудованием

  • Нажмите Windows + X и выберите Windows PowerShell (Admin).

  • Теперь выполните следующую команду:
    chkdsk /f C:

  • Нажмите Y, чтобы запланировать перезагрузку.
  • Перезагрузите компьютер и дождитесь окончания сканирования.

Whea Uncorrectable Error часто возникает из-за проблем с SSD, поэтому для ее устранения мы предлагаем использовать специализированное программное обеспечение для восстановления BSOD, такое как Outbyte PC Repair Tool.

3. Запустите диагностику памяти Windows

  • Нажмите Windows + S и введите память. Выберите «Диагностика памяти Windows».

  • Выберите Перезагрузить сейчас и проверьте наличие проблем.

  • Если у вас есть какие-либо остановки по пути, такие как проверка жесткого диска с ошибками, попробуйте заменить память.

Если вы подозреваете наличие каких-либо дополнительных проблем с оборудованием, мы рекомендуем использовать программное обеспечение для диагностики оборудования, чтобы точно определить причину.

4. Обновите драйверы

  • Нажмите Windows + X и выберите Диспетчер устройств.

  • Найдите драйвер, который, по вашему мнению, вызывает проблему, щелкните его правой кнопкой мыши и выберите «Обновить драйвер».

  • Выберите Автоматический поиск драйверов и дождитесь завершения процесса.

  • Повторите это для всех драйверов, которые, по вашему мнению, реагируют на эту проблему.

Драйверы могут привести к BSOD Whea Uncorrectable Error, поэтому крайне важно поддерживать их в актуальном состоянии.

Обновление драйверов вручную может быть утомительным процессом, особенно если вам нужно обновить несколько из них, но вы можете значительно ускорить этот процесс, используя программное обеспечение для обновления драйверов.

6. Удалите проблемные обновления Windows.

  • Нажмите Windows + I, чтобы открыть приложение «Настройки».
  • Теперь перейдите в раздел «Обновление и безопасность».

  • Нажмите «Просмотреть историю обновлений».

  • Теперь нажмите «Удалить обновления».

  • Появится список обновлений.

  • Дважды щелкните определенное обновление, чтобы удалить его.

По словам пользователей, неисправимая ошибка Whea иногда может появляться из-за проблемных обновлений Windows.

7. Отключите функцию Turbo Boost в BIOS.

  • Перезагрузите компьютер и продолжайте нажимать F2, чтобы войти в BIOS.
  • Как только вы войдете в него, найдите опцию Turbo Boost.
  • Отключите его и сохраните изменения.

8. Отключите дополнительные аудиоустройства

  • Когда откроется окно «Звук», перейдите на вкладку «Воспроизведение». Щелкните правой кнопкой мыши каждое аудиоустройство, отличное от используемого по умолчанию, и выберите «Отключить».

  • Повторите те же действия для всех записывающих устройств.
  • После этого нажмите «Применить» и «ОК», чтобы сохранить изменения.

Некоторые пользователи также рекомендуют отключать дополнительные аудиоустройства в диспетчере устройств. Для этого выполните следующие действия:

  • Нажмите Windows + X и выберите Диспетчер устройств.

  • Найдите свои аудиоустройства и отключите все устройства, кроме устройства по умолчанию.
  • Чтобы отключить устройство, просто щелкните его правой кнопкой мыши и выберите в меню «Отключить устройство».

  • Когда появится подтверждающее сообщение, нажмите Да

По словам пользователей, сообщение о неисправимой ошибке Whea может появиться из-за ваших аудиоустройств. Чтобы устранить проблему, вам нужно найти и отключить дополнительные устройства вывода и ввода звука.

После отключения всех устройств не по умолчанию проблема должна быть решена.

Как исправить неисправимую ошибку Whea в Windows 11?

Используйте восстановление системы

  • Нажмите Windows + R и введите rstui.

  • Теперь нажмите Далее, чтобы продолжить.

  • Выберите нужную точку восстановления и нажмите «Далее».

  • Следуйте инструкциям на экране, чтобы завершить процесс.

Если проблема все еще существует, вот еще несколько решений, позволяющих раз и навсегда исправить неисправимую ошибку Whea в Windows 11.

Почему при запуске появляется ошибка Whea Uncorrectable Error?

Иногда эта проблема не позволяет загрузиться в Windows. Есть способы исправить это, и чтобы узнать больше, посетите наше руководство по циклу синего экрана.

Что касается причин такого поведения, то они следующие:

  • Нестабильный разгон
  • Неисправное оборудование
  • Плохой водитель

Эта ошибка может быть проблематичной, поскольку она заставит ваш компьютер перезагрузиться, но мы надеемся, что вам удалось исправить ее с помощью наших решений.

Дайте нам знать, какой из методов лучше всего сработал для вас, оставив нам сообщение в разделе комментариев ниже.


Windows is rather stable and easy to use the operating system, but just like everything tech, it isn’t immune to random bugs or glitches. Anything from an outdated driver to a broken or malfunctioning piece of hardware can cause errors. 

Microsoft has put countermeasures in place to take care of such situations, and Windows has a slew of troubleshooter and error loggers to help users diagnose any such issues. This article looks at the WHEA logger and event IDs 1, 17, 18, 19 and 46 and explains everything you need to know. 

Also read: Windows does not have enough information to verify this certificate: 6 Fixes


The Windows Hardware Error Architecture (WHEA) logger is an automated service that detects hardware errors and raises an Event Tracking for Windows event whenever an error occurs. These hardware errors are then recorded in the system log. 

Event IDs 1, 17, 18, 19 and 46 are all associated with hardware errors and indicate different problems that can be further investigated by looking into the system log. Every hardware error has an error record that describes the error condition that caused the problem. These records can be retrieved from each event for further analysis and diagnosis. 

Additionally, applications can retrieve hardware error events from the system log by querying for WHEA logger events. They can also register to get notified whenever the WHEA logger raises a hardware error and logs it in the system log. 


How to fix the Whea logger errors?

Fixing these errors requires deeper analysis as WHEA logger events are simply generic error codes and only indicate that there might be a hardware or driver problem.

For the actual cause, you’re going to have to either dig around in the system logs or search for the BSoD code that you see when your computer crashes. You can however, narrow down the error by doing simple things like updating your PC to the latest Windows build and updating any drivers that might be causing problems.

Here are six generic fixes you can try out.

Update your PC 

The first thing you should do is to update your PC. Updating your PC will, in most cases, update your drivers and fix any issues in the process.

Check out this detailed guide to know how to update your PC here

Update your drivers

Updating (or uninstalling the problematic driver can also fix the problem.

Step 1: Right-click Start and select Device Manager from the menu.

How to fix Error DX11 Feature Level 10.0 on Fortnite?

Step 2: Expand the problematic driver, right-click on it and click Update driver. 

How to fix Error DX11 Feature Level 10.0 on Fortnite?

Step 3: Click on Search automatically for drivers. Windows will then automatically look for and download the latest drivers.

How to fix Error DX11 Feature Level 10.0 on Fortnite?

While this should help resolve the error, in case it doesn’t, click Uninstall device and restart your PC to force Windows to install the required drivers. You can then update them later. 

Also read: What is ‘com android settings intelligence’?


Run an SFC scan

Corrupt files are the number one reason your PC might behave weirdly. Here’s how you can get rid of them and potentially resolve your issue. 

Step 1: Press Windows Key + S to bring up the Cortana/Search box and search for Powershell. Open Windows Powershell from the search results.

Windows 10 start menu won't open: 6 fixes | Candid.Technology

Step 2: Type sfc /scannow to scan your system for issues. 

Windows 10 start menu won't open: 6 fixes | Candid.Technology

Step 3: If the SFC scan finds any problems, use the following command to resolve them. 

DISM /Online /Cleanup-Image /RestoreHealth

Windows 10 start menu won't open: 6 fixes | Candid.Technology

Restart your PC for the changes to take effect, and the problem should be resolved.


Run the Check Disk utility

A BSOD can very well be a sign of your boot drive failing to perform as it should. Try running the check disk utility to check whether or not your storage drives are, in fact, functional. 

You can refer to our detailed guide here on how to run the check disk utility.

Also read: Remote desktop some settings are managed by your organisation: Explained


Run the Windows hardware troubleshooter

Windows comes with a few handy troubleshooters that can resolve a bunch of issues. However, for some reason, Microsoft has removed the hardware troubleshooter from the troubleshooter’s menu. So here’s an alternative way to run the hardware troubleshooter. 

 Step 1: Press the Windows key + R to open the Run prompt. Type cmd and hit enter.

How to fix "this device cannot start code 10" error?

Step 2: Type msdt.exe -id DeviceDiagnostic and press enter. This will launch the hardware troubleshooter. 

How to fix "this device cannot start code 10" error?

Proceed along as instructed by the troubleshooter.


Repair your system

If nothing else works, the best way to get rid of the error is by simply reinstalling or repairing your OS. 

The Windows Media Creation tool is a great way to install Windows and repair the OS. Using this, you can perform a clean installation or repair your OS without affecting your data.

You can download the Media Creation Tool here

Also read: What is Windows audio device graph isolation? Everything you need to know

Yadullah Abidi

Someone who writes/edits/shoots/hosts all things tech and when he’s not, streams himself racing virtual cars.

You can contact him here: [email protected]

  • Произошла устранимая аппаратная ошибка компонент память источник ошибки corrected machine check
  • Произошла устранимая аппаратная ошибка whea logger 19
  • Произошла следующая ошибка 2148073494
  • Произошла серьезная ошибка приложение будет закрыто football manager 2016
  • Произошла ситуация речевая ошибка