Произошла неустранимая аппаратная ошибка сообщивший компонент ядро процессора

Доброго времени суток, пару месяцев собрал ПК,  ryzen 9 3900x+ RX 5700 XT

вылеты с игры были сразу, но обновления драйверов на видеокарту решило вопрос, далее багается изоляция графов аудиоустройств windows, с начала поднимал нагрузку проца до 25% и оперативку до 12гиг, но вроде бы решил этот вопрос, хотя иногда попросту
багается звук, растёт энергопотребления до максимум,  и звук на пк становится ужасным, — проблему решает снятие задачи данного процесса, но речь не об этом)

Я тестировал ПК в разных программах, и всё ок, но когда я начинаю играть в игры, часто крашится пк. Краш происходит так, с начала отключается монитор( при этом звук в дискорде работает, меня слышно), потом отрубается и
дискорд, и происходит перезагрузка ПК.

Показывает такие ошибки 

картинки выложить не позволяет 

Система перезагрузилась, завершив работу с ошибками. Возможные причины ошибки: система перестала отвечать на запросы, произошел критический сбой или неожиданно отключилось питание.

Сбой загрузки драйвера DriverWUDFRd для устройства HIDVID_0951&PID_16A4&MI_03&Col02a&392cdbd1&0&0001.

Компьютер был перезагружен после критической ошибки.  Код ошибки: 0x00000124 (0x0000000000000000, 0xffff860fd54548c8, 0x0000000000000000, 0x0000000000000000). Дамп памяти сохранен в: C:WindowsMinidump70220-6843-01.dmp. Код отчета:
834d7210-da9e-431a-a91c-0a4e8f6560da.

Превышение времени ожидания (30000 мс) при ожидании подключения службы «AMD External Events Utility».

Сбой при запуске службы «AMD External Events Utility» из-за ошибки 
Служба не ответила на запрос своевременно.

Произошла неустранимая аппаратная ошибка.

Сообщивший компонент: ядро процессора
Источник ошибки: Исключение проверки компьютера
Тип ошибки: Ошибка иерархии кэша
ИД APIC процессора: 16

Возникла проблема с одним или несколькими драйверами пользовательского режима, ведущий процесс был завершен. Это может временно ограничить доступ к устройствам.

Дополнительные сведения содержатся в подробностях этой записи.

Устройство HID-compliant headset (размещение (unknown)) отключено из-за сбоя драйвера пользовательского режима. Windows попытается перезапустить устройство еще несколько раз: 5. Свяжитесь с производителем устройства для получения дополнительных
сведений об этой проблеме.

как выложить сюда дамп памяти,я так и не понял(

процессор без разгона, видеокарта тоже. 

03.03.2022, 21:48. Показов 7719. Ответов 14

Доброго времени суток. Сразу извиняюсь за воду и лирику, но уж очень люблю лить текст и писать развернуто))
В общем, на протяжении примерно года боролся с (видимо, но это не точно) проблемой совместимости моего процессора и оперативной памяти. В поисках ответа были объявлены и проведены 2 крестовых похода по просторам интернета, но истины так найдено и не было. Десятки людей с аналогичной проблемой и еще больше вариантов решений, которые носили чисто индивидуальный характер для авторов и тех, кто подключался к обсуждению, либо просто все приводило в тупик и темы закрывались. Перейду дальше сразу к делу.
С сентября по декабрь 2020 года собрал ПК со следующей конфигурацией:

Процессор: Ryzen 5 3600x (Gammaxx 400 RGB)
Материнская плата: Gigabyte Aorus B450 Elite
Оперативная память: DDR4 HyperX Fury Black DDR4 2x8Gb 3200 МГЦ
Видео карта: Gigabyte RTX 3060ti
Диск: Samsung 860 EVO 500 gb
Б/П: Super Flower Leadex Silver 550W (Многие сейчас подумают, ну и что за умник ставит 550 на данную сборку и будут отчасти правы. Но данный бп ни разу не подвел и в той сборке, которая указана выше. Никаких проблем не возникало в любых нагрузках и любых тестах).
Корпус: Materexx 70.

Через какое то время путем долгих тыканий пыканий разогнал оперативку до 3400, все что смог с этих планок выжать с достойными таймингами. Система работала как часы, никаких проблем вообще, со всеми поставленными задачами справлялась. Будь то тяжелые ААА проекты или стресс тесты в Aida64, Cinebench, OCCT и тому подобное.
Спустя 3-4 месяца родилась идея, а че бы не подкинуть оперу получше и не обновиться до нормальных 3600 МГц. В итоге были приобретены 2 планки по 8 гб G.Skill TradientZ NEO RGB и с этого момента началось веселье.
После включения профиля ХМР система не хотела стабильно работать от слова совсем. В играх комп клинило, он зависал намертво, при этом не уходя в BSOD и не оставляя дампов памяти. Помогал только ребут с кнопки. В журнале событий после ребута были только ошибки типа:

Произошла неустранимая аппаратная ошибка.

Сообщивший компонент: ядро процессора
Источник ошибки: Machine Check Exception
Тип ошибки: Cache Hierarchy Error
ИД APIC процессора: 2

Стресс тесты сыпали ошибки кэша. И это было только при включённом ХМР В это же время в хате была точно такая же сборка (опера из первой конфигурации переехала как раз в нее), за исключением видяхи, там стояла 1050Ti. Было принято решение впихнуть оперу во вторую сборку и вуалям, все летает идеально. ХМР завелся с полоборота, никаких клинов, зависаний и ошибок в стрессах. С тех пор она и прожила на второй сборке, а в текущую вернулся НуперХ и как то забылось все.
И вот через какое то время серфя интернеты наткнулся на совет после которого я почувствовал себя полным дегенератом. Писали, что при установке ХМР профиля нужно еще выбрать один из трех предустановленных профилей, для якобы частот. Решил проверить, все воткнул и ничего себе, все заработало. Тесты на без проблем, никаких ошибок, все летает. В это же время снова втянулся в мир Ведьмака 3 и все было замечательно. Ура, подумал я, но не тут то было. Как раз вышел God of war на ПК и я решил в него погонять. И тут комп начал перезагружаться. Решив что проблема в игре, почитал в сети что у нее были какие то проблемы с версией, которая засерала то ли озу, то ли виртуальную память до перезагрузки ПК, в общем вроде как подумал что это нормально и особо не стал разбираться. Пройдя его вернулся в BF1 и тут ХЕРАКС, опять перезагрузка без BSODA и без дампа памяти, а в журнале событий снова мой любимый:

Сообщивший компонент: ядро процессора
Источник ошибки: Machine Check Exception
Тип ошибки: Cache Hierarchy Error
ИД APIC процессора: 2

Тесты — все хорошо. Начал опять серфить инет, проверил все что можно, схему питания винды, фаст бут в биосе (Кста биос регулярно проверяю и обновляю). Многие писали, что скорее всего брак камня, но при этом все стресс тесты он проходил без проблем. Мем тесть тоже ставил на ночь, ошибок 0.
В общем перепробовал все и тут пришло в голову, если это в игре происходит, то го проверим видяху. Скачал Furmark, поставил тест в ФХД и ХЕРАКС, перезагрузка на 20 минуте теста.
Собственно это анамнез на данный момент есть. Ребят, есть идеи что с этим г делать, а то уже хочется плакать?(

__________________
Помощь в написании контрольных, курсовых и дипломных работ, диссертаций здесь

Как исправить ошибки WHEA Logger в WindowsИзучая просмотр событий Windows 11, Windows 10 и других версий, вы можете обнаружить ошибки, для которых в качестве источника указан WHEA Logger, описание — «Неустранимая аппаратная ошибка», либо «Устранимая аппаратная ошибка» и код события: 1, 17, 18, 19, 20, 47 и другие.

В этой инструкции подробно об ошибках WHEA Logger, причинах и возможных способах их исправить.

Ошибки WHEA Logger в просмотре событий Windows

При возникновении ошибок в работе оборудования, компонент Windows Hardware Error Architecture (WHEA) инициирует запись соответствующих ошибок в журнале событий, которые вы и наблюдаете с источником WHEA-Logger.

К сожалению, код ошибки дает мало информации о том, что именно произошло и какого оборудования касается событие. Основные же причины ошибки:

  • Неправильная работа или сбои оборудования — видеокарты, оперативной памяти, жесткого диска, проблемы с процессором и другие.
  • Проблемы с установленными драйверами.
  • Перегрев компонентов ПК или ноутбука.
  • Неправильная работа оборудования (память, видеокарта, CPU) в разгоне.
  • Проблемы с питанием или управлением электропитанием.

Основные способы исправить ошибки WHEA Logger

Как было отмечено, сведения об ошибке в просмотре событий не дают информации о конкретных методах решения проблемы и её источнике. Единственный вывод, который можно сделать — произошла ошибка при работе оборудования или его драйверов.

Какие действия можно предпринять, чтобы исправить ошибку:

  1. Если у вас установлена Windows 11 или Windows 10, попробуйте отключить быстрый запуск, перезагрузить компьютер и посмотреть, появляется ли ошибка снова. Включенная опция на некоторых устройствах может приводить к ошибкам WHEA Logger, особенно на старом оборудовании или в ситуации отсутствия оригинальных драйверов производителя устройства.
  2. Попробуйте вручную установить драйверы чипсета и системных устройств (обычно также расположены в разделе «чипсет») с сайта производителя материнской платы ПК или с сайта производителя ноутбука для вашей модели вместо тех, которые были установлены автоматически Windows.
  3. Если вы каким-либо образом настраивали разгон каких-либо аппаратных компонентов, попробуйте отключить его и посмотреть, изменило ли это ситуацию.
  4. Проверьте оперативную память на ошибки.
  5. Обновите БИОС вашей материнской платы (в том числе для ноутбука), если на официальном сайте доступны новые версии БИОС. Внимание: обновление БИОС/UEFI потенциально небезопасная процедура, следует внимательно выполнять инструкции производителя и даже в этом случае (особенно в случае реальных неполадок оборудования) есть риск, что что-то пойдет не так.
  6. Если в диспетчере устройств присутствуют какие-либо неизвестные устройства, либо для части устройств установлены стандартные драйверы Майкрософт (особенно для видеокарты), вручную найдите нужные драйверы и установите их. Подробнее: Как установить драйвер неизвестного устройства.
  7. При использовании каких-либо приложений, напрямую меняющих параметры работы оборудования (изменение частот процессора и видеокарты, скорости вращения вентиляторов), проверьте, исчезнут ли ошибки WHEA-Logger, если отключить эти инструменты.
  8. В случае, если на вашем ПК или ноутбуке наблюдаются какие-то проблемы с питанием: самопроизвольные выключения, включение не с первого раза (либо компьютер включается, шумит, но не загорается монитор) или иные подобные симптомы, следует разобраться с ними и решить проблему. В случае ПК причиной обычно бывает выходящий из строя блок питания, но это не единственный возможный вариант.
  9. Используя программы для просмотра температуры процессора и видеокарты убедитесь, что при нагрузках отсутствует перегрев компонентов.
  10. Обновите Windows 10/11, особенно если обновления отключены в течение продолжительного времени.
  11. Выполните восстановление целостности системных файлов Windows.
  12. Есть сообщения, что ошибки WHEA-Logger с кодом 19 могут быть вызваны неправильной работы клавиатуры, а код 47 может говорить об ошибках жесткого диска (однако, это не всегда так).
  13. Если ошибки появились недавно, попробуйте использовать точки восстановления на дату, предшествующую появлению проблемы, а при их отсутствии — вспомнить, какие действия выполнялись перед возникновением ошибок WHEA-Logger: установка нового оборудования или драйверов, системного ПО, обновлений Windows или какие-либо еще и откатить эти действия вручную.

Независимо от того, сработают ли предлагаемые методы в решении проблемы, попробуйте определить закономерности появления ошибки: возможно, это сможет разобраться, какое именно оборудование вызывает сбой, а в дальнейшем решать проблемы именно с ним: обновлять драйвера, диагностировать неполадки, принимать решение о замене.

Всем добрый день! Проблема следующая: на новом ноутбуке Lenovo v580c 20160 наблюдается следующее событие:

Событие 18, WHEA-logger
Произошла неустранимая аппаратная ошибка.
Сообщивший компонент: ядро процессора
Источник ошибки: Исключение проверки компьютера
Тип ошибки: Ошибка иерархии кэша
ИД процесса: 0
Дополнительные сведения содержатся в подробном представлении этой записи.

Имя журнала: System
Источник: Microsoft-Windows-WHEA-Logger
Дата: 12.01.2014 12:30:40
Код события: 18
Категория задачи:Отсутствует
Уровень: Ошибка
Ключевые слова:
Пользователь: LOCAL SERVICE
Компьютер: lt-metelkov
Описание:
Произошла неустранимая аппаратная ошибка.

Сообщивший компонент: ядро процессора
Источник ошибки: Исключение проверки компьютера
Тип ошибки: Ошибка иерархии кэша
ИД процесса: 0

Дополнительные сведения содержатся в подробном представлении этой записи.
Xml события:
<Event xmlns=»http://schemas.microsoft.com/win/2004/08/events/event»>
<System>
<Provider Name=»Microsoft-Windows-WHEA-Logger» Guid=»{C26C4F3C-3F66-4E99-8F8A-39405CFED220}» />
<EventID>18</EventID>
<Version>0</Version>
<Level>2</Level>
<Task>0</Task>
<Opcode>0</Opcode>
<Keywords>0x8000000000000000</Keywords>
<TimeCreated SystemTime=»2014-01-12T08:30:40.690060600Z» />
<EventRecordID>4087</EventRecordID>
<Correlation ActivityID=»{67043670-53BB-471A-A7D6-7AD5AB937AEE}» />
<Execution ProcessID=»1844″ ThreadID=»2400″ />
<Channel>System</Channel>
<Computer>laptop</Computer>
<Security UserID=»S-1-5-19″ />
</System>
<EventData>
<Data Name=»ErrorSource»>3</Data>
<Data Name=»ApicId»>0</Data>
<Data Name=»MCABank»>6</Data>
<Data Name=»MciStat»>0xae2000000003110a</Data>
<Data Name=»MciAddr»>0xffb05000</Data>
<Data Name=»MciMisc»>0x38a0000086</Data>
<Data Name=»ErrorType»>9</Data>
<Data Name=»TransactionType»>2</Data>
<Data Name=»Participation»>256</Data>
<Data Name=»RequestType»>0</Data>
<Data Name=»MemorIO»>256</Data>
<Data Name=»MemHierarchyLvl»>2</Data>
<Data Name=»Timeout»>256</Data>
<Data Name=»OperationType»>256</Data>
<Data Name=»Channel»>256</Data>
<Data Name=»Length»>928</Data>
<Data Name=»RawData»>435045521002FFFFFFFF03000100000002000000A0030000091E08000C010E140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131FE6FF5E89C91C54CBA8865ABE14913BBE4DEE47E700FCF0102000000000000000000000000000000000000000000000058010000C00000000102000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000001000000000000000000000000000000000000000000000018020000800000000102000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000001000000000000000000000000000000000000000000000098020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000100000000000000000000000000000000000000000000007F010000000000000002010000020000A90603000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000007000000000000000000000000000000A906030000081000BFE3BA7DFFFBEBBF0000000000000000000000000000000000000000000000000000000000000000F50157A5EFE3DE43AC72249B573FAD2C03000000000000009F008206000000000050B0FF000000000000000000000000000000000000000000000000000000000100000001000000625B0881700FCF010000000000000000000000000000000000000000060000000A110300000020AE0050B0FF00000000860000A0380000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000</Data>
</EventData>
</Event>

Конфигурация компьютера следующая: intel core i5 3230, 6gb RAM, GeForce 740m 1gb, Windows 7 Professional.
PS: на работе компьютера ошибка никак не отражается. BSODов и ничего такого подозрительного нет. Разве только загрузка самой ОС длится немного дольше, как мне кажется, но это может быть моей паранойей. Гугл ничего конкретного не дал, так что надеюсь на вашу помощь! Заранее спасибо!

Столкнувшись с более или менее серьезным сбоем в работе системы, не будет лишним внимательно изучить логи Журнала событий, нередко содержащие важные подсказки, увы, сохраненные в них события далеко не всегда бывают очевидными, как например, ошибки WHEA Logger, которые могут иметь разные коды и разные описания, причем ошибка с одним и тем же кодом в разных случаях часто имеет разные причины.

Появление в Журнале события ошибки WHEA Logger практически всегда указывает на проблемы в работе оборудования или его драйверов. Ошибки WHEA могут иметь описания «Неустранимая аппаратная ошибка» и «Устранимая аппаратная ошибка»: в первом случае их причиной, скорее всего, являются аппаратные неполадки, во втором — неполадки в работе драйверов устройств, но это необязательно. Также ошибки WHEA Logger могут иметь косвенные причины, например, некорректные настройки разгона CPU, GPU или RAM, перегрев компонентов, сбои в работе электропитания. 

Давать какие-то конкретные советы по устранению ошибок WHEA Logger довольно трудно, поскольку причины ошибки, как уже было сказано, могут быть самые разные. В таких случаях можно порекомендовать внимательно изучить лог, в частности обратить внимание на такие параметры как:

 Компонент или Сообщивший компонент. Может содержать прямое указание на некорректно работающее устройство, например, “Ядро процессора”, “Память”, “Порт PCI Express Root” (возможно, один из интерфейсов материнской платы) и так далее. 

 ID поставщика. ID устройства. Идентификаторы можно использовать для поиска устройств в Интернете, сформировав запрос типа “VendorID 0x0000” и “DeviceID 0x0000”, где 0x0000 — идентификатор поставщика и устройства.

Идентифицировать вызывающее ошибку устройство — значить решить половину задачи, по крайней мере, вы будете знать, с чем работать. Если проблемное устройство определить не удалось, можем порекомендовать выполнить ряд следующих действий, возможно, что-то из предложенного решит вашу проблему.

1. На некоторых компьютерах, особенно старых, ошибку WHEA Logger может вызывать функция быстрого запуска, включенная по умолчанию в Windows 8.1, 10 и 11. Отключите ее, перезагрузите компьютер и понаблюдайте за поведением системы. 

2. Если незадолго до появления проблемы вы выполняли разгон любых аппаратных компонентов, восстановите их конфигурацию по умолчанию. В той же мере это касается программного обеспечения, изменяющего параметры работы любых устройств, начиная от процессора и ОЗУ и заканчивая кулерами. 

3. Установите оригинальные драйвера чипсета и других устройств, скачав их с сайта производителя. Если вы испытываете трудности с поиском и установкой драйверов в ручном режиме, воспользуйтесь специальными менеджерами типа Driver Booster.

4. Выполните диагностику основных аппаратных компонентов доступными средствами Windows или сторонними утилитами. Проверьте на предмет ошибок оперативную память, жесткий диск, определите температуру CPU, GPU, диска и сравните полученные данные с нормальными показателями. Отдельного внимания заслуживает блок питания, на неисправности которого могут указывать внезапные отключения компьютера при повышении нагрузки на оборудование (запуск игр, эмуляторов, выполнение тестов, просмотр видео высокого разрешения), включение компьютера не с первого раза.

В качестве дополнительных мер можно порекомендовать проверку целостности системных файлов, а также откат к точке восстановления, на момент создания которой проблем в работе Windows замечено не было.

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Computer Type: Desktop

GPU: Radeon RX 5700XT

CPU: Ryzen 5 3600

Motherboard: MSI B450 A Pro Max

RAM: GSkill Ripjaws 8GB X2 (16GB in total)

PSU: Thermaltake Smart RGB 700W

Case: Midtower with 1 stock fan

Operating System & Version: Windows 10 Pro Version 10.0.19041

GPU Drivers: Radeon Software (Adrenaline) 20.4.2

Chipset Drivers: AMD Chipset Software 2.5.4.352

Hard Disk: SSD — Crucial 1TB M2 Nvme

Background Applications: Happens irrespective of what applications running

Description of Original Problem: My newly built PC keeps on restarting randomly. Sometimes, it will run for 6-10 hours without any issue. Then other times it will simply restart when I open an application (browser, tabs, etc.) or games and sometimes it just restarts at its will. Every time it restarts, the event logger logs the below errror:

«A fatal hardware error has occurred.

Reported by component: Processor Core Error Source: Machine Check Exception Error Type: Cache Hierarchy Error Processor APIC ID: 11

The details view of this entry contains further information.»

Troubleshooting: I have updated all the drivers. Deleted and reinstalled and updated all the drivers. Checked if the CPU fan is properly attached to the CPU, if GPU is properly attached, if RAMs are properly attached, and everything else. All of them seem perfectly fitted. Used various software to test CPU, GPU, RAM, etc. All came back with good results. Did memory test and DISM test. Both were successful without any error.


  • All forum topics


  • Previous Topic

  • Next Topic

245 Replies

elstaci

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Hi elstaci,

Thank you for your message. I literally tried almost everything and still facing the issue. Now, I am running my PC in clean boot. Will test it in clean boot for few days and see how it goes. Many people faced similar issue with 5700XT and Ryzen CPU combination. Not sure if it is the CPU or GPU. Many have changed the graphics card and many other underclocked their CPU/GPU and adjusted PSU voltage accordingly. I do not want to do either of these two. Don’t know what I will finally do though.

pokester

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

A you running with your bios at defaults with XMP and PBO off. If not do so and see if that changes anything. If that doesn’t help uninstall the AMD GPU driver and then for the sake of testing just let windows load its standard driver. See if that changes stability. Hopefully this can lead to you isolating the issue. 

pokester

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I will add that a lion share of the time that I have had problems that make a machine restart it comes back to memory issues. It is however very hard to say without some testing. 

Also if you have not already. Boot with one stick of ram at a time and see if one is stable vs the other. 

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

pokester wrote:

I will add that a lion share of the time that I have had problems that make a machine restart it comes back to memory issues. It is however very hard to say without some testing. 

Also if you have not already. Boot with one stick of ram at a time and see if one is stable vs the other. 

Hi Pokester,

Sorry for the late reply.

I have been testing and hence was waiting to see if things work and then reply. Tried with one stick and didn’t work. Changed the PCIe slot of the GPU and still nothing changed. Removed GPU driver and ran PC with clean boot up and the restart stopped. Then activated other drivers and used PC without playing games and PC did not restart. I have found a way to trigger the issue. It actually happens while loading a graphics demanding application. It can be games or anything else that requires the use of GPU to higher level. However, the issue does not take place while playing games. If it happens, it will happen during loading. It either happens when I start any game or if I go to a different scent while playing the game. Thus I narrowed down the issue to loading. Also, I never turned the XMP and PBO on to begin with.

Now, I have contacted the retailer and trying to push them to change it with another card. Not sure if that will work as lots of people are having the same issue with Ryzen processor and Nvidea cards too.

Lawrence06

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Cmdr-ZiN

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

@Lawrence06 nice find. It doesn’t mention and error detected on the infinity fabric by the memory controller on the CPU. This could be affected by voltage or clock speeds if using DOCP or speeds over 3200 Mhz.

I hate to think it’s a RAM speed issue because nobody seems to know about it, even when I ask at the computer store or contact AMD support, they never said ram was the issue. They market higher speeds yet mention nothing about them not being compatible or that it voids your warranty (which I think is BS).

Still something to rule out, but it made no difference for me.

My first CPU was unstable and slowly got more stable with updates, the latest chipset driver I tried was from March and the latest BIOS in April/June before I gave up waiting. Last WHEA error I got was April 1st.

My second CPU was perfect for 2 months, tried to reproduce the issue and couldn’t. DOCP wasn’t enabled the whole time. Then suddenly it became unstable and died a week later by not being able to boot an OS properly, CPU behaved the same on other PCs. Never got a WHEA error with it.

Tried a third 5800X, latest BIOS, it crashed within 24hrs and once more the next day I believe. After updating the chipset driver and setting PBO from Auto to Disabled (The PBO change should of made no difference) it’s now been on for over 7 days straight no issue. It might not be solved yet, it can be so random, but maybe the chipset driver made the difference.

Either way I’ve had 3 different CPUs, they all behaved differently.

accn

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I met several threads on reddit with the same error. Most users had rx5700 or 5700xt. This issue cannot be memory related. I have tested my memory many times in stock, xmp and overclocking and all tests show 0 errors. Regardless, I bought new RAM on micron e-die, and crashes happen with the same frequency. 

fyrel

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

If you could upload the most recent I could have a look at it.

If you want to try having a look yourself they can be opened with WinDbg preview.

You can download that with the developer SDK or through windows store (it’s free)

fyrel

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

The program that caused the issue in that dmp file was smss.exe.

Component that reported the WHEA error was the CPU.

The smss .exe file is a software component of Microsoft Session Manager Subsystem by Microsoft.
«smss.exe» is a file that manages the startup of all user sessions in Windows. The operating system’s main thread activates the file. «smss.exe» launches processes such as Win32 and WinLogin. It also sets the system variables, followed by shutting down the system once those 2 files are ended. If for some reason, those 2 files do not end; «smss.exe» causes the system to hang.

This isn’t something you can disable, windows won’t run without it?

Are all the processor APIC ID numbers listed in the event viewer all 11?

accn

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I just checked the oldest minidump dated June and it lists the same process. Windows won’t work without Session Manager Subsystem. The event log contains two errors in a row, the first contains processor APIC ID 11, the second contains processor APIC ID 0. It seems to me that the gpu driver initiates this error, since it doesn’t happen on a very old driver, or on another gpu. Or it could be a gpu hardware malfunction, which began to manifest itself in newer drivers, since most users do not experience this problem. I played valorant for about an hour before the last crash. I got a message on Steam and tried to minimize the game to my desktop, after which my pc rebooted. Crashes often occur during alt + tab from fullscreen game to the desktop 

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

fyrel wrote:

The program that caused the issue in that dmp file was smss.exe.

Component that reported the WHEA error was the CPU.

The smss .exe file is a software component of Microsoft Session Manager Subsystem by Microsoft.
«smss.exe» is a file that manages the startup of all user sessions in Windows. The operating system’s main thread activates the file. «smss.exe» launches processes such as Win32 and WinLogin. It also sets the system variables, followed by shutting down the system once those 2 files are ended. If for some reason, those 2 files do not end; «smss.exe» causes the system to hang.

This isn’t something you can disable, windows won’t run without it?

Are all the processor APIC ID numbers listed in the event viewer all 11?

Hi Fyrel,

If it is not too much to ask, could you please have a look at the below link or the attached file:

WHEA Error — Google Drive 

Centralnetwork

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Hello there!

I can see a lot of activity here for the WHEA-Logger error and wanted to jump in because this crash is also tormenting my setup.
My story is the same as everyone elses for the most part. PC will freeze, audio will continue for 1 second perhaps, usually my monitors will turn a certain colour each. Varying from white, pink, green. Ruled out the GPU. Troubleshooted everything you might expect. Stress tests passed multiple times. No RAM errors on tests, no storage errors, windows clean install didn’t work etc.

Temps are normal for the system. The PSU is brand new, however i’ve not been able to test with a different one.
Feel free to breeze over this for specific details, it’s lengthy: https://forums.tomshardware.com/threads/random-freezes-restart.3681733/#post-22175151

I ticked it as solved as today I realised there was thermal paste on my cpu pins, not much, but enough to make you belieb that was the issue. I’ve cleaned all properly, there wasn’t enough for me to call it a mess. More of a smudge that laid over no more than 3 single pins. All pins are in good order with no bends down the «isles». PC has crashed one after fixing this, with the same style of crash. Implying it’s not fixed. My crash will happen at least once a day. Can happen while browsing, but mostly while gaming. I say gaming lightly, like main menu or loading up games and the crash might happen.

I have some dump files that the system has created, but it hasn’t recorded every crash, only a few.
I’ll attach the latest one. I took some advice here and ran the verifier command, which has been running for about 45 mins now without a crash.

Drive with dump file and event view file: https://drive.google.com/drive/folders/17jyNonedYWxNlZPmNlxk_pMr8cTZAWaL?usp=sharing

Please help me

Specs:

3700x
RX 580
Tomohawk Max B450
16gb DDR Corsair RGB Pro 3200mhz
750w Corsiar RGB PSU 80+ rated

draeconis

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Hi all, just to chip in, on a similar system;

Ryzen 3600, RX 5700 XT, ASUS X570-I.

Noticed this issue a couple of weeks ago, would firstly only happen during Cyberpunk 2077; system would stall for up to a minute, then power cycle with no BSOD.

More recently this would happen even while watching YouTube video, or in a game of Stellaris, which is far less demanding.

Like others, set about running the usual; Furmark, Prime95, memtest86, all passed.

Other suggestions here are interesting, tried most of them, but to no avail.

The thing I think may have fixed it for me, and it sounds silly; check the seating in the PCIe slot, especially if yo use a PCIe rizer cable.

My system is build in a FormD T1 case, which is great, but the case tends to put a little pressure on the rizer cable, and this can move over time. My system is watercooled, and I’ve been opening it up occasionally to top it up as there are some small air pockets that are only movable once the system is on.

As the saying I conveniently forgot this time round goes; always blame the cables!

artur_aragao

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I had another WHEA ID: 18.
But this time I managed to trace the possible cause that was my distrust. The CLINK cable from the Corsair RM-1000 source. The memories of ADATA XPG arrived to complete the setup with 32GB. So, it was the moment I needed to remove the adapted cable that Corsair sent me to put in a single USB port, the source and the toilet. I removed this cable and put only the one from the toilet that came with it.

The error was pointed out exactly in the USB port where the two were. I hope I don’t have any more problems with that. There is no further explanation for this. It sucks when the system doesn’t point out where the problem is. As the forced reset held more this time, it even recorded the folder with some information.MSI_PROBLEM_01.pngMSI_PROBLEM_02.pngMSI_PROBLEM_03.png

[ AMD Ryzen 7 5700X (step B2) | CM MASTERLIQUID PL360 FLUX | MSI MPG B550 GAMING EDGE WIFI — 7C91v1D | 32GB DDR4 3600MHz XPG SPECTRIX | ASUS Dual GeForce RTX 3060 OC Ed 12GB GDDR6 ]

artur_aragao

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

About these crashes, BSODs and etc., from the experience I had so far, and in what I observed others experiencing, we need to separate for the most possible causes and work on them.

Are they:
— Undo any overclocking. Keep only Boost and XMP active and you will eliminate the options;
— Device drivers — Source, Chipset, Graphics, mouse, keyboard, toilet, fans;
— Mainboard and / or monitoring applications. Validate whether the dlls or components are old and / or conflict with other new or old applications;
— Poorly connected or broken cables in your body;
— Validate the device management cables — WC, Source, etc;
— In the last case, validate Source, CPU, Memory (if it is in the Mainboard’s QLV), VGA and Mainboard.

Often the problem will be driver and software. It will hardly be a hardware problem.

[ AMD Ryzen 7 5700X (step B2) | CM MASTERLIQUID PL360 FLUX | MSI MPG B550 GAMING EDGE WIFI — 7C91v1D | 32GB DDR4 3600MHz XPG SPECTRIX | ASUS Dual GeForce RTX 3060 OC Ed 12GB GDDR6 ]

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

accn wrote:

I met several threads on reddit with the same error. Most users had rx5700 or 5700xt. This issue cannot be memory related. I have tested my memory many times in stock, xmp and overclocking and all tests show 0 errors. Regardless, I bought new RAM on micron e-die, and crashes happen with the same frequency. 

Hi Accn,

True, most of the people having this issue has Ryzen CPU and Radeon GPU. I am quite confused and cant say for sure what exactly the issue is. If it was a driver issue, then everyone with this graphic card and the latest driver would have had the issue. If everyone was having the issue, either there would have been a new driver or AMD would have discontinued this product. It can be a CPU issue as well or even a motherboard issue as I have seen many threads where the user had Ryzen CPU and Nvidea graphic card.

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

accn wrote:

Perhaps the problem lies in the combination of some hardware, which works correctly separately, but is poorly compatible with each other

It could very well be a compatibility issue. However, some people with nVidea cards also had similar issue but the number was much less as far as I am concerned. This begs the question if it is a processor issue. I will research a bit more if I get a chance and try to find if people with Intel CPU and 5700xt had similar issue.

augustobotossi

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I don’t discard the possibility that may be a combination of things, as pointed before, but I think Windows may be a problem too. A few people installed the previous version (1903 or 1909, I am not sure), which apparently solved the problem.

accn

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

There really was no whea logger event id 18 on the windows 1909 build, this error started appearing in the event log after the 2004 update, but the crashes were exactly the same. I can’t say anything about 1903, when I bought a gpu I already had 1909, so you can give it a try

sniperzee

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

accn wrote:

I met several threads on reddit with the same error. Most users had rx5700 or 5700xt. This issue cannot be memory related. I have tested my memory many times in stock, xmp and overclocking and all tests show 0 errors. Regardless, I bought new RAM on micron e-die, and crashes happen with the same frequency. 

I understand your point. Anyways, I have finally changed my GPU to RTX 2070 and will test it and see how it goes. Will keep all of you posted.

fyrel

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

sniperzee accn‌ 

Unfortunately the WHEA dumps don’t  contain enough information on what caused the crash.

It’s quite common with 0x124 errors I believe.

I would like you both to run verifier and then upload the minidmp produced when you next blue screen.

The full instructions are in the link below, please make sure you understand how to turn verifier off.

Verifier is a diagnostic tool designed to stress test your computers drivers till they break.

Hopefully doing so in a way that produces useable data.

Leave verifier running for up to 48 hours or until your first blue screen then turn it off.

Your system may feel a bit sluggish while it’s running.

https://www.tenforums.com/tutorials/5470-enable-disable-driver-verifier-windows-10-a.html 

accn

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Done. I will report the result below. And thanks again for your participation. 

p.s. by the way, I noticed a strange pattern a long time ago. My system crashes in a similar way during the timespy extreme cpu test. It happens regardless of the settings and overclocking of cpu and ram. Sometimes the system crashes within a few seconds of the test, and it very rarely goes to the end. But when I run this test separately from the rest of the benchmark, it can run for hours in a loop. Graphic stress test always passes without problems with 99% + framerate stability

update: 

My rebooted twice without blue screen, when i tried to launch amd settings from desktop. After which I disabled the driver-verifier, and decided to run logitech gaming software, and then BSOD happened

SYSTEM_THREAD_EXCEPTION_NOT_HANDLED

windbg refers to the HIDCLASS.SYS driver


fyrel

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

If you upload that minidump I will look for the failed driver.

If you want to try since it’s useful to learn.

Open the dump file with windbg

Type !thread into the command line.

About 10 lines from the bottom you will see base and limit values

pastedImage_1.png

Type

dps limit base

Replacing limit and base with the hex numbers.

This opens up the stack recorded during the crash.

Scroll through the list looking for any drivers that failed.

accn

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

I think this crash was a coincidence and related to Logitech software. My system almost never shows BSOD. Today I have installed 20.Q3 driver for radeon pro and today my system was stable. I will continue to watch.

augustobotossi

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Thank you. I am in the same boat, and I will do as you pointed to see what the mini dump will show. I tried everything also, undervolted the GPU, clean installation, ran with A-XMP disabled, manual timing, and whatever was possible. My setup is R5 3600, Sapphire RX 5700 XT Pulse and MSI B550 Gaming Edge Wifi. I ran with two M.2 drives, so no SATA cables or DVD drives (a post mentioned that SATA cables could be the problem too).

augustobotossi

  • Mark as New
  • Bookmark
  • Subscribe
  • Mute
  • Subscribe to RSS Feed
  • Permalink
  • Print
  • Report Inappropriate Content

Nope, it didn’t. I did not get a blue screen, it just rebooted every time (I had to restore to a earlier point because the other options to disable verifier did not work). And I rebooted at the stage where the video driver should load (I have almost nothing running on this PC, only Logitech G Hub, AMD Adrenalin and Windows «stuff» that comes with the installation).

  • Remove From My Forums
  • Question

  • hi, after a couple seconds of playing combat arms my pc crashes. after my pc boots up i checked event viewer and i get WHEA-Logger Event id 18.

    A fatal hardware error has occurred.

    Reported by component: Processor Core
    Error Source: Machine Check Exception
    Error Type: Bus/Interconnect Error
    Processor ID: 1

    The details view of this entry contains further information.

    here is the details:


    <Event xmlnshttp://schemas.microsoft.com/win/2004/08/events/event«>


    <System>

      <Provider
    NameMicrosoft-Windows-WHEA-Logger« Guid{C26C4F3C-3F66-4E99-8F8A-39405CFED220}«
    />

      <Keywords>0x8000000000000000</Keywords>

      <TimeCreated
    SystemTime2015-02-15T05:40:30.008065800Z« />

      <EventRecordID>29215</EventRecordID>

      <Correlation
    ActivityID{2785F8A1-9871-45E6-8E77-C6D58DAE03D3}« />

      <Execution
    ProcessID1256« ThreadID1268«
    />

      <Channel>System</Channel>

      <Computer>Home-PC</Computer>

      <Security
    UserIDS-1-5-19« />

      </System>


    <EventData>

      <Data NameErrorSource«>3</Data>

      <Data NameApicId«>1</Data>

      <Data NameMCABank«>0</Data>

      <Data NameMciStat«>0xb880000000020f0f</Data>

      <Data NameMciAddr«>0x0</Data>

      <Data NameMciMisc«>0x0</Data>

      <Data NameErrorType«>10</Data>

      <Data NameTransactionType«>256</Data>

      <Data NameParticipation«>3</Data>

      <Data NameRequestType«>0</Data>

      <Data NameMemorIO«>3</Data>

      <Data NameMemHierarchyLvl«>3</Data>

      <Data NameTimeout«>1</Data>

      <Data NameOperationType«>256</Data>

      <Data NameChannel«>256</Data>

      <Data NameLength«>928</Data>

      <Data NameRawData«>435045521002FFFFFFFF03000100000002000000A0030000002805000F020F140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131FE6FF5E89C91C54CBA8865ABE14913BB28BBD3D1E148D00102000000000000000000000000000000000000000000000058010000C00000000102000001000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000001000000000000000000000000000000000000000000000018020000800000000102000000000000B0A03EDC44A19747B95B53FA242B6E1D0000000000000000000000000000000001000000000000000000000000000000000000000000000098020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000100000000000000000000000000000000000000000000007F010000000000000002040000030000120F60000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000100000000000000000000000000000000000000000000000000000000000000000000000000000007000000000000000100000000000000120F6000000804010B22981EFFFB8B170000000000000000000000000000000000000000000000000000000000000000B3F8F31CB1C5A249AA595EEF92FFA63C01000000000000009E07C0C40700000000000000000000000000000000000000000000000000000000000000000000000100000002000000E2EC22D7E148D0010100000000000000000000000000000000000000000000000F0F0200000080B8000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000</Data>

      </EventData>

     </Event>

    dmp file:

    Instant Online Crash Analysis, brought to you by OSR Open Systems Resources, Inc.

    Show DivPrimary Analysis

    Crash Dump Analysis provided by OSR Open Systems Resources, Inc. (http://www.osr.com)
    Online Crash Dump Analysis Service
    See http://www.osronline.com for more information
    Windows 7 Kernel Version 7601 (Service Pack 1) MP (4 procs) Free x64
    Product: WinNt, suite: TerminalServer SingleUserTS Personal
    Built by: 7601.18409.amd64fre.win7sp1_gdr.140303-2144
    Machine Name:
    Kernel base = 0xfffff800`02e1b000 PsLoadedModuleList = 0xfffff800`0305e890
    Debug session time: Sun Feb 15 00:40:00.797 2015 (UTC - 5:00)
    System Uptime: 0 days 0:00:10.514
    *******************************************************************************
    *                                                                             *
    *                        Bugcheck Analysis                                    *
    *                                                                             *
    *******************************************************************************
    
    WHEA_UNCORRECTABLE_ERROR (124)
    A fatal hardware error has occurred. Parameter 1 identifies the type of error
    source that reported the error. Parameter 2 holds the address of the
    WHEA_ERROR_RECORD structure that describes the error conditon.
    Arguments:
    Arg1: 0000000000000000, Machine Check Exception
    Arg2: fffffa8004f668f8, Address of the WHEA_ERROR_RECORD structure.
    Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
    Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.
    
    Debugging Details:
    ------------------
    
    TRIAGER: Could not open triage file : e:dump_analysisprogramtriagemodclass.ini, error 2
    
    BUGCHECK_STR:  0x124_AuthenticAMD
    
    CUSTOMER_CRASH_COUNT:  1
    
    DEFAULT_BUCKET_ID:  WIN7_DRIVER_FAULT
    
    PROCESS_NAME:  System
    
    CURRENT_IRQL:  0
    
    STACK_TEXT:  
    fffff880`031af5b0 fffff800`030dbcb9 : fffffa80`04f668d0 fffffa80`039ff040 00000000`0000000b 00000000`00000000 : nt!WheapCreateLiveTriageDump+0x6c
    fffff880`031afad0 fffff800`02fbcea7 : fffffa80`04f668d0 fffff800`030362d8 fffffa80`039ff040 00000000`00000000 : nt!WheapCreateTriageDumpFromPreviousSession+0x49
    fffff880`031afb00 fffff800`02f24275 : fffff800`03097d00 00000000`00000001 fffffa80`04999820 fffffa80`039ff040 : nt!WheapProcessWorkQueueItem+0x57
    fffff880`031afb40 fffff800`02e9a261 : fffff880`010f6e00 fffff800`02f24250 fffffa80`039ff000 00000000`0000055a : nt!WheapWorkQueueWorkerRoutine+0x25
    fffff880`031afb70 fffff800`0312c73a : 00000000`00000000 fffffa80`039ff040 00000000`00000080 fffffa80`039ec040 : nt!ExpWorkerThread+0x111
    fffff880`031afc00 fffff800`02e818e6 : fffff880`02fd7180 fffffa80`039ff040 fffff880`02fe1fc0 00000000`00000000 : nt!PspSystemThreadStartup+0x5a
    fffff880`031afc40 00000000`00000000 : fffff880`031b0000 fffff880`031aa000 fffff880`031aee40 00000000`00000000 : nt!KxStartSystemThread+0x16
    
    
    STACK_COMMAND:  kb
    
    FOLLOWUP_NAME:  MachineOwner
    
    MODULE_NAME: AuthenticAMD
    
    IMAGE_NAME:  AuthenticAMD
    
    DEBUG_FLR_IMAGE_TIMESTAMP:  0
    
    FAILURE_BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_BUS_PRV
    
    BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_BUS_PRV
    
    Followup: MachineOwner
    ---------
    
    
    

    This free analysis is provided by OSR Open Systems Resources, Inc.
    Want a deeper understanding of crash dump analysis? Check out our Windows Kernel Debugging and Crash Dump Analysis Seminar (opens in new tab/window)

    Hide DivCrash Code Links

    Hide DivLoaded Module List

    start             end                 module name
    fffff800`00bba000 fffff800`00bc4000   kdcom    kdcom.dll   
    fffff800`02e1b000 fffff800`03400000   nt       ntkrnlmp.exe
    fffff800`03400000 fffff800`03449000   hal      hal.dll     
    fffff880`00c00000 fffff880`00c2a000   ataport  ataport.SYS 
    fffff880`00c5a000 fffff880`00c67000   mcupdate mcupdate.dll
    fffff880`00c67000 fffff880`00c7b000   PSHED    PSHED.dll   
    fffff880`00c7b000 fffff880`00cd9000   CLFS     CLFS.SYS    
    fffff880`00cd9000 fffff880`00d99000   CI       CI.dll      
    fffff880`00d99000 fffff880`00df5000   volmgrx  volmgrx.sys 
    fffff880`00e00000 fffff880`00e0a000   msisadrv msisadrv.sys
    fffff880`00e0a000 fffff880`00e3d000   pci      pci.sys     
    fffff880`00e3d000 fffff880`00e4a000   vdrvroot vdrvroot.sys
    fffff880`00e4a000 fffff880`00e5f000   partmgr  partmgr.sys 
    fffff880`00e5f000 fffff880`00e74000   volmgr   volmgr.sys  
    fffff880`00e74000 fffff880`00e7b000   pciide   pciide.sys  
    fffff880`00e7b000 fffff880`00e8b000   PCIIDEX  PCIIDEX.SYS 
    fffff880`00e8b000 fffff880`00ea5000   mountmgr mountmgr.sys
    fffff880`00ea5000 fffff880`00eae000   atapi    atapi.sys   
    fffff880`00eae000 fffff880`00eb9000   msahci   msahci.sys  
    fffff880`00eb9000 fffff880`00ec4000   amdxata  amdxata.sys 
    fffff880`00ece000 fffff880`00f90000   Wdf01000 Wdf01000.sys
    fffff880`00f90000 fffff880`00fa0000   WDFLDR   WDFLDR.SYS  
    fffff880`00fa0000 fffff880`00ff7000   ACPI     ACPI.sys    
    fffff880`00ff7000 fffff880`01000000   WMILIB   WMILIB.SYS  
    fffff880`01000000 fffff880`01049000   fwpkclnt fwpkclnt.sys
    fffff880`01049000 fffff880`01095000   volsnap  volsnap.sys 
    fffff880`010c6000 fffff880`01112000   fltmgr   fltmgr.sys  
    fffff880`01112000 fffff880`01126000   fileinfo fileinfo.sys
    fffff880`01126000 fffff880`01184000   msrpc    msrpc.sys   
    fffff880`01184000 fffff880`011f6000   cng      cng.sys     
    fffff880`01205000 fffff880`013ae000   Ntfs     Ntfs.sys    
    fffff880`013ae000 fffff880`013c9000   ksecdd   ksecdd.sys  
    fffff880`013c9000 fffff880`013da000   pcw      pcw.sys     
    fffff880`013da000 fffff880`013e4000   Fs_Rec   Fs_Rec.sys  
    fffff880`01400000 fffff880`01460000   NETIO    NETIO.SYS   
    fffff880`01460000 fffff880`0148c000   ksecpkg  ksecpkg.sys 
    fffff880`0148c000 fffff880`01494000   spldr    spldr.sys   
    fffff880`01494000 fffff880`014a6000   mup      mup.sys     
    fffff880`014a6000 fffff880`014af000   hwpolicy hwpolicy.sys
    fffff880`014c8000 fffff880`015ba000   ndis     ndis.sys    
    fffff880`015ba000 fffff880`015f4000   rdyboost rdyboost.sys
    fffff880`01601000 fffff880`01800000   tcpip    tcpip.sys   
    fffff880`01858000 fffff880`01892000   fvevol   fvevol.sys  
    fffff880`01892000 fffff880`018a8000   disk     disk.sys    
    fffff880`018a8000 fffff880`018d8000   CLASSPNP CLASSPNP.SYS
    fffff880`018d8000 fffff880`018e6000   crashdmp crashdmp.sys
    fffff880`018e6000 fffff880`018f2000   dump_pciidex dump_pciidex.sys
    fffff880`018f2000 fffff880`018fd000   dump_msahci dump_msahci.sys
    fffff880`018fd000 fffff880`01910000   dump_dumpfve dump_dumpfve.sys
    Mini Kernel Dump does not contain unloaded driver list
    
    

    Show DivRaw Stack Contents

    Show DivDump Header Information

    Show DivStrings

    my specs:

    amd fx 4100 cpu

    xfx R9-270 gpu

    gskill ripjaws 4gb ram

    seagate barricuda 500 gb hdd

    gigabyte ga-78lmt-2sp mobo

    can you guys help me?

Answers

  • CW

    CPU driver?  BCC124 errors are almost always hardware related.  In this case the CPU processor bus was in the failure bucket.

    FAILURE_BUCKET_ID:  X64_0x124_AuthenticAMD_PROCESSOR_BUS_PRV

    I would start with a cpu stress test

    These are called BCC124 and are related to hardware.  Read how to diagnose and hopefully to fix them in this
    wiki

    @XPR still yours if you want it.


    Wanikiya and Dyami—Team Zigzag

    • Marked as answer by

      Thursday, February 26, 2015 2:56 AM

In this post, we look at what are the WHEA-Logger Fatal hardware and Event ID Errors as well as the associated fixes for affected PC users that may encounter the issue on their Windows 11 or Windows 10 computer.

Fix WHEA-Logger Fatal hardware and Event ID Errors

What are the WHEA Error Event Logs?

The Windows Hardware Error Architecture (WHEA) Logger is an automated service that detects hardware errors and generates Event Tracking for Windows events when such an error occurs. The system log then records these hardware errors which can be reviewed for troubleshooting purposes. The WHEA-Logger events are simply generic error codes and only indicate that there might be a hardware or driver problem.

Apart from the system crash, this event can be logged or the issue can also normally happen after a system sleep or restart, right after boot, or even while the computer is idle. Typically, you may see the following generic or specific error message in Event Viewer depending on the hardware throwing the error:

A fatal hardware error has occurred. A record describing the condition is contained in the data section of this event.

A corrected hardware error has occurred.
Reported by component: Processor Core
Error Source: Unknown Error Source
Error Type: Cache Hierarchy Error
Processor APIC ID: 0
The details view of this entry contains further information.

A fatal hardware error has occurred.
Reported by component: Processor Core
Error Source: Machine Check Exception
Error Type: Cache Hierarchy Error
Processor APIC ID: 0
The details view of this entry contains further information.

From the above error messages, you can see the processor or CPU is identified as the hardware causing the issue for the second and third instances of the error. Investigations revealed that these errors are usually related to the Kernel-Power events like the Kernel-Power Event ID 41 Task 63, Event ID 55 Kernel-Processor-Power errors on Windows PC.

If your Windows 11/10 computer keeps crashing and in Event Viewer you see the WHEA-Logger Fatal hardware with the associated Event ID 1, 17, 18, 19, 46, or 47 logged, then the generic fixes we have presented below in no particular order can be applied to resolve the issue on your system.

  1. Initial checklist
  2. Check the RAM modules
  3. Identify and manually update the faulty hardware driver
  4. Disable AMD or ATI External Events Utility (if applicable)
  5. Replace your motherboard and/or CPU

Let’s see these applicable fixes in detail.

1] Initial checklist

Initial checklist - Update BIOS

  • Make sure Windows is updated to the latest version/build. Check for available BIOS updates and do the needful. Also make sure all drivers, especially the chipset drivers are updated on your system. In addition, you may have to troubleshoot in the Clean Boot state.
  • For some affected PC users, they reported that disabling the C-state in BIOS did resolve the issue. To perform this task, you will need to check with your PC manufacturer to know the correct process to disable the C-state in BIOS as different brand computers may have a different process to disable the C-state in BIOS. Note that hibernation doesn’t work when this setting is disabled, but Sleep does.
  • Uninstall NVIDIA GeForce Experience software. As strange as it might seem, reportedly this worked for some affected PC users. So, you can give the fix a try if it applies to your circumstance whereby you have an NVIDIA GPU installed on your system.

Read: Event ID 154, The IO Operation failed due to a hardware error

2] Check the RAM modules

Check the RAM modules - Memtest Windows

Make sure you have installed the supported memory modules for your computer. If you have already, then you can run the Memtest86+ tool to test your RAM. Depending on the outcome of the memory test, if it’s a case of bad RAM, then you will have to replace the RAM modules. Otherwise, you can just reseat the module(s) and see if that solves the WHEA Logger Fatal hardware and Event ID errors on your Windows 11/10 system.

Read: MEMORY_MANAGEMENT 0x0000001A error

3] Identify and manually update the faulty hardware driver

Identify and manually update the faulty hardware driver - Driver Verifier utility

First, you can run Driver Verifier, a utility built into the Windows OS that will often find the driver/drivers that are the underlying cause of BSOD/crashes. If you have taken the necessary actions regarding the driver(s) that were identified, but the issue persists, then you can follow the steps below to specifically identify and manually update the problematic hardware driver.

  • Open Event Viewer.
  • Navigate to the Windows Event Logs/System.
  • Locate and view the WHEA-Logger errors. The Event ID could be any of the numbers we have identified above or any other number.
  • Double-click on the error in the logs then click on the DETAILS tab.
  • Expand the SYSTEM details.
  • Now, look specifically for BUS, DEVICE, and FUNCTION numbers to identify which item in the Device Manager is causing the problem.
  • Leave Event Viewer open, and now open Device Manager.
  • Scroll down to the System Devices section. You will probably see something similar to the following, but the numbers on the far right will differ. You could have one or more instances.
Intel(r)5520/5500/x58 i/o hub pci express root port 3- 340a
Intel(r)5520/5500/x58 i/o hub pci express root port 7- 340e
  • Double-click on each of these PCI Express Root Port items in Device Manager and note the location which will be something like this:
PCI bus 0, device 3, function 0.
  • Now, find the one that matches what you found in the Windows logs and cross reference the error in the Windows system log with the item in Device Manager with the same BUS, DEVICE, and FUNCTION location.
  • Double-click on that item and go to the Driver tab.
  • Click Update driver > Browse > Let me Choose.
  • From the compatible hardware driver list choose the PCI Express Standard Root Port driver.
  • Click Next to complete the driver update.

Repeat for each of the errors but only if they have a different BUS, DEVICE LOCATION. If they are all the same, then it is not necessary.

4] Disable AMD or ATI External Events Utility (if applicable)

Disable AMD or ATI External Events Utility

This fix applies if you have an AMD processor. To disable the AMD or ATI External Events Utility on your Windows 11/10 computer, follow these steps:

  • Press the Windows key + R to invoke the Run dialog.
  • In the Run dialog box, type services.msc and hit Enter to open Services.
  • In the Services window, scroll and locate the AMD External Events Utility service.
  • Double-click on the entry to edit its properties.
  • In the properties window, click the drop-down on the Startup type and select Disabled.
  • Next, click Stop under Service status to stop the service.
  • Click Apply > OK to save changes.

Check if the issue is resolved. Otherwise, try the next solution.

5] Replace your motherboard and/or CPU

At this point, if the issue persists, then it could be you have an unsupported or incompatible (it should be the one that shipped with the device or the exact replacement) MOBO and/or CPU, or it could be one or either of the hardware is faulty – if this is the case, then you will need to replace this hardware by a PC hardware technician. Otherwise, if you’re sure your motherboard and CPU are supported and compatible, then you can perform System Restore which will likely resolve the issue if it’s software related.

Hopefully, any of these suggestions should work for you!

What can cause a WHEA error?

Generally, a WHEA error indicates that a hardware issue has occurred on your Windows 11/10 computer. The known issues could be related to such things as device drivers, hard drives, processors, power supply, and bad or corrupted memory (DRAM). Hardware components contain error detection mechanisms that can detect when a hardware error condition exists – these errors can be classified as either corrected errors or uncorrected errors.

Related post: WHEA_UNCORRECTABLE_ERROR, 0x00000124 BSOD [Fixed].

  • Произошла неустранимая аппаратная ошибка компонент память источник ошибки machine check exception
  • Произошла неустранимая ошибка директ икс warzone
  • Произошла неприятная ошибка работа мастера диагностики приостановлена
  • Произошла неустранимая ошибка tomb raider
  • Произошла непредвиденная ошибка текст ошибки