- Remove From My Forums
-
Вопрос
-
Сервер WIN 2008 R2 Standart, Motherboard TYAN S8230GM4NR, CPU — AMD Opteron 6172, RAM 32 GB
После установки обновлений в системе начала появляться ошибка WHEA-Logger error code 47
Согласно MSDN ошибка памяти, память полностью заменили, но на ошибку это не повлияло, после перезагрузки ошибка исчезает, но через 2-3 часа работы появляется снова, обновление BIOS и перенастройка схемы электропитания результатов не дали, после появления
ошибки постепенно падает производительность системы с последующим зависанием сервера, при этом на win 2003 r2 этот же сервер работает нормально без сбоев, лицензия позволяет перейти на 2003-й, но по ряду причин это не возможно. До установки обновлений
проблемы не было.Код ошибки:
Произошла устранимая аппаратная ошибка.
Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера[ Name] Microsoft-Windows-WHEA-Logger [ Guid] {C26C4F3C-3F66-4E99-8F8A-39405CFED220} Keywords 0x8000000000000000 [ SystemTime] 2012-08-18T12:31:11.797962000Z [ ActivityID] {83A563F9-DA85-4948-8715-9B573D980251} [ ProcessID] 800 [ ThreadID] 7256 FRUId {00000000-0000-0000-0000-000000000000} PhysicalAddress 0x2e1162be0 RawData 435045521002FFFFFFFF03000200000002000000690300000A1F0C0012080C140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F89063D840285F66CD01000000000000000000000000000000000000000000000000580100004900000001020000010000001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E80000000000000000000000000000000002000000000000000000000000000000000000000000000002000000000000000000000000000000E02B16E102000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000007F010000000000000002040000030000910F100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000200000060A118593D7DCD01000000000000000000000000000000000000000004000000130A0800004004D4E02B16E10200000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
Ответы
-
Судя по информации из сообщения у Вас исправимая машинная ошибка, обнаруженная в процессоре.
Обращайтесь к поставщику сервера. MS за ваше битое железо не отвечает.
Слава России!
-
Помечено в качестве ответа
28 сентября 2012 г. 9:02
-
Помечено в качестве ответа
-
Из вашей ссылки:
Beginning with Windows Server 2008 and Windows Vista SP1, when a hardware error occurs, the operating system creates an
error record that describes the error condition and sends an event tracing for Windows (ETW) event that contains the error record to user mode.
Именно поэтому
… при этом на win 2003 r2 этот же сервер работает нормально без сбоев
На Windows Server 2003 R2 точно не отмечается никаких внешних проявлений проблемы? Вы проверяли на 32- или на 64-битном Windows Server 2003?
-
Изменено
osr_MVP
11 сентября 2012 г. 7:09 -
Помечено в качестве ответа
Yuriy Lenchenkov
28 сентября 2012 г. 9:02
-
Изменено
Сообщения: 217
Благодарности: 17
Профиль | Отправить PM | Цитировать
Купили новый сервер HP Proliant DL 580 G7. Установили Win 2008 R2 SP1 все ок. Отдельная проблема была с дровами. Только онлайн с сайта HP. Но вроде тоже все решили через их утилиты обновления, но появилась сначала ошибка Код события 18 Событие WHEA-logger (Извиняюсь полое описание 18- ой ошибки не осталось почистил логи) и
Имя журнала: System
Источник: Microsoft-Windows-WHEA-Logger
Дата: 21.03.2011 10:06:38
Код события: 47
Категория задачи:Отсутствует
Уровень: Предупреждение
Ключевые слова:
Пользователь: LOCAL SERVICE
Компьютер: hyperv2.ckbmp.ru
Описание:
Произошла устранимая аппаратная ошибка.
Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера
Дополнительые сведения см. в подробном представлении этой записи.
Xml события:
47
0
3
0
0
0x8000000000000000
12405299
System
hyperv2.ckbmp.ru
1
<00000000-0000-0000-0000-000000000000>
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0x0
0
873
435045521002FFFFFFFF03000200000002000000690300002506070015030B14000000000000000000000 0000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4E BD4F8905D9EAE6B92E6CB0100000000455200000000000000000000000000000000000058010000490000000102000001000 0001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000 000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB000000000000000000000 0000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF 94257459C33565E5CC3F7E800000000000000000000000000000000020000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 000000000000000000000000000000000000000000000000057010000000000000002000000000000A506010000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000007000000000000000000000000000000000000000000000 00000000000000000000000000000000001000000010000008D99F68496E7CB0107000000000000000000000000000000000 00000080000009F000100000200CC00D7656F0400000080110000000000C0000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0000000000000000000000000000000000000000000000000000000000000
Первая ошибка решилась обновлением биоса. Ошибка известная только на сайте мелкомягких не нашлось заплатки на Win 2008 R2 x64. Обновление биоса спасло. А вот по второй ришлось помучиться. Как видно в ошибке пишет про память. Менял местами проверял Memtest-ом Никаких решений. Мемтест кажет что все ок, но это и понятно так как память регистровая ошибки сама проверяет. Короче решения в нете не нашел. Начал копать в итоге даже тех поддержка HP не смогла мне внятно обьяснить что да как. Начал решать проблему с биоса и опа в точку. Короче эта ошиба появлеться когда идет несоответствие питания с процами и памятью. Переключил питание на High Perfomance. Уже пару часов ошибок не видно хотя раньше каждые 15-20 минут появлялись. Написал этот пост для того чтобы хотябы одно решение было в инете . Может кому поможет
——-
Никак не могу собраться с мыслями, то я занят, то они.
Источник
Ошибки kernel: CPU 1: Machine Check: 0 Bank 0: d020000000100011
Проц AMD Ryzen 5 3500X 6-Core Processor. Без разгона. BIOS на мат.плату последний стоит.
с недавних пор начали сыпаться ошибки в лог. Причину их понять не могу:
Имеет смысл сдать по гарантии, само вряд ли пройдёт. До этого можно попробовать сбросить настройки UEFI и отключить XMP-профиль памяти, чтобы она работала на каких-нибудь 2666 МГц.
XMP стоит, к слову. Вроде на 3000 Mhz.
Corrected error, no action required
не понятно, почему этого раньше не было (пару месяцев назад), а сейчас появилось.
Сдай проц по гарантии.
Материнская плата какая? Zen2 не очень хорошо работают на старых чипсетах, особенно на ранних ревизиях плат из начала 17 года.
Зачем? Никаких проблем при эксплуатации нету. Не хочу комп разбирать. Раньше этой ошибки точно не было. Появилась она недавно.
ASRock B450M Pro4 Биос последний прошит.
Тогда скорее всего дело не вней. Как я понял, ошибка по L2-кэшу на одном из ядер. Но т.к. ecc кэша отрабатывает штатно, то не уверен, что такой процессор будет просто поменять. Только если напрямую через производителя.
Как ты думаешь, когда проц вместо выполнения 1 инструкции срет исключение, печатает всю эту портянку в лог — у тебя производительность не падает ни разу?
BIOS на мат.плату последний стоит.
не понятно, почему этого раньше не было (пару месяцев назад) а сейчас появилось.
Раньше этой ошибки точно не было. Появилась она недавно.
Три вопроса тогда.
За эти два месяца обновлял ли ядро?
Перепрошивал ли биос?
В простое посмотри будут ли сыпаться логи, когда температура проца минимальна.
И под нагрузкой посмотри, есть ли разница.
Попробуй разные ядра.
Возьми лайв твоего дистрибутива и с него посмотри как будет ситуация развиваться.
За эти два месяца обновлял ли ядро?
Да, все официальные арчевовские ядра обновлял своевременно.
Да, пробовал 4 последние версии биоса, в том числе тот, на котором ошибки тогда давно не было. Но на всех них ошибка воспроизводится сейчас.
Нет, вот сейчас протестю.
Я вот вспомнил, что вроде это появилось после обновления amd-ucode какой-то версии.
Если таким сыпет, action как раз явно required. Игнорировать можно было бы, если бы это была одна такая ошибка за месяц.
Ясно. Инет даёт кучу мнений по этим ошибкам, начиная от битых планок оперативки до хардварных проблем с деградацией процессора в силу его перегрева — на сайте амд есть топик, где у 5-6х человек такие же проблемы. Кому-то помогает перепрошивка биоса, кому-то проверка power supply voltages, кому-то простая чистка кулера с заменой термопасты, а кому-то даже замена процессора по гарантии.
вроде это появилось после обновления amd-ucode какой-то версии
Поэтому-то и нужно тестировать разными версиями ос/ядра/лайв, чтобы убедиться, что проблема не софтварная, а хардварная.
В общем.
* Отключил XPM — все тоже самое.
* Пробовал загрузиться с systemrescuecd — и уже в начале загрузки увидел тоже самое сообщение с ошибкой.
* Прогнал через memtest — ошибок нет. Скрин https://lostpic.net/image/y6LY
Какие еще будут предположения?
Прогнал через memtest — ошибок нет.
Ошибка (скорректированная) не в памяти, а в кеше L1 (который индивидуальный для каждого ядра) [Hardware Error]: cache level: L1, tx: DATA
Это либо «надо менять железо», либо кто-то умышленно портит кеш, не заботясь о коррекции ошибок (всякий микрокод, хрен-пойми чем занимающийся), либо неправильно читаются и интерпретируются сообщения об ошибках и состоянии процессора.
ps Есть ли гарантия на проц?
mcelog: ERROR: AMD Processor family 23: mcelog does not support this processor. Please use the edac_mce_amd module instead. CPU is unsupported
гарантия на проц до 11.05.2021
Загрузился с Ubuntu 20.04 и вижу:
По всей видимости, проблема аппаратная.
Даже не знаю, что еще и попробовать? Обнулить BIOS/UEFI? Но вроде я это делал.
А как по гарантии сдавать? Проблем ведь явных никаких нету.
Да и как мне несколько месяцев без проца сидеть?
mcelog does not support this processor.
Please use the edac_mce_amd module instead
Ты читать умеешь? О чем это говорит? О том что надо верить сообщениям об ошибках, которые не поддерживаются? Верить неверным?
Это запланированная деградация, сынок
Запроектированное саморазрушение сработало чуть раньше установленного срока
Предполагалось, что ЦА процессоросодержащих подделок никогда не посмотрит в лог и не станет разбираться в причинах
Но не волнуйся, они учтут свой промах, никакая информация об ошибках больше выводиться не будет…
ну поидее запрашиваешь RMA описываешь проблему, тебе говорят окей вот таой порядок действий и там либо дают проц заглушку взамен этого на время разбирательств, либо сразу меняют на новый.
Так это точно является гарантийным случаем?
На что это вообще влияет? На производительность, безопасность, стабильность?
Мне _очень_ не хочется разбирать комп до проца.
является ли это гарантийным случаем тебе должны сказать в ответ на твой RMA запрос..
я не совсем понял: кому и куда писать этот запрос?
начинаешь с продавца который выдал тебе гарантию и идёшь вверх по лесенке до производителя.
Так а это точно аппаратная проблема с процом, а не мат. платой там? Оперативкой? Может ли быть такое из-за перегрева, к примеру? Неподходящего блока питания?
Может ли быть такое из-за перегрева, к примеру? Неподходящего блока питания?
У тебя гарантия на весь комп или на запчасти?
Если на весь комп — то какая разница, если есть гарантия?!
Если на запчасти — то тогда действительно попробуй сменить временно проц на другой.
а это точно аппаратная проблема с процом
чтобы сказать наверняка, нужно сделать выемку твоего проца и протестировать в 100%-но исравном аппратном окружении. если будешь свой проц отдавать в сервис, они будут твой проц таким образом тестировать на своем оборудовании.
поэтому тебе выше вроде и рекомендовали сделать тесты памяти. хоят маловероятно, что память.
Может ли быть такое из-за перегрева, к примеру?
да, может. поэтому тебе выше опять же рекомендовали потестить проц холодным и под нагрузкой. охлади его как следует и потестируй. и поэтому тебе рекомендовали прочистить кулер и заменить термопасту. ты это сделал?
конечно. тебе опять же выше кто-то писал про вольтаж. может быть в нём дело. причин может быть масса.
а может быть вообще твой проц когда-то перегрелся и начал дегенирировать. такое тоже бывает. опять же надо тестить.
отдай проц по RMA, напиши заявку, укажи все странности и жди ответа от сервис центра.
поэтому тебе выше вроде и рекомендовали сделать тесты памяти. хоят маловероятно, что память.
Да, память гонял. Никаких проблем не было.
рекомендовали потестить проц холодным и под нагрузкой
Эта ошибка возникает при запуске компа на холодную. То есть когда он всю ночь был выключен.
поэтому тебе рекомендовали прочистить кулер и заменить термопасту. ты это сделал?
Компу 9 месяцев. Покупал все новое. Перегрева никакого нету. Ни под нагрузкой, ни без нее. Играл в 3Д-игры по-многу часов — никаких проблем не было. Ни по производительности, на по стабильности.
конечно. тебе опять же выше кто-то писал про вольтаж
Гляну в биосе, но вроде все нормально там было.
а может быть вообще твой проц когда-то перегрелся и начал дегенирировать. такое тоже бывает. опять же надо тестить.
Маловероятно. Я его сильно никогда не гонял.
У меня появилась еще идея по оффтопиком проверить на эту ошибку. Какой тулзой это можно сделать? Плюс бенчмарки погонять можно.
Меня смущает что есть _только_ эта ошибка в логе. Других никаких проявлений нету.
Как и оказалось, под офтопиком точно такая же проблемa. https://lostpic.net/image/y66R
Вывешиваю решение для тех, кто сталкивается с таким же багом в ОС:
1. в BIOS заходите на страницу усовершенствованных вариантов технологии энергосбережения процессора.
2. Отключаете функцию CPU EIST Function
3. Отключаете функцию CPU Internal Thermal Control
4. Отключаете функцию CPU Enhanced Halt (C1E)
5. Переходите на страницу управления питанием материнской платы
6. Отключаете все C-States
7. Перезагружаетесь с сохранением настроек.
Я поотключал все что можно в настойках CPU, разгона и прочих устройств, но к успеху это не привело.
собственно это оказалось реально проблема с напряжением процессора , а не ПО , хотелось бы узнать как правильно настроить биос , в том числе vcore в данный момент я включил в биосе MCE , load linde calibration — extreme , load line AC DC — extreme + выключены c-state и intel shift technology
Источник
Вдруг ни с того, ни с сего, посыпались в системный журнал основного КД ошибки, да не просто ошибки а с источником «WHEA-Logger», да с
событием номер 47.
Всё бы ничего, но описание ошибки напрягающее:
Произошла устранимая аппаратная ошибка.
Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера
Так как описание говорит…мало, что говорит, то пришлось брать помощь гугла. Как ни странно, но проблема не редкая.
WHEA-logger — служба, предназначенная для мониторинга аппаратных неисправностей. То есть имеет место железная проблема.
Вот например на технете. Или
на hp.com. Ладно, не буду мутить
воду. Проблема заключается в неверно настроенном профиле питания процессора (после сброса биос на сервере HP DL120 его значение по-умолчанию — энергосбережение, power efficiency).
На сервере профиль питания должне быть каким? Правильно — High performance. Перезагрузка, настройка в биос параметра питания, загрузка и нет новых ошибок с таким источником:)
Tags: windows, Server, косяки, 2008, 2014, WHEA-logger, 47, R2
- Remove From My Forums
-
Вопрос
-
Сервер WIN 2008 R2 Standart, Motherboard TYAN S8230GM4NR, CPU — AMD Opteron 6172, RAM 32 GB
После установки обновлений в системе начала появляться ошибка WHEA-Logger error code 47
Согласно MSDN ошибка памяти, память полностью заменили, но на ошибку это не повлияло, после перезагрузки ошибка исчезает, но через 2-3 часа работы появляется снова, обновление BIOS и перенастройка схемы электропитания результатов не дали, после появления
ошибки постепенно падает производительность системы с последующим зависанием сервера, при этом на win 2003 r2 этот же сервер работает нормально без сбоев, лицензия позволяет перейти на 2003-й, но по ряду причин это не возможно. До установки обновлений
проблемы не было.Код ошибки:
Произошла устранимая аппаратная ошибка.
Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера[ Name] Microsoft-Windows-WHEA-Logger [ Guid] {C26C4F3C-3F66-4E99-8F8A-39405CFED220} Keywords 0x8000000000000000 [ SystemTime] 2012-08-18T12:31:11.797962000Z [ ActivityID] {83A563F9-DA85-4948-8715-9B573D980251} [ ProcessID] 800 [ ThreadID] 7256 FRUId {00000000-0000-0000-0000-000000000000} PhysicalAddress 0x2e1162be0 RawData 435045521002FFFFFFFF03000200000002000000690300000A1F0C0012080C140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F89063D840285F66CD01000000000000000000000000000000000000000000000000580100004900000001020000010000001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E80000000000000000000000000000000002000000000000000000000000000000000000000000000002000000000000000000000000000000E02B16E102000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000007F010000000000000002040000030000910F100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000200000060A118593D7DCD01000000000000000000000000000000000000000004000000130A0800004004D4E02B16E10200000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
Ответы
-
Судя по информации из сообщения у Вас исправимая машинная ошибка, обнаруженная в процессоре.
Обращайтесь к поставщику сервера. MS за ваше битое железо не отвечает.
Слава России!
-
Помечено в качестве ответа
28 сентября 2012 г. 9:02
-
Помечено в качестве ответа
-
Из вашей ссылки:
Beginning with Windows Server 2008 and Windows Vista SP1, when a hardware error occurs, the operating system creates an
error record that describes the error condition and sends an event tracing for Windows (ETW) event that contains the error record to user mode.
Именно поэтому
… при этом на win 2003 r2 этот же сервер работает нормально без сбоев
На Windows Server 2003 R2 точно не отмечается никаких внешних проявлений проблемы? Вы проверяли на 32- или на 64-битном Windows Server 2003?
-
Изменено
osr_MVP
11 сентября 2012 г. 7:09 -
Помечено в качестве ответа
Yuriy Lenchenkov
28 сентября 2012 г. 9:02
-
Изменено
My HP Z820 workstation (BIOS v. 3.52) encounters prolonged periods of extremely frequent (several times each second) System Warnings in Windows 7 64-bit Event Viewer: (here is part of it)
Log Name: System
Source: Microsoft-Windows-WHEA-Logger
Date: 03/01/2014 18:11:16
Event ID: 47
Task Category: None
Level: Warning
Keywords:
User: LOCAL SERVICE
Computer: ******
Description:
A corrected hardware error has occurred.
Component: Memory
Error Source: Corrected Machine Check
When it first happened in June 2013 it lasted for more than a month. The System Event Viewer archive filled up with all those repeated warnings (>100 GBytes in all!). Sometimes it was accompanied by BIOS error messages during start-up:
942 Memory Training Error DIMM 8 on CPU1 experienced an error during training (Code 301C).
It offered to press F1 to boot.
Then the Z820 began failing to boot or restart, and finally HP local support replaced 2 of my four 8-GByte memory units. It helped for a few months.
Last week WHEA-logger Event ID: 47 reappeared in full presence and already filled 1.7 GBytes of System Event Viewer archive. Sometimes it is inactive but then the warnings reappear. (without 942 errors this time… and no problem at boot time — yet.)
The Advisory blames Intel Xeon E7-8800/4800/2800 processors for this and offers a workaround by modifying «Minimum Processor Idle Power Package State — Package C3 State» Using the ROM-Based Setup Utility (RBSU) in the ProLiant DL580 G7 series servers BIOS.
So, my questions are:
1. Is the WHEA-logger Event ID: 47 in my Z820 related to the peculiar behavior of the dual Intel Xeon processors — in this case the initial E5-2670 type, not E7 — installed in Z820, and not a real memory hardware fault?
2. How do I apply this workaround in Z820 BIOS, where the BIOS Setup (F10) OS Power Management options are different from those in the HP Proliant Server Support Advisory?
Please advise.
My HP Z820 workstation (BIOS v. 3.52) encounters prolonged periods of extremely frequent (several times each second) System Warnings in Windows 7 64-bit Event Viewer: (here is part of it)
Log Name: System
Source: Microsoft-Windows-WHEA-Logger
Date: 03/01/2014 18:11:16
Event ID: 47
Task Category: None
Level: Warning
Keywords:
User: LOCAL SERVICE
Computer: ******
Description:
A corrected hardware error has occurred.
Component: Memory
Error Source: Corrected Machine Check
When it first happened in June 2013 it lasted for more than a month. The System Event Viewer archive filled up with all those repeated warnings (>100 GBytes in all!). Sometimes it was accompanied by BIOS error messages during start-up:
942 Memory Training Error DIMM 8 on CPU1 experienced an error during training (Code 301C).
It offered to press F1 to boot.
Then the Z820 began failing to boot or restart, and finally HP local support replaced 2 of my four 8-GByte memory units. It helped for a few months.
Last week WHEA-logger Event ID: 47 reappeared in full presence and already filled 1.7 GBytes of System Event Viewer archive. Sometimes it is inactive but then the warnings reappear. (without 942 errors this time… and no problem at boot time — yet.)
The Advisory blames Intel Xeon E7-8800/4800/2800 processors for this and offers a workaround by modifying «Minimum Processor Idle Power Package State — Package C3 State» Using the ROM-Based Setup Utility (RBSU) in the ProLiant DL580 G7 series servers BIOS.
So, my questions are:
1. Is the WHEA-logger Event ID: 47 in my Z820 related to the peculiar behavior of the dual Intel Xeon processors — in this case the initial E5-2670 type, not E7 — installed in Z820, and not a real memory hardware fault?
2. How do I apply this workaround in Z820 BIOS, where the BIOS Setup (F10) OS Power Management options are different from those in the HP Proliant Server Support Advisory?
Please advise.
Куратор(ы):
m026
Автор | Сообщение | |||
---|---|---|---|---|
|
||||
Куратор темы Статус: Не в сети |
Обсуждение и разгон оперативной памяти на китайских Х99 Внимание всем!!! Будьте внимательны с покупкой планок обЪемом 32Гб, могут не заработать! Есть случаи когда вообще не работает, или работает только в двух или трех канале…!
Внимание! При изменение тайминга TCWL, проявите особую осторожность! Некорректное значение TCWL, в лучшем случае приведет к невозможности запустить плату и необходимости сброса настроек BIOS перемычкой, в худшем к окирпичиванию платы с последующей прошивкой BIOS программатором! После смены таймингов, компьютер следует выключить кнопкой, а затем, включить, так как при обычной перезагрузке изменения могут корректно не примениться Дополнительные материалы Проблему низких показателей DDR3 решает Параметр SET Throttlling Mode -> OLTT Если что то нужно добавить в шапку, пишите в личку m026 Последний раз редактировалось m026 03.08.2020 10:00, всего редактировалось 15 раз(а). |
Реклама | |
Партнер |
v111 |
|
Member Статус: Не в сети |
Вот может кому пригодиться Xeon E5-2678 X99-TF, DDR3 ECC REG Samsung M393B1K70CH0-CH9, 2133, тайминги из «таблицы»… |
Kipish |
|
Member Статус: Не в сети |
v111 писал(а): Вот может кому пригодиться Xeon E5-2678 X99-TF, DDR3 ECC REG Samsung M393B1K70CH0-CH9, 2133, тайминги из «таблицы»… Тогда и таблицу сюда выкладывай |
lesh90 |
|
Junior Статус: Не в сети |
Выставил из таблицы — не работает. |
v111 |
|
||
Member Статус: Не в сети |
Kipish писал(а): Тогда и таблицу сюда выкладывай В шапке главной темы….была…Фиг его знает.. была же.. https://forums.overclockers.ru/gallery/ … e_id=44067 Вложение:
Добавлено спустя 1 минуту 37 секунд: lesh90 писал(а): Выставил только основные (12-12-12-32 для ddr3 2133) — заработало Ну а теперь эксперемнируйте с вторичкой…Долго это все.. Добавлено спустя 3 минуты 51 секунду: m026 Добавь тут в шапку видео… А вот как должна выглядеть дешевая DDR3 1333 ECC REG после разгона… Это для примера…
|
lesh90 |
|
||
Junior Статус: Не в сети |
v111 писал(а): Ну а теперь эксперемнируйте с вторичкой…Долго это все.. На двухканале получилось так. Думаю, пока можно остановиться =)
|
v111 |
|
Member Статус: Не в сети |
lesh90 писал(а): На двухканале получилось так. Думаю, пока можно остановиться =) Про скоростя на двух канал мне судить сложно, но латентность в норме… |
lesh90 |
|
Junior Статус: Не в сети |
Подскажите, будет ли работать 4х канал на x99tf, если к плашкам 2×16 ddr3 поставить 2×8 или 2×4? |
v111 |
|
Member Статус: Не в сети |
lesh90 писал(а): если к плашкам 2×16 ddr3 поставить 2×8 или 2×4? Сам когда то лазил по инету в поисках ответа… Уже смутно помню, но вроде как он будет работать частично, то есть если потребление памяти, в даном случае, будет укладываться в симетрию планок, если превысит то будет переходит на двух канал. То есть если вы к двум 16 Гб планкам, доставите две по 8, то четырех канал будет работать если потребление не превысыт 32 Гб… Если выше то та память,что превышает 32 Гб уже будет работать в двухканальной скорости Помоему как то так.. Если не прав поправте.. |
causus |
|
Member Статус: Не в сети |
Потихоньку взялся за разгон памяти.. У меня нет этого пункта про троттлинг памяти, кто знает как открыть подскажите. Kostik44 писал(а): Плохо рылся:IntelRCSetup -> Memory Configuration -> Memory Thermal -> Set Throttling Mode = (CLTT или OLTT) ставишь OLTT. У меня в BIOS уже выставлен по умолчанию. Пункт с частотой был заменен на вольтаж памяти, после сброса биоса на дефолт пункт появился. Теперь к делу. Память такая: Результаты: |
Kipish |
|
Member Статус: Не в сети |
BOBKOC писал(а): значит начни пока как посоветовали↑ 12-12-12-32 и остальное в 0. Будет там стабильность тогда и мутить в понижения В общем вот чего получилось. ПК засыпает и просыпается вроде нормально. Memtest5 пишет тестирование закончено и ошибок не обнаружено. Вложение:
Ну и тайминги. Вложение:
Вложение:
Стоит ещё чего-нибудь покрутить или так и оставить? |
causus |
|
Member Статус: Не в сети |
Kipish писал(а): В общем вот чего получилось. Похоже на то, что у меня такая-же память как и у тебя, только у тебя Y-низковольтная. Попробую твои тайминги, результаты вроде неплохие. Один вопрос не понятен — почему у тебя в тайминг конфигураторе частота 2323Гц, в твикере 2073? Должна же быть 2133? Kipish писал(а): На этом скрине верхний бенчмарк до сна, нижний после сна. Анлок что-ли не используешь? |
Kipish |
|
Member Статус: Не в сети |
causus писал(а): Похоже на то, что у меня такая-же память как и у тебя, только у тебя Y-низковольтная. Попробую твои тайминги, результаты вроде неплохие. Один вопрос не понятен — почему у тебя в тайминг конфигураторе частота 2323Гц, в твикере 2073? Должна же быть 2133? Первая планка YKO она идёт 1.35/1.5, остальные три CKO они 1.5. Почему так показывает частоту я не знаю, в Bios показывает правильно 2133. causus писал(а): Анлок что-ли не используешь? Пока нет, вначале хочу с памятью разобраться окончательно, а уж потом и анлоком займусь. |
causus |
|
Member Статус: Не в сети |
Kipish писал(а): Первая планка YKO она идёт 1.35/1.5 Это изначальная задумка/требование или просто так подобралась память? Kipish писал(а): Пока нет, вначале хочу с памятью разобраться окончательно, а уж потом и анлоком займусь. В общем-то это правильно — убрать фактор анлока процессора при разгоне памяти. |
Kipish |
|
Member Статус: Не в сети |
causus писал(а): Это изначальная задумка/требование или просто так подобралась память? Нет, я хотел бы чтобы они были абсолютно одинаковые, но это то, что прислал продавец. |
causus |
|
Member Статус: Не в сети |
@kipish а точно стабильна система на этих таймингах у вас? Сначала запустил на базовых таймингах, которые подобрала система — почти то же, только trFC=171, twtr и trtp = 9. Аиду прошел, мемтест прошел, корону прошел — на запуск CPU_Z поймал синий экран. Посмтрел журнал — куча ошибок 47 (память). Поставил твои тайминги, та же ерунда. Добавлено: тоже поймал синий экран. Кто из опытных — подскажите, в какую сторону и по каким позициям копать? Мои первоначальные тайминги @2133: Последний раз редактировалось causus 01.05.2020 15:32, всего редактировалось 1 раз. |
BOBKOC |
|
||
Member Статус: Не в сети |
Kipish писал(а): но это то, что прислал продавец. ну по большому счёту у тебя считай все 1.5, но если что, ту что 1.35 можно поперемещать по слотам если будут ошибки и поглядеть будет ли толк(обычно плохие планки поближе к процу ставят)
Последний раз редактировалось BOBKOC 01.05.2020 17:25, всего редактировалось 7 раз(а). |
causus |
|
Member Статус: Не в сети |
BOBKOC писал(а): а так православные YKO@2133 должны в этом духе выдавать: О! Вовремя |
Kipish |
|
Member Статус: Не в сети |
causus писал(а): @kipish а точно стабильна система на этих таймингах у вас? Сначала запустил на базовых таймингах, которые подобрала система — почти то же, только trFC=171, twtr и trtp = 9. Аиду прошел, мемтест прошел, корону прошел — на запуск CPU_Z поймал синий экран. Посмтрел журнал — куча ошибок 47 (память). Поставил твои тайминги, та же ерунда. Добавлено: тоже поймал синий экран. Кто из опытных — подскажите, в какую сторону и по каким позициям копать? Ошибок по коду 47 у меня нет, есть предупреждения 47 (Произошла устранимая аппаратная ошибка.Компонент: память |
—
Кто сейчас на конференции |
Сейчас этот форум просматривают: Google Adsense [Bot], ZloKira и гости: 7 |
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения |
Лаборатория
Новости
-
December 16 2014, 09:51
- IT
- Cancel
Проблемы с памятью
Добрый день, господа. Второй день мучаюсь проблемой:
имеется сервер с материнкой gigabyte GA-6PXSV3 (биос версии r8) в нее воткнуты 4 планки памяти IBM 43W9453 по 8 гиг. на сервере: 2008r2 + MSSQL с ббазой в 5 гиг и вебсервисом локальным, акронис 11.5
Когда все 4 планки установлены, при выполнении малейшей задачи (копирование файлов, запуск приложения и т.д.) начинает сыпаться ошибка памяти:
Event ID: 47 WHEA-Logger
A corrected hardware error has occurred.
Component: Memory
Error Source: Corrected Machine Check
The details view of this entry contains further information.
FRUId | {00000000-0000-0000-0000-000000000000} |
RawData | 435045521002FFFFFFFF030002000000020000006903000019300F000F0C0E140000000000000000000000000000000000000000000000000000000000000000BDC407CF89B7184EB3C41F732CB57131B18BCE2DD7BD0E45B9AD9CF4EBD4F890AAACCC877E18D001000000004552000000000000000000000000000000000000580100004900000001020000010000001411BCA5646FDE4EB8633E83ED7C83B100000000000000000000000000000000020000000000000000000000000000000000000000000000A1010000C00000000102000000000000ADCC7698B447DB4BB65E16F193C4F3DB0000000000000000000000000000000002000000000000000000000000000000000000000000000061020000080100000102000000000000011D1E8AF94257459C33565E5CC3F7E8000000000000000000000000000000000200000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000057010000000000000002000000000000E4060300000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000040000000000000000000000000000000000000000000000000000000000000000000000000000000100000001000000F4C8FD8F7E18D001040000000000000000000000000000000000000007000000910001004000008C006684020000000086D25240210000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 |
Запись падает в лог сначала в виде предупреждения, потом в виде ошибки, потом, есесьна БСОД.
Когда убираешь 2 планки, (оставляешь 2 соответственно) -система работает на ура. данная ошибка проскакивает ОЧЕНь редко(но проскакивает) — от нагрузки не зависит.
Скьюлю использование памяти ограничено, установлены последние дрова на систему и все обновления, потребление памяти и загрузка процессора — в низовых пределах.
Пробовал разные настройки биоса, разные режимы работы памяти ( мирроринг, индепендед и т.д.), пробовал дефолтный биос, менял память местами, пробовал разщные слоты.
По советам из гоогления ставил настройки питания в хайперфоманс в системе и в биосе.
Мемтест86 и виндовый мемтест проходил для всей памяти сразу и по-отдельности — без ошибок.
БП поменян на новый и более мощный.
Память резинками терта, на дефекты осмотрена и слоты на материнке кисточками чищены и продуты.
Кто сталкивался с подобным? Это что? винда? железо? брак материнки, недостаточное питание памяти или несовместимость?
Зараннее спасибо.
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
1 |
|
Произошла устраненная аппаратная ошибка21.07.2022, 18:19. Показов 3560. Ответов 44
Приветствую. Без воды сразу рассказываю. Произошла устраненная аппаратная ошибка Сообщивший компонент: ядро процессора Дополнительные сведения содержатся в подробностях этой записи. — System — Provider [ Name] Microsoft-Windows-WHEA-Logger EventID 19 Version 0 Level 3 Task 0 Opcode 0 Keywords 0x8000000000000000 — TimeCreated [ SystemTime] 2022-07-21T14:51:02.8607271Z EventRecordID 35579 — Correlation [ ActivityID] {57a25031-b53f-426e-a740-393a144de8e0} — Execution [ ProcessID] 1920 Channel System Computer WSWS9090 — Security [ UserID] S-1-5-19 — EventData ErrorSource 0 — <Event xmlns=»http://schemas.microsoft.com/win/2004/08/events/event»>
Предупреждения эти начинают появляться если частоту оперативной памяти выставлять на 3933 или 4000 Mhz. Если частота выставлена на 3866 или любая ниже этой, то никаких предупреждений не появляется. Спеки ПК : Миниатюры
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 18:58 [ТС] |
2 |
Извиняюсь , не знаю как отредактировать. Там где указано 2000 Mhz , должно быть 4000
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
21.07.2022, 20:10 |
3 |
S1m0n толку мало с этого . Лучше полный конфиг напишите — откуда дрова брали , какие напруги и частоты стоят .
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 21:25 [ТС] |
4 |
Wadim_Ymniy, с чего мало толка ? Дрова на что , на оперативку ? ))
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
21.07.2022, 21:26 |
5 |
А напруги может уже напишите наконец и тайминг какие ставите ?
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 21:26 [ТС] |
6 |
Wadim_Ymniy, все дрова с оффсайтов гигабайт и амд
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
21.07.2022, 21:27 |
7 |
Там где указано 2000 Mhz , должно быть 4000 ты часом реальную частоту с эффективной не попутал ?
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 21:38 [ТС] |
8 |
Wadim_Ymniy, включён XMP профиль. Напряжение на оперативку стоит на авто ( 1,38 ). Тайминги не трогал вообще , они тоже от XMP , сейчас не за компом , точно не помню , но вроде 16-18-18-36 CR1. Добавлено через 4 минуты
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 21:41 [ТС] |
9 |
Вот для наглядности Миниатюры
0 |
4721 / 2366 / 480 Регистрация: 09.09.2017 Сообщений: 8,700 |
|
21.07.2022, 22:08 |
10 |
Вот для наглядности Тайминги для такой частоты малы.
ну потом пробовал поднимать частоту оперативки и Инфинити фабрик Увеличивать надо и тайминги. А чтобы не делать наобум, есть DRAM Calculator for Ryzen.
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 22:31 [ТС] |
11 |
ibarg, то есть думаете это огромное количество предупреждений только лишь из за таймингов памяти ?
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
21.07.2022, 22:34 |
12 |
Да реально — тайминги подозрительно низкие : если это не ОЗУ от Г.скилл за овер 30+ тысяч , то фига с два они на 18 таймингах на 4000 работать будут и не факт что КП процессора сможет .
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 22:47 [ТС] |
13 |
Wadim_Ymniy, потому что это крушиал баллистикс на чипах micron e-die. Эти планки могут и на 4400 работать с таймингами ниже моих
0 |
4721 / 2366 / 480 Регистрация: 09.09.2017 Сообщений: 8,700 |
|
21.07.2022, 22:54 |
14 |
огромное количество предупреждений только лишь из за таймингов памяти ? Может быть. Может и контроллер памяти дает сбои из-за высокой частоты. Может по совокупности. Добавлено через 6 минут
Эти планки могут и на 4400 работать с таймингами ниже моих Могут, но только с делителем частоты контроллера памяти.
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
21.07.2022, 22:58 [ТС] |
15 |
ibarg, только с делителем частоты контроллера памяти. А в чем разница , если не сложно объяснить ?
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
21.07.2022, 23:43 |
17 |
потому что это крушиал баллистикс на чипах micron e-die. Эти планки могут и на 4400 работать не факт что мать/процц даже с делителем справятся — тут кому как везёт
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
22.07.2022, 00:32 [ТС] |
18 |
ibarg, Wadim_Ymniy, у меня XMP профиль на 3600 MHz. Если я допустим хочу частоты выше , чем XMP и с помощью Dram калькулятора определю нужные тайминги. Вопрос !! Нужно ли отключать XMP и выставлять частоты , тайминги или неважно включён он будет или нет ?
0 |
Дно пробито 4580 / 2759 / 377 Регистрация: 07.10.2020 Сообщений: 19,228 |
|
22.07.2022, 00:48 |
19 |
ХМП это предустановка — а тебе нужен кастмный рофиль .
0 |
0 / 0 / 0 Регистрация: 05.06.2020 Сообщений: 141 |
|
22.07.2022, 00:56 [ТС] |
20 |
Wadim_Ymniy, не факт что мать/процц даже с делителем справятся мать , кстати , поддерживает до 4400 , ну а райзенам как известно всем нужна высокая частота как минимум 3800. Добавлено через 2 минуты ХМП это предустановка — а тебе нужен кастмный рофиль . я понимаю что такое XMP. Но играть с частотой и таймингами можно и с включённым профилем XMP и с выключенным , по крайне мере на моей материнке. Так вот и спрашиваю есть разница , если он будет вкл / откл , когда я хочу выставить частоты выше ?!
0 |