Ошибка esxi could not start pcpu 1 no response to kick

One correction. This is a C220 M5, not an M4. The image is OEM enhanced, and not the standard VMWare ESXi image. The systems are error free, and we decommissioned and recommissioned one of the four servers to make sure we are not missing something there. We have only tried the 6.5 and 6.7 images. We actually have VMWare running on the server, which runs fine. The decision to reimage was to have a clean load. We suspect this is an image problem, but the PSOD doesn’t give us much to go on.

6.7.0 release 13473784

could not start pcpu 1; no response to kick

cr0=0x8001003d cr2=0x0 cr3=0x100094000 cr4=0x10012c

*PCPU0:2097152/bootstrap

Also talking to Cisco about this, but hoping someone would understand where the problem might be based on the data above.

[H]ard|Forum

  • Bits & Bytes

  • Virtualized Computing

You are using an out of date browser. It may not display this or other websites correctly.
You should upgrade or use an alternative browser.

Problems installing ESXi 5


  • Thread starter

    Jesse B


  • Start date

    Apr 11, 2012

  • #1

Joined
May 30, 2010
Messages
1,631

Finally got around to attempting installing ESXi 5.0 on my server. Hardware is as follows:

Intel i5 2500
BIOSTAR TP67B+
4GB DDR3
Intel PRO/1000 MT

I have more hardware I plan on using, but this is just the barebones system; I’ve removed everything else to try to figure out what the hell is going on.

Anyways, I burnt the ESXi 5.0 *.iso to a CD. I booted from said CD. Once it gets to initializing the scheduler, the following screen pops up, and everything halts.

I’ve tried googling, but I can’t really find a whole lot. I don’t really know what’s causing this, or where to start finding out.

Any suggestions? If I’m missing any info lemme know.

Thanks,

— Jesse

  • #2

Joined
Oct 28, 2009
Messages
672

latest BIOS should be P67CF102.BST, dated 2012-01-02.
I understand it should be there but just make sure Virtualization option in BIOS is enabled.

1. Try to temporary remove the PRO/1000 card. ESXi 5.x has driver support for Realtek Gigabit ethernet card (on-board ethernet).
2. Else if you insist Intel NIC, try a supported PCI-Express version. check HCL before buying.

  • #3

Joined
May 5, 2010
Messages
6,163

off topic, but some one knows how to use Eagle

  • #4

Joined
May 30, 2010
Messages
1,631

latest BIOS should be P67CF102.BST, dated 2012-01-02.
I understand it should be there but just make sure Virtualization option in BIOS is enabled.

1. Try to temporary remove the PRO/1000 card. ESXi 5.x has driver support for Realtek Gigabit ethernet card (on-board ethernet).
2. Else if you insist Intel NIC, try a supported PCI-Express version. check HCL before buying.

Alright, well I pulled everything. Still no dice. The firmware is outdated however. From the looks of things, I need to be in Windows to update it. I don’t have time to make that happen right now, exams next week. I’ll have to get that done next Thursday.

off topic, but some one knows how to use Eagle

I dabble Nothing overly impressive in my album unfortunately

  • #5

MrGuvernment

Joined
Aug 3, 2004
Messages
20,956

you can update the firmware from a cd or usually USB key.

  • #6

Joined
May 30, 2010
Messages
1,631

you can update the firmware from a cd or usually USB key.

Yeah I figured I should be able to do that, couldn’t for the life of me find an option in the BIOS however (I’ve seen it before on other mobo’s). I’ll look into it in a bit more detail tomorrow.

  • #7

Joined
Nov 10, 2011
Messages
641
  • #8

dbwillis

Joined
Jul 9, 2002
Messages
8,717

error shot says no disk for the file….is the onboard sata compatable in esxi 5?

  • #9

Joined
Sep 30, 2002
Messages
3,432

error shot says no disk for the file….is the onboard sata compatable in esxi 5?

Yeah, if you’ve taken everything out and you’re still having an issue I would bet the controller isn’t compatible. Try booting and installing to USB drive?

  • #10

Joined
Nov 10, 2011
Messages
641

Just because the screenshot says it couldn’t dump debug info to a disk doesn’t mean that’s the root cause.

Earlier in the shot I see «couldn’t start pcpu 2». I find that much more likely to be related to the cause but I don’t know.

  • #11

Joined
Oct 23, 2004
Messages
6,061

If you’re pure of heart and make a wish on a shooting star, lopoetve will see your thread and offer help.

In the meantime, here’s a thread on the VMWare support about someone having a similar issue. If you have a BIOS option for «Max CPUID Value Limit» try disabling it.

Earlier in the shot I see «couldn’t start pcpu 2». I find that much more likely to be related to the cause but I don’t know.

Correct. «No place on disk to dump data» is not causing the error. Failure to start the PCPU is the actual cause of the purple screen.

  • #12

Joined
May 30, 2010
Messages
1,631

Thanks for the help guys. I got it figured out.

Turns out I had the disk plugged into the Sata3 port, not the Sata2 port. Swapped it over, everything works now. Had to go to class, so I’ll finish up with installation when I get home. Everything was working fine before I left however.

  • #13

Joined
Oct 11, 2001
Messages
33,264

lol, I just arrived to help

  • #14

Joined
Sep 30, 2002
Messages
3,432
  • #15

Joined
Nov 10, 2011
Messages
641

…which was totally not evident from the screenshot and it still feels like handwaving.

  • #16

Joined
Oct 23, 2004
Messages
6,061

…which was totally not evident from the screenshot and it still feels like handwaving.

Yeah. I have no idea how the drive being plugged into a wrong/unsupported controller would cause a PCPU init failure. PCPU 2 should be the 3rd core of OP’s i5, which makes even less sense. I’m wondering if there was a non-fatal error (related to the disk/controller?) just prior that cascaded into the actual PSOD OP posted.

In any case, glad OP got it sorted.

  • #17

Joined
Sep 30, 2002
Messages
3,432

nevermind..Glad it works now.

Last edited: Apr 12, 2012

  • #18

Joined
May 30, 2010
Messages
1,631

Yeah, that’s what was throwing me off. When it started piping up about PCPU2, I figured the complaint about the disk was just a side effect.

  • #19

Joined
May 5, 2010
Messages
6,163

Thanks for the help guys. I got it figured out.

Turns out I had the disk plugged into the Sata3 port, not the Sata2 port. Swapped it over, everything works now. Had to go to class, so I’ll finish up with installation when I get home. Everything was working fine before I left however.

WOOT WOOT! good job dude.!

  • #20

Joined
Oct 11, 2001
Messages
33,264

Yeah, that’s what was throwing me off. When it started piping up about PCPU2, I figured the complaint about the disk was just a side effect.

it is. until you install, there’s no core partition — so it has no where to dump.

  • #21

Joined
May 30, 2010
Messages
1,631

it is. until you install, there’s no core partition — so it has no where to dump.

Ahh, gotcha. Makes sense.

Anyways, just got home. No class tomorrow, so I got a long-ish weekend. Just starting the rig back up right now, hopefully all goes well!

  • #22

Joined
May 5, 2010
Messages
6,163

Ahh, gotcha. Makes sense.

Anyways, just got home. No class tomorrow, so I got a long-ish weekend. Just starting the rig back up right now, hopefully all goes well!

xen

  • Bits & Bytes

  • Virtualized Computing

PSODs are always the result of hardware or software issues, not human error. On first glance, the megaraid driver could be a culprit or a victim here. Its ISR is spinning on some lock for too long. There really isn’t enough information in this screenshot to understand why.

It’s unlikely that the driver bits suddenly started being an issue. It’s more likely that some rare edge-case within that driver, such a race condition in handling (recoverable) errors from the hardware controller, was experienced. And the defect was always lurking, but wasn’t triggered until now. Suddenly. Maybe through random chance, maybe because of a failing disk, maybe because of a lot of I/O to local storage. Nothing in the screenshot helps to characterize the workload and environment.

The memory coredump was written to disk successfully. That would contain all the important bits of RAM, and allow an investigator to review all the other running threads and seek out other lock holders.

But someone already did the investigative work. Your screenshot matches https://kb.vmware.com/kb/2037763. If we take that KB at face value, it’s a driver bug. The interrupt service routine in the megaraid driver is spinning on some lock, and gives up after waiting too long. Presumably some other thread has it (bad lock ordering?) or abandoned it (bad lock release?) in a locked state — the KB doesn’t state.

Update to Version 6.5 of the megaraid driver (6.506.51.00.1vmw or later): https://my.vmware.com/web/vmware/details?downloadGroup=DT-ESXI5X-LSI-MEGARAID_SAS-650651001VMW&productId=229

If you strongly feel that your problem is different (eg, problem is reproducible after applying patch), then open a case with Support and provide the zdump file: https://kb.vmware.com/kb/1004128

Yogurt-Filled Chocolate Cauldrons image

Yogurt-Filled Chocolate Cauldrons

Cute chocolate «cauldrons» hold a cool, creamy orange-flavored yogurt in this recipe. The unfilled cups…

Provided by Taste of Home

MOLTEN CHOCOLATE LAVA CAKE image

Demi-Glace image

Demi-Glace

This is my technique for veal demi-glace, and there’s not much to it. I’m going for a pure veal stock…

Provided by Chef John

Easy Butterfinger Cake image

Easy Butterfinger Cake

OMG!!! I had to make this cake this past Sunday for my Mary Kay party.. It was a huge hit. It was also…

Provided by vicky hunt

Pork Neck Slow Cooker Stew image

Pork Neck Slow Cooker Stew

Good food doesn’t always have to cost a fortune! Your family will love this. Full of flavor and easy…

Provided by Melissa Baldan

Steamed Parsley Red Potatoes image

Steamed Parsley Red Potatoes

This is a very good potato dish , I stem baby red potatoes and smother them in real butter and parsley…

Provided by Karla Everett

Classic Portuguese Beans - {Feijao A Portuguesa} Recipe - (5/5) image

ROAST PORK (LECHON ASADO) image

Tomato and Bacon Clam Chowder image

Homemade Chicken Pot Pie image

Homemade Chicken Pot Pie

Sure you can make a quick Chicken Pot Pie using already made pie crust, canned soups, vegetables and…

Provided by Julia Ferguson

Red Velvet Pound Cake image

Red Velvet Pound Cake

This delicious red velvet pound cake is the perfect combination of flavors. Make sure the cake has cooled…

Provided by Taste of Home

Boudreaux's Zydeco Stomp Gumbo image

Boudreaux’s Zydeco Stomp Gumbo

Dis is da toe curlin Texicajun hybrid of a classic dish. This will put a smile on everyone’s face that’s…

Provided by Lupe Boudreaux

Pesto Baked Pork Chops image

Pesto Baked Pork Chops

This is a tender and delicious baked pork chop recipe, with an Italian flair.

Provided by larvia57

RASPBERRY PUNCH image

RASPBERRY PUNCH image

Previous

Next

PINK/PURPLE SCREEN, COULD NOT START PCPU 1 — VMWARE

pinkpurple-screen-could-not-start-pcpu-1-vmware image

Mar 4, 2012 Hi, I am having a problem with an ESXi test machine. As this one is not productive at all but used for testing, I still would like to get it running …
From communities.vmware.com
Estimated Reading Time 1 min
See details »


VMWARE PSOD — PURPLE SCREEN OF DEATH — IN CASE OF TIME DRIFT — …

2022-10-212) How to qualify the clock drift problem. PSOD («Purple screen Of Death») occurs, with messages like : Heartbeat: xxx: PCPU xx didn’t have a heartbeat for xx seconds. *may* be locked up. On …
From support.bull.com
See details »


NOT RECOMMENDING TO OVERCOMMIT THE CPU’S FOR TIRE 1 SQL …

Oct 21, 2018 No 1. Not recommending to overcommit the CPU’s for Tire 1 SQL Workloads (vCPU:pCPU= 1:1) No 2. Compression is recommended to do in Database Table levels for …
From learn.microsoft.com
See details »


UCS-C240M3 PURPLE SCREEN SYSTEM CRASH — CISCO COMMUNITY

Mar 21, 2013 Get a preview of new Cisco Intersight innovations – Join CCP to register for January 22 Data Center briefing
From community.cisco.com
See details »


UNABLE TO INSTALL ESXI 5.5 IN UCS220 M4S — CISCO

Apr 9, 2016 Guys; I am unable to install Esxi 5.5 in Cisco UCS220 M4S. The said server wasn’t pre installed with any RAID configuration so i created RAID 5 however after installing Esxi it …
From community.cisco.com
See details »


PURPLE SCREEN ESXI — VMWARE TECHNOLOGY NETWORK VMTN

Dec 10, 2020 Check pink-purple-screen-could-not-start-pcpu . If you think your queries have been answered Marking this response as «Solution » or «Kudo» ASAJM 0 Kudos Share. Reply. …
From communities.vmware.com
See details »


COULD NOT START PCPU AFTER RESTART ESXI 5.5.0 — VIRTUALISATION

Jul 29, 2017 Could not start pcpu 10; TSC sync timed out ESXI 5.5.0 releasebuild id-3029944 x86_64. This is when I walked out of the office @ 6:00am this morning and wont be back until …
From forums.whirlpool.net.au
See details »


BUG SEARCH TOOL — CISCO

2022-10-21When running a performance setting of Enterprise, the ESXi installer will fail with a PSOD indicating «Could not start pcpu 1; TSC sync timed out». Conditions: This appeared to be a …
From quickview.cloudapps.cisco.com
See details »


RELATIONSHIP BETWEEN VCPU AND PCPU WHEN CREATING A …

Jun 17, 2018 Answer. The general rules are the following: — VMware: The value for Virtual CPU must be 1, 2 or 4. — KVM: Physical CPU cannot be modified. — Virtual CPU >= Physical CPU. …
From ibm.com
See details »


BUGS | VMWARE FLINGS

Mar 17, 2022 . Thanks. This is most likely an implementation issue with PSCI CPU_ON firmware call, as implemented by Huawei’s Trusted Firmware-A or analogue. …
From flings.vmware.com
See details »


NETAPP HCI — NETAPP KNOWLEDGE BASE

2022-10-21NetApp HCI. This guide provides an overview of product features and related technologies. In addition, it contains recommendations on best practices, tutorials for getting started, and …
From kb.netapp.com
See details »


PSOD. PCPU LOCKED UP ERROR. NOT SURE WHERE TO GO FROM HERE.

2022-10-21In my experiences PCPU lockups have been hardware related. I’m sure you already know 5.1 is end of life. If you have maintenance I’d upgrade it to 5.5 and see if it resolves your issue if it …
From reddit.com
See details »


ESXI 6.0 INSTALL FAILURE (TSC SYNC ERROR) : VMWARE — REDDIT

2022-10-21«Could not start pcpu2: TSC sync timed out» CPU: AMD FX-4300. Mobo: GA 78LMT-USB3. Fixes tried so far: disable e-sata, usb3 and audio. remove overclock. It seems disabling both …
From reddit.com
See details »


CPU PANEL — VMWARE

May 31, 2019 In batch mode, the corresponding CORE UTIL(%) statistic is displayed for each PCPU. For example, PCPU 0 and PCPU 1 have the same the CORE UTIL(%) number, and …
From docs.vmware.com
See details »


PSEXEC FAILS WITH ERROR «COULD NOT START PSEXESVC SERVICE… %1 IS …

Jun 25, 2019 It’s time for Process Monitor.. perform the same step as before, delete the service and reboot the machine, then start process monitor on the host where you would like to start …
From social.technet.microsoft.com
See details »


HOW TO DEAL WITH PSOD — THE PURPLE SCREEN OF DEATH — RUNECAST

Oct 14, 2019 PCPU 1 locked up. Failed to ack TLB invalidate. 6. Check logs. It may happen that the cause is not very obvious from looking at the purple screen message or at the core dump …
From blog.runecast.com
See details »


Related Search


This happened today while setting up ESXi 6.5 on Cisco UCS C200 M4 Server. VMware crashed and throwing an error in the purple screen, Could not start pcpu 1; TSC sync timed out.

If you come across similar situation, then try changing CPU settings in BIOS. It fixed the ESXi issue.

Log in to BIOS and change CPU performance to HPC, default is Enterprise.

HostGator

24/7/365 Technical Support, Free Site Building Tools, 4500 Website Templates, Free Shopping Cart Software, Ideal for WordPress, 45 Day Money Back Guarantee

Cisco published a reference whitepaper to understand various options in Cisco UCS performance.

http://www.cisco.com/c/en/us/solutions/collateral/data-center-virtualization/unified-computing/whitepaper-c11-737931.html

Время на прочтение
7 мин

Количество просмотров 11K

Многие администраторы VMware ESXi сталкивались с такой проблемой, как «фиолетовый экран смерти». Самое неприятное в этой проблеме, что у вас возникает недоверие к своей собственной инфраструктуре. В голове постоянно крутятся мысли о том, что такая же проблема может повториться и на другом сервере.

Что такое PSOD?

PSOD расшифровывается, как Purple Screen of Diagnostics, часто называемый  Purple Screen of Death от более известного  Blue Screen of Death,  встречающегося в Microsoft Windows.

Это диагностический экран, отображаемый VMware ESXi, когда ядро ​​обнаруживает фатальную ошибку, при которой оно либо не может безопасно восстановиться, либо не может продолжать работу.

Он показывает состояние памяти во время сбоя, а также дополнительные сведения, которые важны для устранения причины сбоя: версия и сборка ESXi, тип исключения, дамп регистра, обратную трассировку, время безотказной работы сервера, сообщения об ошибках и информацию о дампе ядра. (файл, созданный после ошибки, содержащий дополнительную диагностическую информацию).

Данный экран отображается в консоли сервера. Чтобы увидеть его, вам нужно будет либо находиться в центре обработки данных и подключить монитор, либо подключиться удаленно с помощью внеполосного управления сервером (iLO, iDRAC, IMM и т.д. в зависимости от вашего вендора).  

Рисунок 1

Рисунок 1

Почему появляется PSOD?

PSOD — это сбой в ядре. Все мы знаем, что ESXi не основан на UNIX, но механика сбоя соответствует определению UNIX. Ядро ESXi (vmkernel) запускает эту меру безопасности в ответ на события или ошибки, которые невозможно исправить, это будет означать, что продолжение работы может создать высокий риск для служб и виртуальных машин. Проще говоря: когда хосты ESXi чувствуют, что они повреждены, они совершают «харакири» и, истекая пурпурной кровью, пишут «предсмертную записку» с подробным описанием причин, по которым они это сделали!

Наиболее частые причины PSOD:

1. Аппаратные сбои, в основном связанные с RAM или CPU. Обычно они выдают ошибку «MCE» или «NMI».

«MCE» — исключение проверки компьютера, которое представляет собой механизм в ЦП для обнаружения и сообщения о проблемах с оборудованием. В кодах, отображаемых на фиолетовом экране, есть важные детали для определения основной причины проблемы.

«NMI» — немаскируемое прерывание, то есть аппаратное прерывание, которое не может игнорироваться процессором. Поскольку NMI является очень важным сообщением об отказе HW, ответ по умолчанию, начиная с ESXi 5.0 и более поздних версий, должен запускать PSOD. Более ранние версии просто регистрировали ошибку и продолжали. Как и в случае с MCE, фиолетовый экран, вызванный NMI, предоставляет важные коды,  которые имеют решающее значение для устранения неполадок.

2. Программные ошибки

·         неверное взаимодействие между компонентами ESXi SW (см. KB2105711)

·         условия гонки (см. KB2136430 )

·         из ресурсов: память, динамическая область памяти, буфер (см. KB2034111,  KB2150280)

·         бесконечный цикл + переполнение стека (см. KB2105522 )

·         неверные или неподдерживаемые параметры конфигурации (см. KB2012125,  KB2127997)

3. Некорректно функционирующие драйвера; ошибки в драйверах, которые пытаются получить доступ к некорректному индексу или несуществующему методу (см. KB2146526,  KB2148123)

Какое влияние оказывает PSOD?

Когда возникает сбой, хост выходит из строя и завершает работу всех служб, работающих на нем, вместе со всеми размещенными виртуальными машинами. Виртуальные машины отключаются резко и не завершают свою работу корректно. Если хост является частью кластера и вы настроили HA, эти виртуальные машины будут запущены на других хостах в кластере. Помимо простоя и недоступности виртуальных машин во время их простоя, «грязное» завершение может повлиять на некоторые критически важные приложения, такие как серверы баз данных, очереди сообщений или задания резервного копирования.

Кроме того, все другие службы, предоставляемые хостом, будут прекращены, поэтому, если ваш хост является частью кластера VSAN, PSOD также повлияет на vSAN.

Что делать?

1. Проанализируйте сообщение на фиолетовом экране.

Одна из самых важных вещей, которые нужно сделать при появлении фиолетового экрана — это  сделать снимок экрана. Если вы подключаетесь к консоли удаленно (IMM, iLO, iDRAC, …), будет легко сделать снимок экрана, если нет такой возможности, хотя сфотографируйте экран на телефон. На этом экране много полезной информации о причине сбоя.

Рисунок 2

Рисунок 2

2. Обратитесь в службу поддержки VMware.

Прежде чем приступить к дальнейшему исследованию и устранению неполадок, рекомендуется обратиться в службу поддержки VMware, если у вас есть контракт на поддержку. Параллельно с вашим расследованием они смогут помочь вам в проведении корневого анализа причин (RCA).

3. Перезагрузите затронутый хост ESXi.

Чтобы восстановить сервер, вам необходимо перезагрузить его. Я бы также посоветовал оставить его в режиме обслуживания, пока вы не выполните полный анализ RCA, пока не будет определена и исправлена ошибка. Если вы не можете позволить себе держать его в режиме обслуживания, по крайней мере, точно настройте свои правила DRS, чтобы на нем работали только второстепенные виртуальные машины, чтобы в случае возникновения другого PSOD влияние было минимальным.

4. Получите coredump

После загрузки сервера вы должны собрать дамп ядра — coredump. Coredump, также называемый vmkernel-zdump, представляет собой файл, содержащий журналы с более подробной информацией, чем та, что отображается на фиолетовом экране диагностики, и будет использоваться при дальнейшем устранении неполадок. Даже если причина сбоя может показаться очевидной из сообщения PSOD, которое вы проанализировали на шаге 1, рекомендуется подтвердить ее, просмотрев журналы из coredump.

В зависимости от вашей конфигурации у вас может быть дамп ядра в одной из следующих форм:

а. Во временном разделе

b. В виде файла .dump  в одном из хранилищ данных хоста

c. В виде файла .dump  на vCenter — через службу netdump

Coredump становится особенно важным, если конфигурация хоста должна  автоматически сбрасываться после PSOD , и в этом случае вы не увидите сообщение на экране. Вы можете скопировать файл дампа с хоста ESXi с помощью SCP, а затем открыть его с помощью текстового редактора (например, Notepad ++). Он будет вмещать содержимое памяти на момент сбоя, и первые его части будут содержать сообщения, которые вы видели на фиолетовом экране. Служба поддержки VMware может запросить весь файл, но у вас лишь будет возможность извлечь только журнал vmkernel, который более нагляден:

Рисунок 3

Рисунок 3

5. Расшифруйте ошибку.

Устранение неполадок и анализ причин позволяют почувствовать себя Шерлоком Холмсом.  Самый важный симптом, с которого вам следует начать, — это сообщение об ошибке, создаваемое фиолетовым экраном. К счастью, количество выдаваемых сообщений об ошибках ограничено: 

Exception Type 0 #DE: Divide Error
Exception Type 1 #DB: Debug Exception
Exception Type 2 NMI: Non-Maskable Interrupt
Exception Type 3 #BP: Breakpoint Exception
Exception Type 4 #OF: Overflow (INTO instruction)
Exception Type 5 #BR: Bounds check (BOUND instruction)
Exception Type 6 #UD: Invalid Opcode
Exception Type 7 #NM: Coprocessor not available
Exception Type 8 #DF: Double Fault
Exception Type 10 #TS: Invalid TSS
Exception Type 11 #NP: Segment Not Present
Exception Type 12 #SS: Stack Segment Fault
Exception Type 13 #GP: General Protection Fault
Exception Type 14 #PF: Page Fault
Exception Type 16 #MF: Coprocessor error
Exception Type 17 #AC: Alignment Check
Exception Type 18 #MC: Machine Check Exception
Exception Type 19 #XF: SIMD Floating-Point Exception
Exception Type 20-31: Reserved
Exception Type 32-255: User-defined (clock scheduler)

Поскольку сбой в ядре обрабатывается процессором, для получения дополнительной информации об этих исключениях см.  Руководство разработчика программного обеспечения для архитектур Intel 64 и IA-32, том 1: Базовая архитектура  и  Руководство разработчика программного обеспечения для архитектур Intel 64 и IA-32, том 3A.

Наиболее распространенные случаи описаны в отдельных статьях базы знаний VMware. Поэтому используйте эту таблицу в качестве индекса для ошибок PSOD:

6. Проверьте журналы

Может случиться так, что причина не очень очевидна при просмотре фиолетового сообщения на экране или журнала дампа ядра, поэтому следующее место, где искать подсказки, — это журналы хоста, особенно во временном интервале, непосредственно предшествующем PSOD. Даже если вы чувствуете, что нашли причину, все же рекомендуется подтвердить ее, просмотрев журналы.

Если вы администрируете корпоративную среду, вероятно, у вас под рукой есть специализированное решение для управления журналами (например,  VMware Log Insight или SolarWinds LEM ), поэтому их будет легко просматривать, но если у вас нет управления журналами, вы можете легко  экспортировать их .

Наиболее интересные файлы журналов для изучения:

Компоненты

Место расположения

Что это такое

Системные сообщения

/var/log/syslog.log

Содержит все общие сообщения журнала и может использоваться для устранения неполадок.

VMkernel

/var/log/vmkernel.log

Записывает действия, связанные с виртуальными машинами и ESXi. Большинство записей, относящихся к PSOD, будет в этом журнале, поэтому обратите на него особое внимание.

Журнал агента хоста ESXi

/var/log/hostd.log

Содержит информацию об агенте, который управляет и настраивает хост ESXi и о его виртуальных машинах.

Предупреждения VMkernel

/var/log/vmkwarning.log

Записывает действия, связанные с виртуальными машинами. Следит за записями журнала, связанными с истощение динамической области памяти (Heap WorkHeap).

Журнал агента vCenter

/var/log/vpxa.log

Содержит информацию об агенте, который обменивается данными с vCenter, поэтому вы можете использовать его для обнаружения задач, запускаемых vCenter и могущих вызвать PSOD.

Журнал shell

/var/log/shell.log

Содержит запись всех набранных команд, так что вы можете соотнести PSOD с выполненной командой.

the same thing happen on mine ..  could not start pcpu1 ,no respond to kick…

MODEL:   H3C Navidata 5200 G3

CPU:   Intel Xron Silver 4114

i have updated the bios firmware to lastest version , but useless

UEFI  and  disable something seems like relevant on esxi  , but it not worked

Happens while “loading scheduler” appears on screen,  take a while , pink screen

To see the full content, share this page by clicking one of the buttons below

  • Ошибка est управление моментом зажигания
  • Ошибка est на частотном преобразователе
  • Ошибка est на частотнике ig5a
  • Ошибка esp шкода фабия
  • Ошибка esp шкода суперб