Ошибка получения списка кластеров ошибка операции администрирования - Ремонт и установка крупной бытовой техники

: October 31 2018, 16:23

Category:

Компьютеры
Cancel

16:23 31.10.2018
Ошибка получение списка кластеров: Ошибка операции администрирования 1с не найдено ни одного сервера с размещенным сервисом

В общем образовалась вчера такая проблема при входе в консоль 1С: «Ошибка получение списка кластеров: Ошибка операции администрирования 1С: не найдено ни одного сервера с размещенным сервисом serviceName=ClusterConfigService«. Решение немного глупое, но работает.

1) Останавливаем 1С-сервак

2) Cносим в папке C:Program Files (или x86)1cv8srvinfo только папки, начинающиеся с snccntx, т.е. содержащие сессионные данные

2) Запускаем сервак, добавляем базы.

3) Все работает!

Такой способ полезен, если баз очень много и одно только добавление их по новой занимает много времени.

read more at Константин Лимонов

Источник

Автор Rasty, 23 ноя 2015, 14:21

0 Пользователей и 1 гость просматривают эту тему.

Ошибка получение списка кластеров:
Ошибка операции администрирования
1с не найдено ни одного сервера с размещенным сервисом serviceName=ClusterConfigService.

Типичная ситуация, пришел с утра, открываю консоль, хренак и на, в интернетах ничего дельного не нашел кроме этого
Самое интересное пользователи работают…

WTF?

Помогли — Скажи спасибо! Решил сам — поделись решением!

Останавливаем 1с сервак, сносим все что в папке C:Program Files (или x86)1cv8srvinfo, запускаем сервак, добавляем базы, и все работает.

Помогли — Скажи спасибо! Решил сам — поделись решением!

Цитата: Rasty от 24 ноя 2015, 14:56
Останавливаем 1с сервак, сносим все что в папке C:Program Files (или x86)1cv8srvinfo, запускаем сервак, добавляем базы, и все работает.

Спасибо, столкнулся с такой же проблемой, и описанное решение помогло.

А если это не помогает? удаляешь, добавляешь снова базу и при запуске 1с тоже самое
Проблема с лицензией может быть или нет?

нужно на сервере через администрирование удалить все процессы и добавить заново.

Спасибо за Сказать спасибо

Цитата: alex0402 от 22 авг 2017, 21:23
нужно на сервере через администрирование удалить все процессы и добавить заново.

Какие процессы? я сервак 1с останавливаю на сервере и все из каталога удаляю, там в итоге пусто.
Перегружаю весь комп-сервер.
Потом запускаю сервер 1с и добавляю базу снова в админке 1с.
Потом запускаю 1с и пытаюсь подключится и в итоге тоже самое

Нужно дать полные права юзеру usrv8 на все внутренности папки srvinfo

Цитата: Вовчик от 08 дек 2016, 08:17

Цитата: Aleksh_kz от 16 сен 2016, 10:56

Цитата: Rasty от 24 ноя 2015, 14:56
Останавливаем 1с сервак, сносим все что в папке C:Program Files (или x86)1cv8srvinfo, запускаем сервак, добавляем базы, и все работает.

Спасибо, столкнулся с такой же проблемой, и описанное решение помогло.

)))) а есть адекватное решение?

Не обязательно удалять всю папку srvinfo, достаточно удалить только папки, начинающиеся с snccntx, т е содержащие сессионные данные. Такой способ полезен, если у тебя овердохера баз и одно только добавление их по новой трудоёмко.

Цитата: iphr от 20 дек 2017, 16:58
Нужно дать полные права юзеру usrv8 на все внутренности папки srvinfo

Какие права, о чем ты? просто поменяй порт подключения клиентов… все

Источник

При подключении к базам происходит зависание.

Saari

13.02.15 — 09:33

Платформа 1С:Предприятие 8.3 (8.3.5.1428)

Базы на SQL 2008 x64. Базы УТ 10.3 и БУХ 8.2

Невозможно подключиться к базам 1С через консоль кластера 1С:Предприятие. Через некоторое время после попытки подключиться появляется сообщение:

«Ошибка получения списка сеансов: Ошибка операции администрирования. Нет ответа от сервера server_addr=tcp://<ИмяСервера>:1541 timeout=60000 » и т.д.

При этом в часть баз можно зайти. В оставшиеся базы при подключении происходит зависание уже до выбора пользователя.

Если в базе выбрать пункт меню Сервис -> Активные пользователи, то происходит зависание базы.

Cube

1 — 13.02.15 — 09:44

(0) Сто пудова сетка тупит у вас…

Saari

2 — 13.02.15 — 10:00

(1) все работают терминалом с одного сервера. С сеткой все в порядке. Производительность сервера-терминала достаточная.

Vladal

3 — 13.02.15 — 10:04

(2) какой код ошибки? В брандмауэре 1С и все ее службы добавили в исключения?

Какой код ошибки? Приведите сообщение полностью.

Vladal

4 — 13.02.15 — 10:08

Варианты решения:

а) http://www.gilev.ru/1c/support/tasks/10060.htm

1. выключить брандмауэр

2. Пропишите Ip-шник вашего сервера в файле C:WINDOWSsystem32driversetchosts и его же пропишите в C:Program Files1cv81binconfnethasp.ini в описании [TCP-IP] в строке NH_SERVER_ADDR = Ip-шник вашего сервера

3. ресурсы процессора загружены на 100% (CPU%), добавить процессоров на сервер

б) http://www.sql.ru/forum/635933/oshibka-dostupa-k-serveru-1s-8-1

в) http://www.gilev.ru/10054/

Посмотрите эту тему — схожа? v8: 8.2.17.169 — не запускается сервер

Saari

5 — 13.02.15 — 10:17

Полный код ошибки:

«Ошибка получения списка сеансов:

Ошибка операции администрирования

Нет ответа от сервера server_addr=tcp://<ИмяСервера>:1541 timeout=60000 line=1988 file=srcDataExchangeTcpClientImpl.cpp

брэндмауэр выключен

процессор загружен на 3%, свободной памяти 83%

Vladal

6 — 13.02.15 — 10:43

Хм. А давно это так? 1С работала и перестала? Или обновляли платорму? Тут вчера-позавчера люди жаловались, что после обновления винды слетели настройки шрифтов и прочие рюшечки. Может и у вас так?

Saari

7 — 13.02.15 — 10:52

(6) Ночью вдруг пользователи не смогли зайти в базы.

подключились к базе. Удалили зависшие подключения. После этого эта база заработала.

Но утром не смогли запустить консоль кластера 1С. Возникала вышеописанная ошибка.

Полчаса назад по непонятным нам причинам консоль кластера заработала. Причин пока понять не можем.

Vladal

8 — 13.02.15 — 11:02

(7) Какая-то непредсказуемая работа. Может, какие службы или еще что. Админ ничего не говорит?

Vladal

9 — 13.02.15 — 11:13

(7) Кстати, может релиз проблеммный?

http://1c-pro.ru/threads/oshibka-pri-popytke-posmotret-spisoka-soedinenij-v-v-konsoli-administrirovanija-serverov-1s.64/

Saari

10 — 13.02.15 — 11:24

(9) может и релиз… вот только что опять тормоза у всех. И ошибка та же при запуске консоли кластера.

Проблемы невозможно решaть нa том же уровне компетентности, нa котором они возникaют. Альберт Эйнштейн

ВНИМАНИЕ! Если вы потеряли окно ввода сообщения, нажмите Ctrl-F5 или Ctrl-R или кнопку «Обновить» в браузере.

Тема не обновлялась длительное время, и была помечена как архивная. Добавление сообщений невозможно.
Но вы можете создать новую ветку и вам обязательно ответят!
Каждый час на Волшебном форуме бывает более 2000 человек.

: January 31 2012, 17:24

Categories:

Наука
Происшествия
IT
Армия
Cancel

Сегодня возникла проблема. Есть у нас старый и давно не использующийся сервер 1С, на котором понадобилось создать новую базу для тестирования «чего то там».
Когда я вошел в консоль управления кластером, неожиданно произошел следующий досадный инцидент — консоль зависала намертво при попытке открыть список информационных баз.
Как обычно бывает в таких случаях, все срочно, аврал и тому подобное, так что на разбирательство, в чем причина, не было времени.

ВНИМАНИЕ! Описанные ниже действия приведут к полному сбросу всех настроек вашего кластера! Вернуть все возможно, но если Вы восстанавливаете «боевой» сервер, необходимо иметь Все пароли и имена баз данных (если Вы не знаете, какие из них откуда).

И так, начнем.
Выбрасываем всех пользователей с сервера 1С, а затем останавливаем службу «Агент сервера 1С:Предприятие 8.*». Затем идем в «C:Program Files1cv81server» или в «C:Program Files1cv82srvinfo» и удаляем там все файлы и папки.
Теперь, запускаем службу и затем Консоль управления кластером 1С, и видим, что в нашем кластере отсутствуют все БД. В консоли открывает «Рабочие серверы» — «Имя сервера» — «Процессы». Удаляем появившийся процесс, затем удаляем рабочий сервер. Теперь удаляем кластер.

Все. После выполнения всех этих шагов, нам необходимо все настроить с ноля. К счастью, это не займет много времени. На подключение одной базы в среднем уходит около 1 минуты.
Все последующие шаги, необходимые для настройки кластера 1С, подробно описаны в моей записи здесь: http://dojuk.livejournal.com/2682.html Внимательно остановитесь на главах «Теория и практика настройки 1С 8.2 сервер» и «Проблемы, с которыми я столкнулся«.

Удачи

Доброго времени суток, есть отдельная виртуальная машина с сервером 1с 8.3 так же есть два SQL SERVER 2019 собранные в кластер. Хочу создать информационную базу и при создании появляется ошибка —

Не удается завершить вход в систему из-за задержки при открытии соединения с сервером

Подскажите в чем может быть дело?

Так же теперь вылезает сообщение

Ни один рабочий процесс не доступен

а в SQL Server management studio пускает ?

а в SQL Server management studio пускает ?

Истекло время ожидания соединения. Время ожидания истекло при попытке обработки подтверждения предварительного согласования. Возможно, произошел сбой во время предварительного согласования, или сервер не смог ответить вовремя. Время, затраченное на попытки подключиться к этому серверу, составило: [Pre-Login] initialization=29270; handshake=26242; (Microsoft SQL Server, ошибка: -2)

а работало то изначально ? После чего перестало работать?
Проверьте состояние узлов кластера

а работало то изначально ? После чего перестало работать?
Проверьте состояние узлов кластера

На sql1 накопились обновления — они установились и windows server 2019 перезагрузился, заметил что на этой виртуалке отвалился диск с базами. Диск в статусе offline — при попытке его включить винда выдает сообщение:

Указанным диском или томом управляет средство отказоустойчивой кластеризации (Майкрософт). Для выполнения этой операции диск должен находиться в режиме обслуживания кластера, а кластерный ресурс должен быть в сети.

. Далее в оснастке Диспетчер отказоустойчивости кластеров появилась ошибка —

Дисковый ресурс кластера «Диск кластера 1» обнаружил повреждения тома «?Volume{9423efec-3ebd-43c9-82d0-3b365503f715}». Для устранения неполадок запущена программа Chkdsk. Диск будет недоступен до завершения выполнения команды Chkdsk. Все сведения, выводимые программой Chkdsk, будут записаны в файл C:WindowsClusterReportsSpotfix_ResДиск кластера 1_Disk1Part2.log.
Программа Chkdsk также может заносить сведения в журнал событий приложения.

Короче с диском разобрался — это штатная работа кластера. Диск стал ресурсом кластера и переезжает туда сюда. Теперь вопрос в другом — не удается создать информационную базу. Нашел вот такой совет на другом форуме:

на сервере named pipes выключить, оставить только tcp/ip
на сервере 1с у клиента sql поставить приоритет tcp/ip выше, чем у named pipes

А где эти настройки named pipes ???

Короче с диском разобрался — это штатная работа кластера. Диск стал ресурсом кластера и переезжает туда сюда. Теперь вопрос в другом — не удается создать информационную базу. Нашел вот такой совет на другом форуме:

А где эти настройки named pipes ???

Диспетчер конфигурации SQL Server

Последнее редактирование модератором: 03.09.2020

в общем разобрался. Помогло — выключение брандмауэров на всех трех серверах 1с и sql server. Так же включил параметр Включить сетевое обнаружение

Интересная ситуация возникла. Имеется на рабочем серваке кластер 1С с одним сервером со списком баз и т.п.. Следующим кодом получается список баз с него: Вводится в эксплуатацию новый сервак — он даже в другом домене (в соседнем). На нём ничего, кроме только что установленного сервера 1С ещё не настраивалось (по части 1С), но… — он уже видит(!!!) старый сервер 1С, кластер, список баз на нём и т.п.. Администратор сервера не определён. Так вот указанный код при обращении по IP старого сервера выдаёт список баз, а при обращении по IP нового сервера аутентификацию почему-то проходит, но есть ошибка при получении списка баз: «Произошла исключительная ситуация: Недостаточно прав пользователя на управление кластером Локальный кластер» Каким образом это возможно, если в обоих случаях обращение происходит как бы к одному и тому же кластеру серверов 1С? PS Ну и дополнительный вопрос: а как это работает служба сервера 1С на втором сервере, если ключ с серверной лицензией стоит на старом? И при раскидывании кластера нужно что, на каждый(!) сервак покупать дорогущий ключ с серверной лицензией?

И чего же — никто не в курсе? :((

Случилась у меня тут бяда… Сервер на котором крутиться «сервер приложений 1С» (простите за тавтологию), что называется «заклинило»… Т.е. перешёл он у меня в так называемое «искомое состояние»… Дело сами понимаете не очень хорошее но поправимое… После некоторых манипуляций оживить его удалось… Но речь не о том, а о том, что в процессе этих верчений-кручений получилось так, что при запуске оснастки «Администрирование серверов 1С Предприятие» и попытке входа там в раздел «Сеансы» вылезает ошибка: «Консоль управления (ММС) обнаружила ошибку оснастки. Рекомендуется выключить и снова перезапустить консоль управления.»… В качестве вариантов действий даётся три варианта, но какой не выбрать результат будет неизменен (потому даже перечислять их не хочу)… Покопался я в сети и нашёл что первое что предлагают в таких случаях делать гуру 1С это перерегистрировать эту самую консоль… Для этого есть соответствующий пункт меню… Если его нет то можно и в ручную и CMD-шки (запущенной от Администратора)… Понятное дело всё это происходит на сервере (так называемом «сервере приложений 1С»)… Я подумал что а почему бы и нет, вдруг поможет… Не помогло…

Искал дальше… Нашёл несколько упоминаний о том что нужно почистить каталог <путь куда у вас установлен сервер 1С>srvinforeg_1541snccntx, тут мне уже показалось стрёмным так огульно следовать совету… Решил выяснить, что там содержится… Оказалось, что в одном из двух файлов которые там лежат, хранится именно список текущих сеансов на сервере (ещё раз уточню «на сервере приложений 1С»)… Тут уж как в анекдоте «Смотрю написано «ОН», открыл, понюхал и правда ОН»… Сомнений не осталось… Тормознул сервер и стёр эти несчастные два файла… И консоль «Администрирование серверов 1С Предприятие» тут же начала работать, как и не было глюков и «искомых состояний»… Так что подытоживая могу смело сказать, что если у вас случился на «Сервере приложений 1С» описанный казус, то смело чистите указанный выше каталог… Хуже от этого не будет, потому как эти два файла создаются при запуске «сервера», но правда в том случае если их там не было, иначе не было бы такого глюка и в принципе…

UPD: Если у вас такая ошибка произошла не на сервере а на клиентской машине, то всё равно указанный каталог нужно чистить именно на сервере (собственно на клиентской машине его попросту нет)…

Запись опубликована в рубрике 1С с метками 1С, Борьба с глюками, программы. Добавьте в закладки постоянную ссылку.

Источник

Вопрос: Ошибка получение списка кластеров Ошибка операции администрирования

25.05.2023 14:01
160

Решение вопроса:

Такое сообщение возникает при попытке получить список сеансов в консоле администрирования 1с: Предприятия, может возникать после сбоя питания, сетевых проблем или при ошибках диска

Для решение проблемы необходимо выполнить 3 действия:

1) Остановить службу сервера 1с Предприятия

2) в каталоге кластера удалить папку название которой начинается на «snccntx» — это каталог сеансовых данных

3) Запустить службу сервера 1С

Ошибка больше не будет проявляться

Наши услуги

Все услуги

Источник

Я работаю в группе, которая занимается поддержкой отказоустойчивых кластеров, поэтому мне часто приходится выявлять и устранять неисправности. В этой статье будут описаны типичные проблемы, с которыми я сталкивался, с пояснением причин их возникновения и рекомендациями по их устранению

Проблема 1

Служба кластеров при запуске обнаруживает сети, в которые входит узел, и для каждой сети определяет сетевые адаптеры. Одна из типичных неполадок связана с тем, что отказоустойчивая кластеризация Windows Server (WSFC) допускает использование для одной сети только одного сетевого адаптера. Все прочие адаптеры этой сети игнорируются.

Предположим, что администратор настроил узел с двумя сетевыми адаптерами для одной сети:

Card1
IP Address: 10.10.10.1
Subnet Mask: 255.0.0.0
Card2
IP Address: 10.10.10.2
Subnet Mask: 255.0.0.0

Сетевой драйвер кластера (Netft.sys) для каждой сети будет использовать только один сетевой адаптер (или группу). Поэтому при данной конфигурации сеть кластера Cluster Network 1 (10.10.10.0/16) будет задействовать только сетевой адаптер Card1, тогда как сетевой адаптер Card2 будет игнорироваться, то есть не будет применяться для связи между узлами. Поскольку работает только одна сеть, при выходе Card1 из строя или утрате сетевого соединения узел не сможет взаимодействовать с другими узлами. Это единственная точка отказа. Чтобы избежать подобной ситуации, кластер следует настраивать так, чтобы между узлами существовало, как минимум, два сетевых пути. В этом случае при отказе одного из сетевых адаптеров связь между узлами будет осуществляться через другой сетевой адаптер.

Проблема 2

Вторую типичную проблему проще всего раскрыть с помощью сценариев. Опишем ее на примере двух различных конфигураций кластера: односайтовой и многосайтовой.

Односайтовый кластер. Предположим, что администратор решил изменить конфигурацию кластера, установив две сети между узлами Node1 и Node2. На узле Node1 он поменял IP-адреса и маски подсети сетевых адаптеров:

Card1
IP Address: 192.168.0.1 (Cluster Network 1)
Subnet Mask: 255.255.255.0
Card2
IP Address: 10.10.10.1 (Cluster Network 2)
Subnet Mask: 255.0.0.0

Кроме того, администратор поменял IP-адреса узла Node2 (192.168.0.2 и 10.10.10.2). При этом на узле Node1 в кластере он добавил группу файлового сервера, назначив ей IP-адрес 192.168.0.15.

Затем администратор протестировал кластер, чтобы убедиться в успешном переходе группы файлового сервера на узел Node2 при отработке отказа. Однако IP-адрес группы файлового сервера не виден в сети, то есть группа находится в автономном состоянии. В журнале событий системы регистрируется событие 1069, описание которого указывает на отказ ресурса с этим IP-адресом.

Причина отказа становится очевидной, если воспользоваться командой PowerShell Get-ClusterLog для вывода журнала кластера. Для этого достаточно ввести следующий набор символов:

Get-ClusterLog

Команда инициирует создание журнала кластера на каждом узле. Для построения журнала кластера только на одном узле можно добавить параметр -Node и указать имя узла. Можно также добавить параметр -TimeSpan для создания журнала только за последние x минут. Например, приведенная ниже команда предписывает построить журнал кластера на узле Node2 за последние 15 минут:

Get-ClusterLog –Node Node2 –TimeSpan 15

В результатах, представленных на экране 1, указано состояние «status 5035.».

Экран 1. Информация о состоянии 5035 в файле журнала кластера

Это сообщение об ошибке указывает на неработоспособное состояние сети кластера. Если администратор перейдет в диспетчер отказоустойчивости кластеров, то в разделе «Сети» он увидит, что сеть 192.168.0.0/24 содержит только один сетевой адаптер для узла Node1. Однако имеется новая сеть 192.0.0.0/8, обслуживаемая сетевым адаптером узла Node2. Администратор, поменяв IP-адрес сетевого адаптера на узле Node2, не поменял маску подсети. Таким образом, ошибка 5035 возникла из-за неверной настройки сетевого адаптера.

Создавая ресурс с IP-адресом, можно указать сеть, которая будет использоваться для него. Если эта сеть не будет существовать на узле, куда данный ресурс перейдет при отработке отказа, то WSFC не поменяет сеть, используемую ресурсом. В данном примере, при том IP-адресе, который указал администратор, и маске подсети, применяемой этим IP-адресом, группа файлового сервера сможет работать только по сети Cluster Network 1 (192.168.0.0/24).

Многосайтовый кластер. В случае многосайтового кластера каждый узел обычно имеет собственную сеть со своим IP-адресом. При первоначальном создании кластера и его ролей с помощью мастера создания ресурсов вам предлагается указать IP-адрес для сетей каждого из узлов, настроенных для клиентского доступа (см. экран 2).

Экран 2. Создание многосайтового кластера

Мастер создания ресурсов, создавая IP-адреса и назначая имя сети, автоматически присваивает параметру зависимости этого имени сети значение «или». Это означает, что если один из IP-адресов в сети, имя также видно в сети. Создавая группы или ресурсы перед добавлением узлов из других сетей, необходимо вручную создавать эти вторичные IP-адреса и добавлять зависимость «или».

Проблема 3

Для формирования кластера необязательно быть администратором домена, но создание объектов в Active Directory (AD) требует наличия соответствующих прав. Как минимум, необходимо обладать правами на просмотр и создание объектов (Read and Create) в том подразделении (OU), где создается данный объект имени кластера (CNO). CNO – это объект-компьютер, связанный с ресурсом-кластером «Имя кластера». При создании кластера служба WSFC использует учетную запись, с которой вы регистрировались в системе, чтобы создать объект CNO в том же OU, которому принадлежат узлы. Если вы не обладаете достаточными правами в отношении данного OU, кластер не будет создан, и система выдаст ошибку, как показано на экране 3.

Экран 3. Ошибка процесса создания кластера

В статье «Диагностика проблем отказоустойчивых кластеров Windows Server 2012» (№ 10 за 2013 г.) я рассказывал об использовании мастера проверки конфигурации в диспетчере отказоустойчивости кластеров для выявления причин возникающих проблем. Мастер позволяет выполнять различные тесты, включая проверку настроек Active Directory. В ответ на попытку запуска этого теста без достаточных прав в отношении данного OU будет выдана ошибка, как показано на экране 4. Соответствующая настройка прав позволит вам создать кластер.

Экран 4. Ошибка проверки настроек Active Directory

Все другие ресурсы с сетевыми именами в кластере ассоциированы с объектами виртуальных компьютеров (VCO), создаваемыми в том же OU, что и CNO. Следовательно, при назначении ролей в кластере необходимо указать CNO с соответствующими правами (просмотр и создание) в отношении OU, поскольку CNO формирует все VCO в кластере. В противном случае новая роль будет находиться в состоянии сбоя. Тогда в журнале появится событие 1194 (см. экран 5).

Экран 5. Событие 1194 в журнале событий системы

Есть и другие установки локального компьютера, способные вызвать ошибки (включая ошибки отказа в доступе) при создании VCO в AD.

1. В составе локальной группы «Пользователи» больше нет группы «Прошедшие проверку пользователи». Обычно она удаляется объектами групповой политики (GPO) или шаблонами безопасности.

2. В локальной политике безопасности разрешение Access this computer from the network («Доступ к этому компьютеру по сети») или Add workstations to the domain («Добавление рабочих станций к домену») больше не включает группу «Прошедшие проверку пользователи». Обычно она удаляется объектами групповой политики (GPO) или шаблонами безопасности.

3. Включены следующие права доступа:

сетевой доступ (не разрешать перечисление учетных записей SAM анонимными пользователями);
сетевой доступ (не разрешать перечисление учетных записей SAM и общих ресурсов анонимными пользователями).

4. Ресурс имени кластера в состоянии сбоя.

Проблема 4

CNO и VCO – учетные записи компьютера и, подобно учетным записям пользователей, они имеют пароли, генерируемые AD случайным образом. По умолчанию политика домена предусматривает сброс пароля учетной записи компьютера каждые 60 дней.

СNO используется для таких операций, как добавление новых узлов к кластеру, создание новых объектов в домене и выполнение динамической миграции виртуальных машин с узла на узел. Для выполнения этих операций пароль CNO в домене должен быть актуальным. Для верности служба кластера делает попытку сброса паролей этих объектов по истечении половины срока (через 30 дней). Если пароль не сброшен на 60-дневной отметке, имя кластера не видно в сети.

Для сброса пароля необходимо выполнить восстановление в диспетчере отказоустойчивости кластеров. Как показано на экране 6, щелкните правой кнопкой имя проблемного ресурса и выберите «Дополнительные действия» и «Восстановить».

Экран 6. Сброс пароля вручную в диспетчере отказоустойчивости кластеров

При обращении к AD для сброса пароля диспетчер отказоустойчивости кластеров задействует учетную запись пользователя, под которой вы зарегистрировались в системе, поэтому вашей учетной записи должно быть предоставлено право на изменение пароля CNO; в противном случае восстановление не будет выполнено. Необходимо также убедиться, что включено разрешение на сброс пароля CNO и VCO, чтобы служба WSFC могла выполнять сброс при необходимости.

Проблема 5

Чтобы узел был осведомлен о том, какие узлы являются активными участниками кластера (то есть о текущем членстве), применяется ряд периодических контрольных сигналов, передаваемых между узлами по сети. Эти пакеты сигналов представляют собой UDP-датаграммы, следующие через порт 3343.

Каждый пакет включает регистрационный номер, по которому отслеживается факт приема пакета. Это работает следующим образом: узел Node1, отправляющий регистрационный номер 1111, ожидает ответного пакета, включающего 1111. Эти действия совершаются между всеми узлами каждую секунду. Если узел Node1 не получает ответного пакета, он отправляет следующий по порядку регистрационный номер (1112), и т.д.

По умолчанию, если узел не получает пять контрольных сигналов в течение пяти секунд, WSFC устанавливает факт отказа узла. Активный узел в кластере отправляет пакет на узел, где установлен отказ, чтобы завершить работу службы кластера, и регистрирует событие 1135 в журнале событий системы (см. экран 7).

Экран 7. Событие 1135 в журнале событий системы

Такое событие может быть вызвано несколькими причинами, многие из которых связаны с блокировкой связи через порт 3343:

1. Отказ сетевого оборудования.

2. Устаревший драйвер или устаревшая прошивка сетевого адаптера.

3. Сетевая задержка.

4. Протокол IPv6 разрешен на серверах, но параметры брандмауэра Windows выключают следующие разрешения для входящего и исходящего трафика:

основы сетей – объявление поиска соседей;
основы сетей – запрос поиска соседей.

5. Настройка коммутаторов, брандмауэров или маршрутизаторов не допускает прохождения трафика данных UDP-датаграмм.

6. Проблемы производительности (зависания, задержки и прочее).

7. Неправильно настроенные параметры буфера приема у драйвера сетевого адаптера.

Первым делом я всегда проверяю счетчик отброшенных принятых пакетов в составе объекта производительности сетевого интерфейса в окне системного монитора. Этот счетчик отслеживает число входящих пакетов, которые были отброшены, хотя и не было зафиксировано каких-либо ошибок, препятствующих их передаче протоколу верхнего уровня. Одна из возможных причин – необходимость освободить место в буфере.

Для добавления счетчика отброшенных принятых пакетов в окне системного монитора щелкните правой кнопкой на дисплее и выберите «Добавить счетчики». В открывшемся окне добавления счетчиков укажите нужный компьютер, выполните прокрутку и выберите счетчик «Отброшено принятых пакетов». В выпадающем списке «Экземпляры выбранного объекта» выберите нужный сетевой адаптер и нажмите «Добавить» (см. экран 8).

Экран 8. Добавление счетчика отброшенных принятых пакетов в системный монитор

Добавив счетчик, проверьте его среднее, минимальное и максимальное значения. Если есть значения больше нуля, это указывает на необходимость настройки буфера приема для сетевого адаптера. Проконсультируйтесь с производителем сетевого адаптера по поводу рекомендуемых параметров. Может потребоваться перезагрузка.

В отказоустойчивом кластере Windows Server 2012 R2 можно воспользоваться мастером проверки конфигурации для выполнения проверки сетевого взаимодействия. Этот тест позволяет проверить возможность информационного обмена между узлами через порт 3343. Если есть проблемы связи, то будет выдана соответствующая ошибка с указанием возможной причины.

Проблема 6

Иногда диспетчер отказоустойчивости кластеров не открывается, выдавая сообщение об ошибке (см. экран 9). В процессе открытия диспетчер отказоустойчивости кластеров устанавливает WMI-соединение с каждым узлом кластера. Сообщение об ошибке, приведенное на экране 9, указывает на то, что один из узлов имеет недопустимое пространство имен, то есть с узла был удален экземпляр Cluster WMI (Cluswmi.mof). Остается выяснить, на котором из узлов он удален, поскольку в сообщении об ошибке эта информация отсутствует.

Экран 9. Сообщение о недопустимом пространстве имен

В листинге приведен сценарий Windows PowerShell, позволяющий выявить узел, утративший экземпляр Cluster WMI.

Установив проблемный узел, можно ввести команду

Set-Location C:WindowsSystem32Wbem
Mofcomp.exe Cluswmi.mof

Наиболее распространенной причиной утраты Cluswmi.mof узлом является устаревший способ решения проблем WMI. Для устранения неполадок WMI администраторы обычно используют команду Mofcomp.exe *.mof, позволяющую скомпилировать все файлы Managed Object Format (MOF) в репозиторий WMI. Однако дело в том, что существует довольно много файлов удаления для различных ролей и компонентов Windows, включая Cluster WMI. Поэтому файл Cluswmi.mof, устанавливаемый с помощью этой команды, впоследствии удаляется. Правильный способ восстановления репозитория WMI – с использованием команды Winmgmt.exe.

Ошибку легче предупредить

Как известно, предупредить ошибку легче, чем исправлять ее последствия. Поэтому в заключение повторю простое правило: регулярно актуализируйте состояние своих систем, применяя все обновления и исправления, касающиеся безопасности. Команда разработчиков отказоустойчивой кластеризации в Microsoft опубликовала материалы с перечнями исправлений, которые рекомендуется применить на всех кластерах. Каждой версии Windows посвящена отдельная публикация:

«Рекомендуемые исправления и обновления для отказоустойчивых кластеров на базе Windows Server 2012 R2» (support.microsoft.com/kb/2920151/EN-US);
«Рекомендуемые исправления и обновления для отказоустойчивых кластеров на базе Windows Server 2012» (support.microsoft.com/kb/2784261/EN-US);
«Рекомендуемые исправления и обновления для отказоустойчивых кластеров на базе Windows Server 2008 R2» (support.microsoft.com/kb/980054/EN-US).

Материалы обновляются по мере необходимости, поэтому всегда актуальны. Замечу, что в них перечислены не все исправления, а лишь самые критичные для обеспечения стабильной работы и наиболее востребованные, исходя из числа обращений в службу поддержки Microsoft.

Листинг. Сценарий PowerShell для определения узлов с отсутствующим экземпляром Cluster WMI

$NodeNames = Get-ClusterNode
ForEach ($ClusterName in $NodeNames)
{
Write-Host -NoNewline «Testing $ClusterName»
Try
{
$result = (Get-WmiObject -Class «MSCluster_CLUSTER» `
-namespace «rootMSCluster» `
-authentication PacketPrivacy `
-computername $ClusterName -erroraction stop).__SERVER
Write-host «: Successfully queried cluster node»
}
Catch
{
Write-host -NoNewline «: Failed to query cluster node»
Write-host -ForegroundColor Red -BackgroundColor Black `
$_.Exception.Message
}
}

Источник