Améliorations du dépannage du cluster de basculement Windows Server 2016 – Journal de cluster – Microsoft Tech Community – Bien choisir son serveur d impression
Publié pour la première fois sur MSDN le 14 mai 2015
Améliorations du journal de cluster
Il s'agit du premier d'une série de blogs qui fournira des détails sur les améliorations que nous avons apportées aux outils et méthodes de dépannage des clusters de basculement avec Windows Server 2016.
Le cluster de basculement possède des journaux de diagnostic exécutés sur chaque serveur qui permettent de résoudre les problèmes en profondeur sans avoir à reproduire le problème. Ce journal est précieux pour le support de Microsoft ainsi que pour ceux qui ont une expertise dans le dépannage des clusters de basculement.
Pointe:
Accédez toujours d'abord au journal des événements système lors du dépannage d'un problème. Le cluster de basculement publie des événements dans le journal des événements système qui sont souvent suffisants pour comprendre la nature et la portée du problème. Il vous donne également la date / heure spécifique du problème, ce qui est utile si vous regardez d'autres journaux des événements ou si vous creusez dans le cluster.log si nécessaire.
Génération du Cluster.log
Ce n'est pas nouveau, mais ce seront des informations utiles pour ceux qui ne sont pas familiers avec la génération du journal de cluster.
Get-ClusterLog
est l'applet de commande Windows PowerShell qui générera le cluster.log sur chaque serveur membre du cluster et en cours d'exécution. La sortie ressemble à ceci sur un cluster à 3 nœuds:
Les fichiers Cluster.log se trouvent dans le
(généralement c: windows cluster Reports) sur chaque nœud.
Vous pouvez utiliser le
-Destination
pour que les fichiers soient copiés dans un répertoire spécifié avec le nom du serveur ajouté au nom du journal, ce qui facilite l'obtention et l'analyse des journaux de plusieurs serveurs:
D'autres paramètres utiles sont discutés dans le reste de ce blog.
Quoi de neuf
Je vais mettre en évidence les améliorations apportées aux informations du cluster.log de Windows Server 2016 qui seront les plus intéressantes et utiles au grand public intéressé par le dépannage des clusters de basculement, et laisser le détail de chaque élément du journal dans un futur blog ( s). J'inclus des références et des liens vers des ressources liées au dépannage des clusters et à l'utilisation du journal de cluster à la fin de ce blog.
Informations sur TimeZone
Le cluster.log est un vidage des informations du système et capturé dans un fichier texte. Les horodatages par défaut sont UTC (que certains appellent GMT). Par conséquent, si vous êtes dans un fuseau horaire UTC + 8, vous devez regarder l'horodatage dans le journal du cluster et ajouter 8 heures. Par exemple, si vous vous trouvez dans ce fuseau horaire et qu'un problème est survenu à 13 h 38 (13 h 38), l'horodatage UTC dans le journal du cluster serait (21 h 38).
Nous proposons 2 améliorations dans le cluster.log qui facilitent la découverte et l'utilisation de ce fuseau horaire et du décalage UTC:
-
Décalage UTC du serveur:
Le haut du cluster.log note le décalage UTC du serveur d'origine. Dans l'exemple ci-dessous, il note que le serveur est réglé sur UTC + un décalage de 7 heures (420 minutes). Noter spécifiquement ce décalage dans le journal supprime les conjectures liées au paramètre de fuseau horaire du système. -
Le journal de cluster utilise l'heure UTC ou locale
. Le haut du cluster.log indique si le journal a été créé en utilisant UTC ou l'heure locale pour les horodatages. le
–UseLocalTime
paramètre pour
Get-ClusterLog
oblige le cluster.log à écrire des horodatages qui sont déjà ajustés pour le fuseau horaire du serveur au lieu d'utiliser UTC. Ce n'est pas nouveau, mais il est devenu évident qu'il est utile de savoir si ce paramètre a été utilisé ou non, il est donc noté dans le journal.
[===Cluster ===]
UTC = décalage heure locale + fuseau horaire; avec l'heure d'été, le décalage de fuseau horaire de cette machine est de 420 minutes ou 7 heures
Les journaux ont été générés à l'aide du temps universel coordonné (UTC). 'Get-ClusterLog -UseLocalTime' sera généré à l'heure locale.
Pointe:
Les sections du cluster.log sont encapsulées dans [=== ===], ce qui facilite la navigation dans le journal de chaque section en effectuant une recherche sur "[=== ". Comme un petit anecdote, ce format a été choisi parce qu'il ressemble un peu à un Tie Fighter et nous avons pensé qu'il avait l'air cool.
Objets de cluster
Le cluster a des objets qui font partie de sa configuration. L'obtention des détails de ces objets peut être utile pour diagnostiquer les problèmes. Ces objets incluent des ressources, des groupes, des types de ressources, des nœuds, des réseaux, des interfaces réseau et des volumes. Le cluster.log vide maintenant ces objets dans une liste de valeurs séparées par des virgules avec des en-têtes.
Voici un exemple:
[===Networks ===]
Nom, Id, description, rôle, transport, ignorer, AssociatedInterfaces, PrefixList, adresse, addressMask, ipV6Address, état, linkSpeed, rdmaCapable, rssCapable, autoMetric, métrique,
Réseau de grappes 1,27f2d19b-7e23-4ee3-a226-287d4ebe9113,, 1, TCP / IP, faux, 82e5107c-5375-473a-ab9f-5b6450bf5c7f30ff5ff6-00a3-494b-84b6-62a27ef99bb3bcc282b8b2cb82 10.10.1.0/24, 10.10.1.0,255.255.255.0,, 3,1000000000, faux, faux, vrai, 39984,
Réseau de grappes 2, e6efd1f6-474b-410a-bd7b-5ece99476cd8« 1, TCP / IP, faux, 57d9b74d-8d9e-4afe-8667-e91e0bd23412617bb075-3803-4e5e-a039-db513cf604b5fc9 10.10.3.0/24, 10.10.3.0,255.255.255.0,, 3,1000000000, faux, faux, vrai, 39985,
Réseau de grappes 3,1a5029c7-7961-40bb-b6b9-dcbbe4187034,, 3, TCP / IP, faux, d3cdef35-82bc-4a60-8ed4-5c2b278f7c0e83c7c4b8-b588-425c-bfae-0c69d7a4bccd-bcdb 157.59.132.0/22 2001: 4898: 28: 4 :: / 64,157.59.132.0,255.255.252.0,2001: 4898: 28: 4 ::, 3,100000000, false, false, true, 80000,
Ces sections peuvent être utilisées par n'importe quelle application capable d'analyser du texte CSV. Ou, vous pouvez copier / coller dans une feuille de calcul Excel, ce qui facilite la lecture et fournit un filtre / tri / recherche. Pour l'exemple ci-dessous, j'ai collé la section ci-dessus dans une feuille de calcul, puis utilisé l'action "Texte en colonnes" dans l'onglet "DONNÉES" d'Excel de Microsoft.
Nouveau journal détaillé
Nouveau pour Windows Server 2016 est le canal d'événements DiagnosticVerbose. Il s'agit d'un nouveau canal qui s'ajoute au canal de diagnostic pour FailoverClustering.
Dans la plupart des cas, le canal de diagnostic, avec le niveau de journal par défaut défini sur la valeur par défaut de 3, obtient suffisamment d'informations pour qu'un dépanneur expert ou les ingénieurs de support de Microsoft puissent comprendre un problème. Cependant, dans certains cas, nous avons besoin d'une journalisation plus détaillée et il est nécessaire de définir le niveau de journalisation du cluster sur 5, ce qui oblige le canal de diagnostic à ajouter le niveau détaillé des événements au journal. Après avoir modifié le niveau de journalisation, vous devez reproduire le problème et analyser à nouveau les journaux.
La question se pose, pourquoi ne suggérons-nous pas de maintenir le niveau de journalisation à 5? La réponse est que les journaux ont plus d'événements et s'encapsulent donc plus rapidement. La possibilité de revenir en arrière pendant des heures ou des jours dans les journaux est également souhaitable, de sorte que l'emballage plus rapide pose son propre problème de dépannage.
Pour tenir compte de la journalisation détaillée voulue pour la période la plus récente et d'une journalisation qui fournit un historique adéquat, nous avons implémenté un canal de diagnostic parallèle que nous appelons DiagnoticVerbose. Le journal DiagnosticVerbose est toujours défini pour l'équivalent du niveau de journal de cluster 5 (verbeux) et s'exécute en parallèle au canal de diagnostic pour FailoverClustering.
Vous pouvez trouver la section DiagnosticVerbose dans le cluster.log en effectuant une recherche sur «DiagnosticeVerbose». Il ira dans l'en-tête de section:
[=== Microsoft-Windows-FailoverClustering/DiagnosticVerbose ===]
[Verbose] 00000244.00001644 :: 2015/04 / 22-01: 04: 29.623 DBG
[RCM] rcm :: PreemptionTracker :: GetPreemptedGroups ()
[Verbose] 00000244.00001644 :: 2015/04 / 22-01: 04: 29.623 DBG
[RCM] a demandé des groupes préemptés, renvoyant 0 enregistrements
Le canal de diagnostic (niveau de journal par défaut de 3) peut être trouvé en effectuant une recherche sur «Journaux de cluster»:
[=== Cluster Logs ===]
00000e68.00000cfc :: 2015/03 / 23-22: 12: 24.682 DBG [NETFTAPI] reçu NsiInitialNotification
00000e68.00000cfc :: 2015/03 / 23-22: 12: 24.684 DBG [NETFTAPI] reçu NsiInitialNotification
Événements d'autres canaux
Il y a un "Astuce" ci-dessus qui note la recommandation de commencer dans le journal des événements système en premier. Cependant, il n'est pas rare que quelqu'un génère les journaux de cluster et les envoie à son serveur interne 3.
rd
support tiers ou à d'autres experts. Revenir en arrière et obtenir le système ou d'autres journaux des événements qui peuvent être utiles pour diagnostiquer le problème peut prendre du temps, et parfois les journaux ont déjà été encapsulés ou ont été effacés.
Nouveau dans le journal de cluster Windows Server 2016, les canaux d'événements suivants seront également transférés dans le cluster.log pour chaque nœud. Comme ils sont tous dans un seul fichier, vous n'avez plus besoin d'aller aux nœuds et de tirer chaque journal individuellement.
[=== System ===]
[=== Microsoft-Windows-FailoverClustering/Operational logs ===]
[=== Microsoft-Windows-ClusterAwareUpdating-Management/Admin logs ===]
[=== Microsoft-Windows-ClusterAwareUpdating/Admin logs ===]
Voici un exemple:
[=== System ===]
[System]
00000244.00001b3c :: 2015/03 / 24-19: 46: 34.671 ERR
Machine virtuelle de ressource de cluster
Machine «en cluster»
En fonction des stratégies d'échec de la ressource et du rôle, le service de cluster peut essayer de mettre la ressource en ligne sur ce nœud ou déplacer le groupe vers un autre nœud du cluster, puis le redémarrer. Vérifiez l'état des ressources et du groupe à l'aide du Gestionnaire de cluster de basculement ou de l'applet de commande Get-ClusterResource Windows PowerShell.
[System] 00000244.000016dc :: 2015/04 / 14-23: 43: 09.458 INFO Le service de cluster a changé le mot de passe du compte 'CLIUSR' sur le nœud '
Pointe:
Si la taille du fichier cluster.log est plus grande que vous le souhaitez, le commutateur –TimeSpan pour Get-ClusterLog limitera la distance (en minutes) à laquelle il remontera dans le temps pour les événements. Par exemple, Get-Clusterlog –TimeSpan 10 entraîne la création du cluster.log sur chaque nœud et n'inclut que les événements des 10 dernières minutes. Cela inclut les canaux Diagnostic, DiagnosticVerbose et autres qui sont inclus dans le rapport.
Références Cluster.log:
Dépannage des clusters de basculement Windows Server 2012, comment aller à la racine du problème:
http: //windowsitpro.com/windows-server-2012/troubleshooting-windows-server-2012-failover-cluster …
Get-ClusterLog:
https://technet.microsoft.com/en-us/library/hh847315.aspx
Set-ClusterLog:
https://technet.microsoft.com/en-us/library/ee461043.aspx
Commentaires
Laisser un commentaire