Obwohl die Serverarchitektur bei Monitoringprodukten meist außer Acht gelassen wird, stellt vor allem NUMA eine große Unbekannte bei der möglichen Leistungsaufnahme dar, die bei Missachtung leicht zu massiven Performance-Problemen führt.
Dennis Zimmer, CEO und Gründer von Opvizor hat festgestellt:
"Viele, oder sogar die meisten Administratoren, sind sich der NUMA Problematik und den daraus folgenden negativen Auswirkungen nicht bewusst, wie wir in Kundenumfragen und Schulungen herausfanden.
Allerdings basieren nahezu alle in Rechenzentren betriebene Server, auf der NUMA Architektur. Dem Problem haben wir uns mit der jüngsten Performance Analyzer Version angenommen und unterstützen als erstes Produkt aktiv mit Echtzeit- und historischen NUMA-basierten Performancedaten bei der Problemsuche auf ESXi und VM Seite"
Was ist NUMA?
Non-Uniform Memory Access oder kurz NUMA ist eine Computer-Speicher-Architektur für Multiprozessorsysteme, bei denen jeder Prozessor einen eigenen, lokalen Speicher hat, aber anderen Prozessoren über einen gemeinsamen Adressraum direkten Zugriff darauf gewährt (Distributed Shared Memory). Die Speicherzugriffszeiten in einem solchen Verbund hängen daher davon ab, ob sich eine Speicheradresse im lokalen oder im fremden Speicher befindet.
Auszug aus Wikipedia
Warum kommt es zu Problemen
Durch die Virtualisierung und die damit verbundene Konsolidierung mehrerer Systeme mit unterschiedlichsten CPU- und Hauptspeicheranforderungen ist keine umfängliche 1:1 Zuordnung für NUMA mehr möglich. Zwar wird jedem VM ein lokaler NUMA Knoten zugeordnet, um die maximale Zugriffsgeschwindigkeit auf den Hauptspeicher zu ermöglichen, aber es kommt ggf. auch zu Zugriffen einzelner virtueller Maschinen auf den Hauptspeicher des fremden NUMA Knoten. In einem solchen Fall wird die Gesamtleistung der virtuellen Maschine inklusive der laufenden Anwendungen u. U. massiv reduziert.
Je mehr Hauptspeicher vom fremden Speicher im Zugriff ist, desto schlimmer wird die Gesamtsituation.
Wie kann man diese Leistungsprobleme vermeiden
In erster Linie ist das korrekte Sizing, also die Ressourcenvergabe bei virtuellen Maschinen innerhalb der NUMA Grenzen des VMware ESXi Serversystems, ein wesentlicher Faktor zur Vermeidung von Leistungsproblemen.
Bei manchen Systemen ist dies allerdings nicht möglich und der Administrator muss sich mit Themen wie vNUMA beschäftigen, um die Optimierung durchzuführen.
Ein weiteres Problemfeld sind "Resource Pools" und "Resource Limits", welche zu ungünstigen Hauptspeicherzugriffen führen.
All die genannten potentiellen Problemkonfigurationen können mit Performance Analyzer 4.8 erkannt werden.
Bereits in der Testphase mit ausgewählten Kunden zur Version 4.8, konnten wir Leistungsprobleme bei Web-Servern und virtualisierten Datenbanksystemen innerhalb weniger Minuten feststellen. Einige Kunden waren sich der Leistungsprobleme seit langer Zeit bewusst, konnten aber die Ursache nicht finden.
Spectre und Meltdown
Performance Analyzer 4.8 integriert außerdem neue Dashboards zur einfachen Fehlersuche bei VM und ESXi Host Leistungsproblemen. Dies sowohl auf Basis von Einzelsystemen oder Cluster- bzw. über vCenter Grenzen hinweg.
Wer seine Systeme auf die Intel Bugs Spectre/Meltdown und deren Patches überprüfen will, findet in Version 4.8 ebenfalls ein entsprechendes Dashboard. Dieses bietet auch die Möglichkeit die Leistungsunterschiede vor und nach der Patchaktivierung zu vergleichen.
Kostenfreie Evaluierung
Sie können die aktuellste Version des Performance Analyzer kostenlos testen, registrieren Sie sich einfach hier:
https://try.opvizor.com/perfanalyzer/
Für den Fall, dass Sie sich für VMware Cloud on AWS interessieren und unsicher sind, ob die Dritthersteller-Lösungen weiterhin funktionieren. Als Technologie-Partner von VMware unterstützen wir Kunden bei der Optimierung und Analyse der bewährten Lösungen in der Cloud (public und private). VMware stellt die gleichen Integrationsmöglichkeiten bei on-Premise Integrationen in einer VMware vSphere-Umgebung sowie für VMware Cloud on AWS zur Verfügung. Daher müssen keine Anpassungen seitens Dritthersteller durchgeführt werden.
Ressourcen
Opvizor Homepage https://www.opvizor.com/
Download der Testversion: https://try.opvizor.com/perfanalyzer/