Troubleshooting in VMware-Umgebungen

Zuverlässige Performance-Analyse

19. Januar 2016, 7:00 Uhr | Jos Op ’t Root/pf, Geschäftsführer bei Netcor, www.netcor.de,

Wenn auf virtualisierten IT-Umgebungen laufende Applikationen Probleme bereiten, kommen Administratoren ins Schwitzen: Ihre konventionellen Analysewerkzeuge versagen. Neue Messansätze stellen in VMware-Umgebungen die nötige Transparenz bereit und ermöglichen zuverlässiges Anwendungs-Performance-Troubleshooting.Die IT zählt für die meisten Unternehmen zu den wichtigsten Ressourcen: Ohne eine zuverlässige, sichere und leistungsfähige Produktivumgebung brechen ihre Geschäftsmodelle zusammen. Gleichzeitig ist die IT ein großer Kostenfaktor. Um die Kosten unter Kontrolle zu halten, sind Unternehmen gezwungen, die Effizienz ihrer IT in allen Bereichen zu steigern und ihre Infrastruktur zu optimieren. Virtualisierung ist dafür das Gebot der Stunde. Dabei werden nicht nur einzelne Server auf einem physischen Host abgebildet, sondern immer öfter ganze Infrastrukturen inklusive virtueller Switches und Netzwerkverbindungen. Doch die Virtualisierung hat auch Schattenseiten: Sie erhöht die Komplexität einer IT-Umgebung und erschwert damit nicht nur das Troubleshooting, sondern auch Performance-Analysen in ganz erheblichem Umfang.   Virtualisierung bringt neue Herausforderungen Wie bei herkömmlichen Systemen hängt auch bei virtuellen Umgebungen der Erfolg eines Unternehmens eng mit der Performance der eingesetzten geschäftswichtigen Anwendungen zusammen. Diese zu messen und bei Problemen der Ursache auf den Grund gehen zu können, ist nicht trivial und stellt Administratoren in virtuellen IT-Umgebungen vor neue Herausforderungen. Was in konventionellen Netzwerken mit dedizierter, manuell zugänglicher Hardware gut funktioniert, klappt in VMware-Umgebungen nur begrenzt: Herkömmliche Management-Lösungen liefern in den virtuellen Umgebungen zwar Informationen über die Systemauslastung, bieten aber keinerlei Transparenz für den Datenfluss innerhalb der virtuellen Maschine (VM). Dabei gibt es auch in virtuellen Umgebungen ganz reale Probleme wie Paketverluste. Und wie in der realen Welt können diese die Leistung der geschäftswichtigen Anwendungen erheblich beeinträchtigen. Die Abstraktion ganzer IT-Umgebungen überschwemmt Administratoren mit nicht korrelierten Daten. Zusätzlich können durch den Datenaustausch zwischen virtuellen Maschinen auf einem Host "tote Winkel" entstehen, die sich mit herkömmlichen Administrations-Tools nicht hinreichend ausleuchten lassen. Hinzu kommen weitere Probleme: Durch das Teilen gemeinsamer Ressourcen bricht die Virtualisierung bisherige systemische und organisatorische Grenzen auf. Dabei verschwimmen die bislang klar abgegrenzten Verantwortungsbereiche für Applikationen und Infrastrukturen, auch das Nutzen der vorhandenen Tools lässt sich immer weniger auf bestimmte Bereiche einschränken. In dieser Situation manifestiert sich ein Zuständigkeitsproblem zwischen Applikations- und Infrastruktur-Performance-Teams: Mit konventionellen Tools lässt sich nur schwer feststellen, ob der Grund für eine schlechte Applikations-Performance möglicherweise in einer Komponente der Infrastruktur zu suchen ist. Marktforscher Gartner hat bereits 2014 festgestellt, dass der fehlende Austausch von topologischen Performance-Daten über organisatorische Silogrenzen hinweg dazu führt, dass Probleme zunehmend in gemeinsamen Sitzungen der jeweils zuständigen Teams diskutiert werden. Das ist aufwendig und zeitintensiv. Aufgrund der mangelnden Transparenz ist es zudem schwierig, einen Überblick über die Gesamtsituation zu erhalten. Daher ist es kaum möglich, durch Infrastrukturüberlastung begründete Service-Unterbrechungen vorherzusagen und die Performance einzelner Anwendungen proaktiv zu optimieren.   Anwendungsbezogene Performance-Analyse in VMware Es gibt eine Vielzahl von Tools für die virtuelle Performance- und Kapazitätsanalyse. Diese überwachen die CPU-, Speicher-, Storage- und Netzwerkleistung. Ihre Daten erhalten sie aus dem VMware Vcenter, der zentralen Verwaltungssoftware zum Überwachen und Managen einer virtuellen IT-Umgebung. Vcenter liefert Performance-Metriken wie "Bytes in/out", "Packets in/out" und Fehlerzähler für die physischen und virtuellen Interfaces. Diese Informationen sind wertvoll, bieten aber lediglich einen eingeschränkten Nutzen für effizientes Troubleshooting in Fehlersituationen. Wenn beispielsweise auf einem Host-Adapter eine erhöhte ausgehende Netzwerklast zu verzeichnen ist, bleibt unklar, ob es sich dabei um ein Problem handelt. Auch ein System-Monitoring trägt wenig zur Erhellung bei: Es kann darstellen, dass die Netzwerklast zu einem bestimmten Zeitpunkt ungewöhnlich hoch ist - mehr allerdings nicht. Unklar bleibt, um welchen Datenverkehr es sich handelt, von wem er ausgeht und welche Auswirkungen diese zusätzliche Last auf die Latenz für den anderen Datenverkehr auf diesem Host hat. Genau diese Informationen sind jedoch wichtig für eine effiziente Fehlererkennung und -behebung. Eine detaillierte Analyse von Performance-Problemen in virtuellen Netzwerken erfordert daher Netflow-ähnliche Daten, damit das IT-Team feststellen kann: Wer kommuniziert mit wem? Welche Ports und Protokolle werden genutzt? Wann hat die Kommunikation stattgefunden? Wie groß war das Datenvolumen? Welche Abhängigkeiten bestehen zwischen Applikations-Antwortzeiten und der Auslastung der Infrastruktur (Host, Netzwerk und Storage)? Welche VMs kämpfen mit ungewöhnlichen hohen virtuellen Netzwerklaufzeiten? Darüber hinaus muss der Verursacher für die hohen Laufzeiten ermittelt werden: Ist es der physische Switch, die Netzwerkkarte des Host-Systems, der virtuelle Switch oder die virtuelle Netzwerkkarte? Erst wenn alle diese Detailinformationen vorhanden sind, lassen sich Performance-Engpässe in virtuellen Netzwerken effizient diagnostizieren - und sich anbahnende Probleme bei der Applikations-Performance proaktiv verhindern.   Visualisieren, analysieren und optimieren Neue, auf die durch Virtualisierung gestiegenen Anforderungen ausgerichtete Messansätze schließen die entstandene Lücke zwischen Applikations- und Infrastruktur-Performance-Management. Sie stellen die wichtige Transparenz auch für virtuelle Umgebungen bereit und liefern somit wertvolle Informationen für die Fehlerbehebung und auch für die Optimierung der geschäftswichtigen Anwendungen. Mit geeigneten Software-Tools wie beispielsweise Uila AA-IPM des US-amerikanischen Herstellers Uila lassen sich Performance-Schwachstellen in der Vsphere-Infrastruktur einer VMware-Umgebung in Echtzeit oder auch historisch aufzeigen. Wichtigste Komponente ist dabei eine virtuelle Gastmaschine, die auf dem physischen Host läuft und als virtueller Smart TAP (VST, Test Access Point) an den Vswitches angedockt wird. So kann die Gast-VM den Datenverkehr zwischen den VMs untersuchen. Eine detaillierte Analyse jedes Pakets (Deep Packet Inspection, DPI) liefert Metadaten über die Applikationen und das Netzwerk, etwa Antwortzeiten und Kommunikationsbeziehungen.   Datenverkehr zwischen den VMs untersuchen Ebenso wichtig wie der VST ist die zentrale Management-Software: Darüber können die zuständigen Mitarbeiter die virtuellen Switches auswählen, an denen der VST eine DPI durchführen soll. Dritter im Bunde ist ein Virtual Information Controller (VIC). Dieser ermittelt die Auslastungsdaten aus dem Vcenter, also die Performance-Daten der Infrastruktur (Host, Netzwerk, und Storage), und speichert diese für eine mögliche forensische Analyse in einer Hadoop-Analytikplattform ab. Durch das Korrelieren dieser und der VST-Daten lässt sich die aktuelle Situation genau analysieren. Sogenannte Sankey-Diagramme zum Visualisieren der Datenflüsse und der Applikations-Topologiekarte unterstützen System- und Netzwerkadministratoren, indem sie sowohl einen globalen Überblick als auch einen detaillierten Einblick in mögliche Performance-Engpässe geben. So gerüstet, können die Systemverantwortlichen Fehler schnell erkennen, die Ursache ermitteln und das Problem effizient lösen. Damit eine solche Software ihr Potenzial voll entfalten kann, ist es wichtig, dass sie sich leicht installieren, nutzen und skalieren lässt. Dann können auch Mitarbeiter, die nicht auf die Fehlersuche in Netzwerken spezialisiert sind, Ursachen für Leistungsprobleme von Applikationen selbst ermitteln. Eine intuitive Oberfläche, die den Anwender mit etablierten Signalfarben - Grün, Gelb, Orange und Rot - sowie Best-Practice-Methoden durch einen Troubleshooting-Prozess führt, hilft dabei erheblich.   Fazit Mit geeigneten Tools verlieren das Troubleshooting und die Performance-Optimierung von geschäftswichtigen Anwendungen in virtuellen Umgebungen ihren Schrecken. Auf intuitive Bedienbarkeit ausgelegte Analyseprogramme wie Uila schließen die Lücke zwischen Anwendungen und Infrastruktur und liefern genaue Leistungsdaten aller beteiligten IT-Bereiche. Ohne Agenten findet solch ein Tool sämtliche Abhängigkeiten zwischen der Applikationstopologie und der virtuellen Infrastruktur. Auch nicht auf Fehlersuche in Netzwerken spezialisierte Mitarbeiter können damit Ursachen für Applikations-Performance- und Verfügbarkeitsprobleme schnell ermitteln und proaktiv Trends identifizieren, die auf zukünftige Performance-Probleme hindeuten. So lassen sich rechtzeitig Maßnahmen einleiten, die Service-Unterbrechungen aufgrund einer überlasteten Infrastruktur verhindern.

Ein anpassbares Dashboard zeigt Abweichungen vom Normalzustand und Fehlerdetails an.

Architektur von Uila AA-IPM und Zusammenspiel der einzelnen Komponenten.
LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu SAM Sensor-Analyse- Messtechnik GmbH

Weitere Artikel zu Toshiba Mobile Communications Division

Weitere Artikel zu HFO Telecom AG

Matchmaker+