LIBRISTO
LIBROAMANTO
obligatorisch
Werden Sie Teil einer Gemeinschaft von Buchliebhabern aus der ganzen Welt und erhalten Sie eine Reihe von Vorteilen. Konto kostenlos anlegen
0
Kostenloser Versand mit Zásilkovna ab 69.99 €
Österreichische Post 5.49 GLS-Kurier 4.99 GLS-Kurier 4.99 DPD-Kurier 3.99 DPD-Stelle 2.99

HPC Observability

Production Monitoring, Profiling, and Site Reliability for Linux Clusters, GPUs, and Parallel Storage at Scale

Sprache EnglischEnglisch
Buch Broschur
Buch HPC Observability M. Edwards
Libristo-Code: 52747456
Verlag Independently published, Mai 2026
HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance... Vollständige Beschreibung
? points 55 b Neu Neu
22.29 inkl. MwSt.
Erwartete Einlagerung Veröffentlichung 02. 06. 2026

30 Tage für die Rückgabe der Ware

HPC Observability is a hands-on guide for the engineers and administrators who keep high-performance computing systems running reliably at scale. It brings together the operational knowledge scattered across vendor documentation, conference papers, and forum threads into a practical framework for turning HPC telemetry into actionable insight.

Modern HPC environments - Slurm clusters, GPU-dense AI systems, Lustre and GPFS storage, InfiniBand and Slingshot fabrics - generate more data than any team can manually interpret. The result is wasted node-hours, failed simulations, hidden storage bottlenecks, fabric congestion, and GPU failures that surface only after days of runtime.

This book provides a complete operational approach to HPC observability through a five-layer model covering hardware, operating systems, schedulers, applications, storage, and networks. Readers learn how to build metrics pipelines for clusters from hundreds to tens of thousands of nodes; monitor GPUs with DCGM; profile MPI and OpenMP applications with PAPI and Score-P; diagnose storage and network slowdowns; create useful dashboards and alerts; and run effective incident response and post-mortems.

Drawing on peer-reviewed research and real production experience, the book includes original diagrams, practical workflows, reference material, Prometheus alert examples, and a step-by-step lab environment for learning on a laptop.

Written in the voice of a senior HPC engineer rather than an academic text, HPC Observability assumes readers already understand the fundamentals and focuses instead on the operational realities of running large-scale Linux, AI, and research-computing infrastructure.

Schauspielerin & Polyglotte
EWA KASP für
Video abspielen
Ewa Kasp
Libristo bietet die größte Auswahl an fremdsprachiger Literatur an. Deshalb kaufe ich meine Bücher hier ein.

Informationen zum Buch

Vollständiger Name HPC Observability
Autor M. Edwards
Sprache Englisch
Einband Buch - Broschur
Datum der Veröffentlichung 2026
Anzahl der Seiten 164
EAN 9798198765443
Libristo-Code 52747456
Gewicht 397
Abmessungen 216 x 280 x 9
Verschenken Sie dieses Buch noch heute
Es ist ganz einfach
1 Legen Sie das Buch in Ihren Warenkorb und wählen Sie den Versand als Geschenk 2 Wir schicken Ihnen umgehend einen Gutschein 3 Das Buch wird an die Adresse des beschenkten Empfängers geliefert

Anmeldung

Melden Sie sich bei Ihrem Konto an. Sie haben noch kein Libristo-Konto? Erstellen Sie es jetzt!

 
obligatorisch
obligatorisch

Sie haben kein Konto? Nutzen Sie die Vorteile eines Libristo-Kontos!

Mit einem Libristo-Konto haben Sie alles unter Kontrolle.

Erstellen Sie ein Libristo-Konto
Buchberater Libroamiko
Hallo, ich bin Libroamiko, kann ich helfen?