1 34 Table of Contents 36 52

NET 12/2025

www.net-im-web.de 35 12/25 NETZE Open Source als Turbo der KI-Inferenz Hardware effizienter nutzen Wolfram Richter ist Senior Manager Solution Architects bei Red Hat und Stefan Bergstein ist Chief Architect Manufacturing bei Red Hat. Wolfram Richter, Stefan Bergstein Bei den Diskussionen rund um KI standen in der Vergangenheit das Training und die Performance großer Sprachmodelle im Vordergrund. Inzwischen geht es aber verstärkt um die KI-Inferenz. Sie ist mit vielen – vor allem technischen – Hürden verbunden. Neue Entwicklungen aus der OpenSource-Welt können hier eine entscheidende Entlastung bieten und zu einer Beschleunigung sowie Effizienzverbesserung der KI-Inferenz führen. Die KI-Inferenz betrifft die operative Phase von KI, in der das Modell in der Lage ist, das im Training Erlernte auf reale Situationen anzuwenden. Die Herausforderungen bei der KI-Inferenz betreffen vor allem die Infrastruktur und Datenqualität. So erfordert KI-Inferenz erhebliche Rechenressourcen, Arbeitsspeicher und Speicherkapazität. Verbunden ist das mit hohen Kosten. Um KI-Inferenz zuverlässig und performant zu betreiben, wird eine leistungsfähige Infrastruktur benötigt. Für Echtzeitanwendungen muss zudem eine niedrige Latenz gewährleistet sein. Von entscheidender Bedeutung ist auch die Datenqualität: Schlechte oder unvollständige Daten führen zu fehlerhaften Inferenzergebnissen. Die sorgfältige Auswahl, Aufbereitung und Überwachung der verwendeten Daten sind deshalb ein absolutes Muss. Diese Herausforderungen der KI-Inferenz lassen sich durch gezielte Strategien in Infrastruktur und Datenmanagement bewältigen. Open Source spielt dabei durch die Innovationskraft, die hohe Kosteneffizienz und die Flexibilität im Hinblick auf die Skalierung und das Ressourcenmanagement eine wichtige Rolle. So ermöglicht der Einsatz hybrider Cloud-Modelle, Ressourcen flexibel in On-premises- und Cloud-Umgebungen zu nutzen, wodurch die Rechenleistung bedarfsgerecht skaliert und die Kosten optimiert werden können. Edge-Computing kann überdies Latenzzeiten reduzieren und Echtzeitanwendungen unterstützen. Auch hinsichtlich Datenqualität und Governance bietet Open Source Vorteile: Standardisierte Datenpipelines, eine kontinuierliche Datenüberwachung und Data-Governance-Maßnahmen sichern die Qualität der Inputdaten und gewährleisten Compliance mit Datenschutzvorgaben. Für die Optimierung des gesamten Workflows wird die Disaggregation von Prozessen genutzt. Dabei werden die zwei Berechnungsphasen Prefill und Decode getrennt und in separaten Umgebungen ausgeführt. (Grafik: Red Hat)

Made with FlippingBook

RkJQdWJsaXNoZXIy MjE2Mzk=