
AI Energy Score
von Helmut van Rinsum am 24. April 2025
Der Konzern Salesforce macht sich für den „AI Energy Score“ stark. Ähnlich wie bei Haushaltsgeräten sollen auch KI-Tools mit einem Label von 1 bis 5 versehen werden. Das soll das Umweltbewusstsein im Umgang mit Künstlicher Intelligenz fördern.
Der Energiehunger von Künstlicher Intelligenz droht, die Nachhaltigkeitsbemühungen von Unternehmen zu konterkarieren. Das Training der KI-Modelle, ihr laufender Betrieb, stetig wachsende Serverkapazitäten und die rasant zunehmende Nachfrage nach neuen KI-Modellen treiben die Entwicklung voran. Analysten gehen deshalb davon aus, dass sich der Energiebedarf im KI-Sektor in den nächsten beiden Jahren verfünffachen dürfte.
Zur Lösung dieses Problems liebäugeln einige Tech-Konzerne mit einer Renaissance der Atomkraft. Google will kleine, modulare Reaktoren in Betrieb nehmen, Microsoft einen stillgelegtes Kraftwerk in Pennsylvania wiederbeleben und Amazon Web Services hat kürzlich eine Vereinbarung getroffen, sein Rechenzentrum künftig mit Nuklearenergie zu versorgen.
Muss es immer gleich groß sein?
Daneben gibt es aber auch Bestrebungen, den Energiebedarf einzudämmen und in der Entwicklungsarbeit zu prüfen, ob wirklich immer große Large Language Modelle benötigt werden.
Denn manchmal können auch Small Language Modelle, sogenannte Tiny Giants, für bestimmte Aufgabenstellungen geeignet sein. Für Aufsehen sorgte vor diesem Szenario vor einigen Monaten die Veröffentlichung des neuen Chatbots von Deep Seek. Das chinesische Unternehmen behauptet, dass es nur etwa ein Zehntel der Energie des vergleichbaren Modells von Meta benötigt habe – beim Training.
Messung im produktiven Betrieb
Auch auf dem AI Action Summit Mitte Februar in Paris waren Nachhaltigkeit und KI ein großes Thema. Dort stellte Salesforce den „AI Energy Score“ vor, eine Branchen-Initiative, die der Cloud-Anbieter gemeinsam mit der Plattform Huggingface, dem KI-Unternehmen Cohere und der Carnegie Mellon University vorantreibt.
Der Energy Score misst die Energieeffizienz von KI-Modellen im Inferenzbetrieb, also nach dem Training, wenn die Modelle produktiv genutzt werden. „Wir messen den Energieaufwand in der echten Umgebung, also das, was in der Inferenzphase verbraucht wird“, erklärt Steffen Müller, Direktor für Nachhaltigkeit und Transformation bei Salesforce. „Das ist komplex, und einen Benchmark dafür gab es bislang nicht. Anders als beim Training, das oft vom Entwickler beschrieben wird und bei dem sich der Energieaufwand besser abschätzen lässt.“
Ziel: Innovationswettbewerb um energiesparende KI
Dazu stellen die Partner ein standardisiertes Benchmarking bereit, bei dem Modelle auf einheitlicher Hardware und für definierte Use Cases getestet werden. Anschließend erhalten die LLMs einen Energieeffizienz-Score von 1 bis 5 Sternen.
„Dieses Energieeffizienz-Label kennt jeder vom Kühlschrank“, sagt Müller. „Unser Ziel ist es, dass sich Unternehmen bewusster für umweltverträglichere Modelle entscheiden können und ein Innovationswettbewerb für energieeffiziente Modelle entsteht.“
100 KI-Modelle sind gelistet
Abgewickelt wird das Projekt über die Plattform Huggingface. Entwickler können dort ihr Modell für Tests anmelden, testen und die Ergebnisse hochladen. Aktuell sind dort 100 Modelle gelistet. IT-Verantwortliche und KI-Teams können im Leaderboard nachsehen, welches Modell bei welcher Anwendung vergleichsweise wenig Energie verbraucht.
Der Score deckt dabei verschiedene Anwendungsbereiche ab, beispielsweise Textgenerierung oder Bildklassifizierung. Deep Seek ist dort bislang noch nicht gelistet, weshalb sich derzeit nicht belegen lässt, ob das Modell auch im laufenden Betrieb so energiesparend arbeitet wie bei seinem Training.
„Wir messen den Energieaufwand in der echten Umgebung, also das, was in der Inferenzphase verbraucht wird. Das ist komplex und einen Benchmark dafür gab es bislang nicht.“
Das Interesse am AI Energy Score war unter den rund 1.000 Teilnehmern in Paris offenbar groß. Salesforce berichtet von zahlreichen Gesprächen mit weiteren Partnern. Gleichzeitig betont das Unternehmen, dass es keine Kommerzialisierung der Initiative betreibe. Vielmehr gehe es um mehr Transparenz und mehr Verantwortung im Umgang mit Künstlicher Intelligenz.
Weitere Tools zur Energiemessung
Auch andere Unternehmen konzentrieren sich derzeit darauf, den Energieverbrauch von KI-Tools und dem damit verbundenen CO2-Fußabdruck zu dokumentieren.
- Das französische Unternehmen Greenly, das eine Plattform zur CO2-Bilanzierung anbietet, hat in seiner „Carbon Management Suite“ ein Modul integriert, das den Energieverbrauch der Cloud- und Rechenzentren in Echtzeit misst.
- Das Open-Source-Tool „Code Carbon“ wiederum hilft Entwicklern, die CO2-Emissionen ihrer KI-Modelle – ebenfalls in Echtzeit – zu messen und datenminimalistische Ansätze zu etablieren.
- „Eco 2 AI“, ebenfalls ein Open-Source-Tool, trackt den Energieverbrauch und die damit verbundenen CO2-Emossionen von Machine-Learning Modellen. Ziel ist es auch hier, nachhaltigere KI-Praktiken zu fördern, und Entwicklern und Anwendern detaillierte Einblicke in den Ressourcenverbrauch zu bieten.
- Der Versicherer Axa entwickelte einen „AI Emissions Scenario Generator“, der den CO2-Ausstoß von KI-Anwendungen abschätzt. Das Tool berücksichtigt Faktoren wie das eingesetzte KI-Modell, den Standort des Rechenzentrums – also den lokalen Strommix – sowie die Anzahl der verarbeiteten Tokens und Anfragen.
Gerade solche Einblicke können auch für all die Menschen interessant sein, die für die KI-Tools in Unternehmen gar nicht unbedingt verantwortlich sind, die bereits heute aber viele ihrer Anfragen bei „Perplexity“ oder „Chat GPT“ eingeben. Denn nach einer Studie von Epoch AI, einem Institut für Künstliche Intelligenz, verbraucht eine Anfrage bei „Chat GPT“ etwa zehnmal soviel Energie wie eine Google-Suche.