This blog post is also available in English
- Steigende KI-Preise nerven, aber die Abhängigkeit von wenigen US-Anbietern ist das größere Risiko.
- Open-Weights-Modelle und in der EU gehostete Services bieten stärkere Datenschutzgarantien und reduzieren den Vendor-Lock-In.
- Einige Open-Weights-Modelle sind schon heute gut genug für die tägliche Softwareentwicklung.
- Wir müssen Claude oder GPT nicht aufgeben, aber wir sollten aktiv nach Alternativen suchen, bevor wir auf sie angewiesen sind.
Anthropic, OpenAI und Google stehen seit Langem an der Spitze des KI-Geschäfts, und es ist ihnen gelungen, die Softwareentwicklungsbranche davon zu überzeugen, wie nützlich Agentic Software Engineering sein kann. Agenten haben besonders die IDE-Branche durcheinandergebracht. Vor einem Jahr hätte ich mit Händen und Füßen darum gekämpft, wenn jemand versucht hätte, mir meine IntelliJ-Lizenz wegzunehmen. Inzwischen nutze ich meine IDE zunehmend nur noch, um den bereits generierten Code zu reviewen, und würde mir einfach ein anderes Werkzeug suchen, falls die JetBrains-Lizenzen durch die Decke gehen.
Steigende Kosten
Doch jetzt, da Anthropic und OpenAI wahrscheinlich Product Market Fit gefunden haben, haben sie auch begonnen, die Preise zu erhöhen. Die GPT-Modelle waren früher deutlich günstiger als die Anthropic-Modelle, doch mit dem Release von GPT 5.5 wurde es zum teuersten Modell auf dem Markt (zumindest bis Anthropic sein neues Modell Fable veröffentlichte). Am meisten missfiel mir dabei nicht, dass die Preise stiegen. Wir haben es mit US-Unternehmen zu tun, die Gewinn erzielen wollen, das hatte ich also voll und ganz erwartet. Was mir missfiel, war das Gefühl, mehr Geld zu zahlen, ohne im Gegenzug deutlich bessere Ergebnisse zu bekommen. Ich glaube, das hängt damit zusammen, wie man die Modelle nutzt. Wenn man eine riesige Codebasis mit vielen verschiedenen Code-Stilen hat und möchte, dass der Agent produktiv ist, braucht man womöglich das neueste, riesige Spitzenmodell. Wenn man seinen Agenten viel Code generieren oder viele Aufgaben für sich orchestrieren lässt, profitiert man möglicherweise vom neuesten, riesigen Spitzenmodell. Diesen Ansatz der Softwareentwicklung halte ich persönlich für etwas experimentell und habe mich entschieden, andere ihn in ihren Codebasen ausprobieren und schauen zu lassen, wie es ihnen damit ergeht, bevor ich ihn in meiner eigenen umsetze. Am effektivsten arbeite ich nach wie vor, wenn ich den Umfang meiner Arbeit in Häppchen herunterbreche, die klein genug sind, dass ich sie reviewen kann. Und für Arbeitshäppchen in dieser Größenordnung? Eine Verbesserung der Modellqualität habe ich seit GPT 5.3 oder Sonnet 4.6 nicht mehr gesehen. Trotzdem wird von mir erwartet, denselben Anbietern mehr Geld hinzublättern, selbst dann, wenn sie jene älteren, günstigeren Modelle, die für meinen Anwendungsfall vollkommen ausreichen, aus ihren Abos entfernen.
Digitale Souveränität
Die Kosten sind das dringlichste Problem, aber nicht das kritischste. Die US-Regierung scheint fest entschlossen zu kontrollieren, auf welche Modelle andere Nationen Zugriff haben. In gewisser Weise begrüße ich es, dass die US-Regierung so offen eingreift, denn es erinnert uns daran, dass wir zunehmend von Technologie abhängig sind, die morgen schon weg sein könnte. Anthropic und OpenAI haben natürlich ein ausgeprägtes Eigeninteresse daran, dass wir ihren Produkten treu bleiben. Doch auch das ist nicht unbedenklich. OpenAI hat Entscheidungen getroffen, die auf ethischer Ebene fragwürdig sind (etwa die Entscheidung, mit dem US-Militär zusammenzuarbeiten). Anthropic hat sich als der Gute im KI-Feld positioniert aber ich muss unweigerlich an das alte Google-Motto „Don’t be evil“ denken und da Anthropic nach wie vor ein gewinnorientiertes Silicon-Valley-Unternehmen ist, bin ich skeptisch, ob es die Interessen anderer berücksichtigen wird, wenn diese mit den eigenen kollidieren. Es gibt zudem einen enormen Interessenkonflikt bei Auftragsverarbeitungsverträgen mit Unternehmen, die KI-Modelle trainieren, denn die Session-Daten, die wir bei der Arbeit mit Agenten erzeugen, sind genau das, was diese Unternehmen brauchen, um ihre Modelle noch besser zu machen. Wir müssen einfach darauf vertrauen, dass sie sich an die Regeln halten (ein Gedanke, der mich etwas nervös macht). Generell halte ich das Risiko eines Datenmissbrauchs bei normalen Coding-Projekten für eher gering, weil ich nicht mit sensiblen Kundendaten oder Zugangsdaten arbeite aber mir wäre es trotzdem lieber, wenn diese Unternehmen von vornherein keinen Zugriff auf meine Daten hätten.
Alternativen erkunden
Was können wir also tun?
US-Modelle, gehostet in Europa
Wenn man Anthropic-Modelle nutzen möchte, kann man sie über Amazon Bedrock beziehen. Wenn man OpenAI-Modelle nutzen möchte, ist der Zugriff auch über Azure OpenAI möglich. Beide Optionen sind aus Datenschutzsicht besser, weil die Daten nicht direkt an OpenAI oder Anthropic gesendet werden und es Möglichkeiten gibt, die Modelle innerhalb der EU zu hosten. Man ist allerdings weiterhin von großen US-Konzernen abhängig, sodass nach wie vor ein Risiko staatlicher Einflussnahme besteht. Die großen US-Modelle sind die bekanntesten was aber nicht heißt, dass es die einzigen Modelle sind, die wir nutzen können.
Lokale Modelle
Eine Option ist die Nutzung lokaler Modelle, die aus Datenschutzsicht optimal sind, weil die Daten unseren lokalen Rechner nie verlassen. Wer das Privileg hat, bereits teure Hardware mit viel RAM zu besitzen, kann die Modelle selbst betreiben ohne zusätzliche Kosten, abgesehen vom erhöhten Stromverbrauch, wenn der Rechner auf Hochtouren läuft.
Ich habe das Modell Qwen3.6–35b-a3b auf meinem 64-GB-MacBook Pro für Agentic Coding ausprobiert. Es ist ein interessantes Modell, weil es versucht, die Modell-Inferenz so zu optimieren, sodass ein relativ großes Modell (35b steht für 35 Milliarden Parameter) auf einer kleineren Architektur laufen kann (a3b bedeutet, dass zu jedem Zeitpunkt nur 3 Milliarden Parameter geladen sind).
Für die tägliche Coding-Arbeit funktionieren lokale Modelle bei mir nicht ganz, weil das Kontextfenster nach wie vor begrenzt ist und der Umfang der Aufgaben, die das Modell bewältigen kann, kleiner ist, als ich es gewohnt bin. Das liegt nicht zwingend an den lokalen Modellen selbst. Ich kenne Kolleg:innen, die mit lokalen Modellen recht erfolgreich programmiert haben und manche Leute haben lokale Modelle für Agentic Programming im Flugzeug oder im Zug genutzt, wo das Internet stark eingeschränkt ist.
Das Problem ist für mich, dass lokale Modelle (noch) kein drop-in Ersatz für ein größeres Claude oder Codex sind, sodass ihre Nutzung eine Umstellung meines täglichen Workflows erfordern würde.
Open-Weights-Modelle, gehostet in der EU
Eine weitere Option ist, sich nach anderen KI-Anbietern umzusehen, die das Hosting verschiedener Modelle in der EU anbieten. So erhalten wir Zugriff auf Modelle, die aus Datenschutzsicht günstiger sind und können einen Vendor-Lock-in vermeiden. Ich bin meinen INNOQ-Kolleg:innen sehr dankbar, die eine interne KI-Plattform für uns aufgesetzt haben, auf der wir viele verschiedene Modelle als Alternative zu OpenAI und Anthropic testen können. Wir müssen nur die Zugangsdaten für einen einzigen Anbieter in einem Agent Harness wie opencode konfigurieren. Das verschafft uns derzeit Zugriff auf 22 verschiedene Modelle (und es fühlt sich an, als kämen alle paar Wochen neue hinzu). Aktuell haben wir Zugriff auf Mistral-Modelle sowie auf Open-Weight-Modelle, die auf StackIT, Tensorix, Scaleway und Novita gehostet werden. Die meisten Modelle werden in der EU gehostet und wir haben außerdem einen Auftragsverarbeitungsvertrag, der es uns erlaubt, die Modelle als drop-in Ersatz für Claude oder GPT zu nutzen (wir setzen Modelle in Kundenprojekten nur dann ein, wenn wir einen Auftragsverarbeitungsvertrag und die ausdrückliche Zustimmung der Kund:innen zum KI-Einsatz im Projekt haben). Heute habe ich das Open-Weights-Modell GLM 5.2 von z.ai auf unserer internen Plattform ausprobiert und ich bin von den Ergebnissen sehr beeindruckt. Das Modell befolgt meine Anweisungen und erzeugt Code in einem Stil, der dem Rest der Codebasis ähnelt. Es hielt sich sogar an unsere Repository-Konvention, für Testnamen und -beschreibungen Deutsch zu verwenden, das etwas ist, worüber ich mit Claude und Codex ständig diskutieren muss. Es ist das erste Mal, dass ich ein Modell ausprobiert und fast sofort die Überzeugung hatte, dass es ein drop-in Ersatz für meine tägliche Arbeit sein könnte.
Da Modelle wie die GLM- und Qwen-Modelle von chinesischen Unternehmen entwickelt werden, gibt es nach wie vor gewisse Bedenken hinsichtlich der digitalen Souveränität, weil die chinesische Regierung eingreifen und uns den Zugang zu neueren Modellen der chinesischen KI-Unternehmen verwehren könnte. Doch diese Modelle sind Open Weights, das heißt, die Modellparameter sind öffentlich verfügbar, auch wenn man nicht alle Daten kennt, mit denen das Modell trainiert wurde. Das gibt uns aus Sicht der digitalen Souveränität mehr Sicherheit, denn wenn wir ein Open-Weight-Modell finden, das für uns funktioniert und in der EU gehostet wird, kann ein staatlicher Akteur unseren Zugang zu diesem Modell für die tägliche Arbeit nicht mehr unterbinden.
Die nächsten Schritte
Wir sollten einen Schritt zurücktreten und prüfen, welche Schritte wir unternehmen können, um ein wenig Unabhängigkeit von den US-Konzerngiganten zu gewinnen. Statt ausschließlich proprietäre Agent Harnesses wie Claude Code oder Codex zu nutzen, können wir opencode oder Pi verwenden. Statt nur Firmenkonten bei den US-Anbietern zu haben, können wir uns nach verschiedenen unabhängigen KI-Anbietern wie Tensorix umsehen, die uns Zugang zu Open-Weight-Modellen verschaffen können, welche in der EU gehostet werden und eine Zero-Retention-Richtlinie haben. Vielleicht ist man - so wie ich - überrascht, dass andere Modelle, von denen man noch nie gehört hat, tatsächlich die Rolle derjenigen übernehmen können, über die alle reden. Änderungen an unserem täglichen Workflow sind ein wenig beängstigend und nicht ohne Reibung. Doch wenn wir uns mit Tooling und Modellen von US-Anbietern zu sehr einrichten, könnte der Vendor-Lock-in zu dem Zeitpunkt, an dem wir uns wirklich daraus lösen müssen, kaum noch zu durchbrechen sein. Wenn wir bereits Modelle von Anthropic, OpenAI oder Google nutzen, müssen wir nicht alles über Bord werfen und bei null anfangen. Aber wir sollten die Augen offen halten und neugierig bleiben. Die Welt der KI verändert sich ständig und wir finden vielleicht viele weniger populäre Werkzeuge, die uns zugleich ein besseres Kosten-Nutzen-Verhältnis und mehr digitale Souveränität bieten.