Stand: 15. Mai 2026
Dies ist der zweite Beitrag unserer Serie “Aus dem Maschinenraum”. Im ersten Teil ging es darum, wie unsichtbare Kosten entstehen, wenn KI-Sitzungen immer wieder von vorne beginnen. Heute sprechen wir über einen anderen Hebel, der oft übersehen wird: die Wahl des richtigen Modells für die richtige Aufgabe.
Nicht jede Aufgabe braucht das teuerste Modell
Als wir unsere eigene KI-Infrastruktur aufbauten, machten wir zunächst denselben Fehler wie viele andere. Wir stellten alles auf das stärkste verfügbare Modell. Die Logik dahinter klang vernünftig: wer Premium nimmt, kann nichts falsch machen.
Falsch gedacht. Nach einigen Wochen sahen wir, dass etwa 70 Prozent unserer Aufgaben routiniert genug waren, dass ein günstigeres Modell sie genauso gut erledigt hätte. Weitere 25 Prozent profitierten zwar von einem mittleren Modell, brauchten aber nicht das absolute Topmodell. Nur 5 Prozent rechtfertigten den Premium-Aufschlag.
Express-Kurier oder Standardpost
Angenommen, Sie verschicken alle Geschäftsbriefe per Express-Kurier mit persönlicher Übergabe. Jede Rechnung, jeder interne Vermerk, jede Werbung an Bestandskunden. Das wäre nicht falsch im Ergebnis. Die Post kommt sicher an. Aber die Kosten stünden in keinem Verhältnis zum Wert vieler dieser Sendungen.
In der Praxis machen Sie das natürlich nicht. Sie haben für sich ein einfaches Sortierprinzip etabliert. Standardpost für die meisten Briefe. Einschreiben für rechtsrelevante Dinge. Express nur dann, wenn die Geschwindigkeit wirklich zählt. Die Mischung entscheidet, nicht die Spitzenklasse.
Bei KI ist es genau gleich. Es gibt schnelle, günstige Modelle für klare und wiederkehrende Aufgaben. Es gibt starke Standardmodelle für den täglichen produktiven Einsatz. Und es gibt Premium-Modelle für komplexe Analyse, anspruchsvolle Programmierung und mehrstufige Aufgaben. Wer die drei Klassen sauber trennt und Aufgaben passend zuordnet, zahlt in der Regel zwischen 40 und 70 Prozent weniger bei gleicher oder besserer Ergebnisqualität.
Drei Muster, an denen Sie es erkennen
Erstens, die Premium-Pauschale. Eine Organisation hat sich für ein Topmodell entschieden, bei allen Anfragen läuft alles über diesen einen Motor. Klassifikation, Zusammenfassung, einfache Korrektur, alles bekommt die volle Premiumstufe. Das fällt erst auf, wenn die Rechnung kommt.
Zweitens, das Bauchgefühl als Routing-Regel. Mitarbeiter wählen das Modell intuitiv. Manche nehmen immer das günstige, andere immer das teure. Das Ergebnis schwankt, die Kosten sind unvorhersehbar, und niemand kann erklären, warum.
Drittens, der versteckte Premiumkonsum. Anwendungen, die hinter Workflow-Tools laufen, nutzen oft per Voreinstellung das stärkste Modell. Das ist bequem für den Hersteller, aber teuer für Sie. Diese Aufrufe sind in keinem Dashboard sichtbar.
Drei Fragen für Ihren nächsten Termin
Frage eins: Welche Modellklassen sind in unseren KI-Anwendungen aktuell im Einsatz, und nach welcher Regel wird ausgewählt?
Frage zwei: Können wir eine Klassifikation der häufigsten Aufgaben sehen, mit empfohlenem Modell pro Aufgabentyp?
Frage drei: Wer entscheidet bei neuen Anwendungen über das Standard-Modell, und wird diese Entscheidung dokumentiert?
Wenn die Antworten klar sind, läuft Ihre KI-Strategie professionell. Wenn sie es nicht sind, haben Sie einen weiteren Hebel gefunden, der oft zwei- bis dreistellige Prozentsätze an Kosten freisetzt.
Was wir daraus mitnehmen
Eine gute Modellauswahl ist keine technische Detailfrage. Sie ist eine betriebswirtschaftliche Disziplin, ähnlich wie Sie es bei Einkaufsklassen oder Reisekostenrichtlinien längst kennen. Die Frage ist nicht “welches Modell ist das beste”, sondern “welches Modell ist für welche Aufgabe richtig dimensioniert”. Wir bei KI-Berater Hamburg erarbeiten diese Zuordnung gemeinsam mit unseren Mandanten in Hamburg und der Metropolregion als Teil jeder KI-Strategie. Den Einstieg bildet eine KI-Potenzialanalyse, in der wir Ihre häufigsten Aufgaben klassifizieren und passenden Modellklassen zuordnen.
Wenn Sie wissen wollen, wie unsichtbare Kosten in KI-Sitzungen entstehen, finden Sie das im ersten Teil dieser Serie. Im nächsten Beitrag schauen wir uns ein noch tiefer liegendes Prinzip an: warum es sich lohnt, Planung und Ausführung in KI-Workflows zu trennen.
Diese Serie behandelt in fünf Teilen praktische Hebel zur Kostenkontrolle bei KI-Einsatz im Mittelstand.
- Teil 1: Unsichtbare Kosten und Cache-Hygiene
- Teil 2: Modell-Routing (dieser Beitrag)
- Teil 3: Planer und Ausführer
- Teil 4: Asynchrone Verarbeitung
- Teil 5: Wartungsdisziplin