Zwei Gründer, ein Ordner, eine Diskussion
Letzte Woche bauten Keith und ich gemeinsam an unserem internen Marktplatz, einem Verzeichnis, aus dem sich alle unsere KI-Werkzeuge bedienen. Auf der obersten Ebene gibt es einen Ordner für Skills und einen für Agents. Und dann passierte das, was vermutlich gerade in vielen Teams passiert: Wir hielten mitten in der Arbeit an und merkten, dass wir nicht sauber sagen konnten, was eigentlich in welchen Ordner gehört.
Keith fragte: Was ist der Unterschied zwischen einem Agent und einem Skill? Ich antwortete mit meiner Definition. Er antwortete mit seiner. Sie passten nicht zusammen. Wir bauen diese Systeme jeden Tag, und trotzdem brauchten wir zwanzig Minuten, um uns auf eine gemeinsame Sprache zu einigen.
Wenn die Leute, die das Zeug bauen, sich uneinig sind, dann ist die Verwirrung, die Sie vielleicht spüren, kein Wissensdefizit. Sie ist berechtigt. Dieser Artikel öffnet die Black Box: Was Skill, Agent und Automation wirklich bedeuten, warum die Grenze zwischen ihnen unscharf ist, und welche Frage am Ende tatsächlich zählt. Verständlich erklärt, auch wenn Sie keine Zeile Code schreiben.
Warum die Begriffe so verwirren
Die Worte sind neu, überladen und werden von jedem Anbieter anders benutzt. "Agent" steht mal für einen Chatbot, mal für ein autonomes System, mal für ein Marketing-Versprechen. "Skill" bedeutet bei dem einen Tool etwas anderes als beim nächsten. Es gibt keine zentrale Instanz, die festlegt, wer recht hat.
Hinzu kommt: Die Begriffe beschreiben keine Dinge mit klaren Kanten, sondern Punkte auf einem Übergang. Das macht jede starre Schubladen-Definition angreifbar. Fangen wir trotzdem mit der sauberen Version an, bevor wir zeigen, wo sie bricht.
Die drei Begriffe, saubere Version
Drei Bausteine, drei einfache Kernfragen: Wer entscheidet? Verändert sich das System über die Zeit? Braucht es ein Sprachmodell?
Automation. Feste Schritte, kein eigenes Urteil. Gleicher Input, gleicher Weg, jedes Mal. Eine klassische Automation ist die Regel "Wenn eine Rechnung eingeht, lege sie in Ordner X". Sie entscheidet nichts, sie führt aus. Das gibt es seit Jahrzehnten, ganz ohne KI.
Skill. Eine definierte Prozedur, also das Wie. Ein wiederverwendbares Set an Anweisungen für eine bestimmte Aufgabe. Anthropic, das Unternehmen hinter Claude, beschreibt Agent Skills als organisierte Ordner aus Anweisungen, Skripten und Ressourcen, die ein Agent bei Bedarf lädt. Ein Skill liegt bereit und wird abgerufen, wenn eine Aufgabe ihn braucht. Er beschreibt einen Ablauf, er führt ihn nicht von allein aus. Das Format ist inzwischen ein offener Standard, den auch andere Anbieter übernehmen.
Agent. Die Kombination aus Anweisungen, einem Sprachmodell und Zugriff auf Werkzeuge, die selbst entscheiden kann, also das Wer. Der Agent liest die Lage, wählt das nächste Werkzeug, prüft das Ergebnis und entscheidet den nächsten Schritt. Dieses denken-handeln-beobachten-Muster geht auf das ReAct-Prinzip zurück. Anthropic definiert in Building Effective Agents Agenten als Systeme, in denen das Sprachmodell seinen eigenen Prozess und seinen Werkzeugeinsatz dynamisch selbst steuert.
Mein eigener Merksatz aus der Diskussion mit Keith: Der Agent führt den Skill aus, aber der Skill definiert den Agenten. In dem Moment, in dem ein Agent den Recherche-Skill liest, wird er zum Recherche-Agenten.
| App | Wer entscheidet? | Verändert sich über Zeit? | Braucht ein Sprachmodell? |
|---|---|---|---|
| Automation | — | — | — |
| Skill | Eingeschränkt | Eingeschränkt | Eingeschränkt |
| Agent | Ja | Ja | Ja |
Wo die sauberen Definitionen brechen
So weit die Theorie. In der echten Diskussion fiel sie sofort auseinander, und zwar an drei Stellen:
- Veränderung: Lernt das System dazu, oder bleibt es starr?
- Selbstheilung: Kann es auf einen Fehler reagieren und den Weg anpassen?
- Antrieb: Steckt am Ende immer ein Sprachmodell dahinter?
"Am Ende ist jeder Skill ein Agent, weil ein Sprachmodell ihn ausführen muss. Ich habe es nur anders verpackt." — Keith Govender, Co-Founder IJONIS
Keiths Test: starre Schritte gegen wachsende Persona. Keith zog die Grenze an der Veränderung. Ein Skill wie unsere Ticket-Erstellung folgt zehn festen Schritten, jedes Mal gleich, er lernt nichts dazu. Ein Agent dagegen ist für ihn eine Persona, die sich über die Zeit entwickelt. Unser Recherche-Agent und unser Content-Agent wurden bewusst so gebaut, dass sie durch Feedback und neue Anweisungen wachsen. Starre Prozedur gleich Skill, wachsende Persona gleich Agent.
Mein Konter: auch Skills heilen sich selbst. Ich hielt dagegen: Wenn der Ticket-Skill auf einen Fehler stößt, kann das ausführende Modell den Ablauf anpassen und sich selbst korrigieren. Damit verändert sich auch ein "starrer" Skill im Lauf. Und noch grundsätzlicher: Jeder Skill wird von einem Sprachmodell ausgeführt. In dem Sinne steckt in jedem Skill ein Agent. Die Grenze, die Keith zieht, ist also weicher, als sie zuerst klingt.
Der Automations-Haken. Dann drehte sich die Diskussion noch einmal. Wenn ein Skill jedes Mal dieselben zehn Schritte abarbeitet, ist das im Kern eine Automation, nur eben eine vom Sprachmodell angetriebene. Damit fließt die dritte Kategorie in die anderen beiden hinein. Automation, Skill und Agent sind keine getrennten Kisten. Sie lecken ineinander.
Ein Rahmen, der hält: das Spektrum
Die Auflösung kam nicht durch bessere Schubladen, sondern durch den Verzicht auf Schubladen. Die drei Begriffe sind keine getrennten Kategorien, sondern Punkte auf einem Übergang. Eine einzige Achse macht den Unterschied: Wie viel entscheidet das System selbst?
Am einen Ende steht die feste Automation. Null Entscheidung, fester Weg. In der Mitte liegt der Skill, eine Prozedur mit etwas Spielraum, die ein Modell ausführt und bei Bedarf anpasst. Am anderen Ende steht der autonome Agent, der seinen Weg selbst wählt. Genau diese Unterscheidung trifft auch Anthropic in Building Effective Agents: Workflows laufen über vordefinierte Code-Pfade, Agenten steuern ihren Prozess dynamisch selbst. Auch OpenAI beschreibt Agenten als Systeme, die Aufgaben eigenständig für den Nutzer erledigen. Es ist kein Entweder-oder, sondern ein Regler.
Warum das in der Praxis zählt
Für ein Unternehmen ist das keine Wortklauberei, sondern eine Architektur-Entscheidung. Sie kaufen nicht "einen KI-Agenten". Sie entscheiden pro Aufgabe, wie viel Autonomie sinnvoll ist, und passen das Werkzeug an die Entscheidungslast an.
Eine Aufgabe mit klaren, immer gleichen Schritten braucht keine Autonomie. Geben Sie ihr zu viel, wird das Ergebnis unvorhersehbar und teuer zu kontrollieren. Eine Aufgabe, die bei jedem Durchlauf abwägen und auf Unerwartetes reagieren muss, erstickt dagegen in einer starren Automation. Sie braucht einen Agenten. Die Kunst liegt darin, den Regler für jede Aufgabe richtig zu setzen. Zu wenig Autonomie macht das System spröde, zu viel macht es unberechenbar.
Und hier kommt ein vierter Begriff ins Spiel, der die Abwägung erst greifbar macht: der Harness. Ein Skill hebt die Decke dessen an, was ein Agent kann, denn er liefert das Fachwissen. Der Harness hebt den Boden dessen an, was er verlässlich tut: die Schicht aus Verifier, Stoppbedingungen und Übergaben, die einen Agenten über viele Runden auf Kurs hält. Für eine einmalige Aufgabe zählt die Decke, für den Produktivbetrieb der Boden. Anthropic zeigt diese Bausteine als lauffähige Referenz im cwc-long-running-agents-Harness. Mehr Autonomie heißt mehr Spielraum zum Abdriften, und genau deshalb wächst mit der Autonomie die Bedeutung des Harness.
Genau diese Abwägung treffen wir bei IJONIS aus Hamburg für unsere Kundinnen und Kunden: nicht "Agent oder nicht", sondern wie viel Entscheidung welcher Schritt verträgt. Das ist die Architektur hinter einem System, das im Alltag verlässlich läuft statt nur in der Demo. Wie dieselbe Logik in echten Abläufen aussieht, zeigen wir an konkreten Beispielen in Agentic Workflows. Und warum die eigentliche Steuerungsebene über den Agenten liegt, vertiefen wir in Loop Engineering.
Häufige Fragen zu Skill, Agent und Automation
Was ist der Unterschied zwischen einem Skill und einem Agent?
Ein Skill ist eine definierte Prozedur, also ein wiederverwendbares Set an Anweisungen für eine Aufgabe. Ein Agent ist die Kombination aus Anweisungen, einem Sprachmodell und Werkzeugen, die selbst entscheiden kann. Der Agent führt den Skill aus, der Skill beschreibt nur den Ablauf.
Ist eine Automation dasselbe wie ein KI-Agent?
Nein. Eine klassische Automation folgt festen Schritten ohne eigenes Urteil und braucht kein Sprachmodell. Ein Agent trifft pro Schritt eine eigene Entscheidung. Dazwischen liegt der Skill: eine Prozedur, die ein Modell ausführt und bei Bedarf anpasst.
Welche Frage sollte ich mir stattdessen stellen?
Statt "Skill oder Agent?" lautet die nützliche Frage: Wie viel soll das System selbst entscheiden? Die Antwort liegt auf einem Spektrum von fest über prozedural bis autonom und bestimmt das Verhalten zuverlässiger als jedes Etikett. Wer die Autonomie pro Aufgabe bewusst wählt, baut Systeme, die im Alltag verlässlich laufen statt nur in der Demo zu funktionieren.
Nicht das Etikett zählt, sondern die Autonomie
Keith und ich haben uns am Ende nicht auf eine perfekte Definition geeinigt, und das ist in Ordnung. Die Begriffe Skill, Agent und Automation beschreiben keine harten Grenzen, sondern Stationen auf einem Weg von fest zu frei. Wer ein KI-System plant, gewinnt wenig durch das richtige Etikett und viel durch die richtige Frage: Wie viel soll die Maschine selbst entscheiden? Beantworten Sie die, und die Schublade ergibt sich von allein.

