KI-Agenten – Grundlagen, Tools und Use-Cases

14.2.2025 | 9 Minuten Lesezeit

Hype oder Zukunftstechnologie? Das ist eine Frage, die sich aktuell sehr viele in Bezug auf KI-Agenten stellen. Unsere Antwort darauf ist: KI-Agenten sind mehr als nur Hype. Sie geben uns in ihrem aktuellen Zustand einen Ausblick auf die Arbeitsweise der Zukunft.

Dieser Grundlagen-Artikel richtet sich an alle, die gerne mehr darüber erfahren möchten, was intelligente Agentensysteme sind und wie sie funktionieren. Wir beleuchten ihre technische Architektur, wichtige Frameworks und Use-Cases in verschiedenen Branchen. Zudem geben wir einige Tools an die Hand, mit denen jeder ein eigenes Agentensystem erstellen kann. In den kommenden Wochen werden wir außerdem weitere Artikel zu dem Thema veröffentlichen, in denen wir anhand konkreter Beispiele und Tools zeigen, wie ein eigenes kleines Agentensystem gebaut werden kann.

Ein Agentensystem auf dem Smartphone (Apple Intelligence). Foto von appshunter.io

⁠Was sind KI-Agentensysteme?

KI-Agenten sind autonome Softwareprogramme, die Aufgaben für Nutzer oder andere Systeme erledigen. Sie sammeln und verarbeiten Daten über verschiedene Eingaben, treffen Entscheidungen und führen Aktionen aus, um spezifische Ziele ohne menschliches Eingreifen zu erreichen. Klingt das bekannt? Das liegt daran, dass uns solche Agentensysteme bereits seit Jahrzehnten begleiten. Von simplen Entscheidungsalgorithmen, über klassische, regelbasierte Chatbots bis hin zu altbekannten NPCs in Videospielen: Das alles bezeichnen wir seit langem bereits als KI-Agenten. Doch die rasante Entwicklung von generativer KI in den letzten Jahren hat auch den Begriff der Agenten grundlegend verändert. Wenn wir heute über KI-Agenten sprechen, dann meinen wir meistens Systeme, die komplexe Aufgaben autonom lösen können und deutlich mehr können als die Agenten der Vergangenheit. Die zentrale Rolle eines KI-Agenten spielt dabei die Entscheidungslogik. Sie ist das Herzstück des Systems und bestimmt, welche Entscheidungen der Agent trifft. Setzen wir hierfür große Sprachmodelle (Large Language Models, kurz LLMs) ein, so erhalten wir die modernen KI-Agenten von heute die wir uns jetzt genauer anschauen.

Wie sind KI-Agenten aufgebaut?

Der Aufbau eines KI-Agenten lässt sich am besten mit dem menschlichen Entscheidungsprozess vergleichen. Stellen Sie sich vor, wie wir Menschen Informationen aufnehmen, verarbeiten und darauf reagieren. Genauso funktioniert auch ein KI-Agent, nur dass er digital arbeitet.

Die grundlegende Architektur eines KI-Agenten besteht in der Regel aus mehreren Kernkomponenten:

Wahrnehmung: Dies ist gewissermaßen das "Sinnesorgan" des Agenten. Hier werden alle Eingangsdaten aufgenommen - das können Texte, Bilder, Sensordaten oder andere Informationen sein. Denken Sie an die Kamera eines selbstfahrenden Autos, das Mikrofon eines Sprachassistenten, oder ganz einfach das Interface des Chatbots. Auch der Output eines anderen Agenten kann an so einer Stelle genutzt und aufgenommen werden.

Verarbeitung / Entscheidungen: Dies ist das "Gehirn" des Agenten. Im Zentrum der modernen KI-Agenten steht hier das LLM, das als eine Art Entscheider agiert. Es kann komplexe Zusammenhänge verstehen, logische Schlüsse ziehen und kreative Lösungen entwickeln. Zusätzlich verfügen moderne Agenten über ein "Arbeitsgedächtnis", das wichtige Informationen aus früheren Interaktionen speichert und in aktuelle Entscheidungen einbezieht. Basierend auf der Analyse der Daten, der Aufgabenstellung und dem vorhandenen Wissen im Kontext trifft der Agent hier Entscheidungen darüber, ob und welche Aktionen ausgeführt werden sollen. Der Agent kann verschiedene Handlungsoptionen durchspielen, indem er sie in natürlicher Sprache "durchdenkt". Dies ermöglicht es ihm, komplexe Strategien zu entwickeln und die Konsequenzen seiner Handlungen vorherzusehen. Moderne Agenten können sogar mehrschrittige Pläne erstellen und diese dynamisch anpassen.

Aktionen: LLM-basierten Agenten können nicht nur kommunizieren, sondern auch aktiv Werkzeuge nutzen - zum Beispiel Internetsuchen durchführen, Dokumente erstellen, Kundenakten und Verträge einsehen, APIs nutzen, oder Code schreiben und ausführen. Das LLM entscheidet dabei, welche Werkzeuge zum Lösen der Aufgabe genutzt werden sollen und interpretiert die Ergebnisse ihres Einsatzes.

Gedächtnis: Viele moderne KI-Agenten können aus ihren Aktionen lernen und ihr Verhalten entsprechend anpassen. Sie sammeln Informationen darüber, wie erfolgreich ihre Aktionen waren, und nutzen diese, um ihre zukünftigen Entscheidungen zu verbessern.

Architektur eines sehr einfachen KI-Agentensystem mit angebundenen Tools und Speicherfunktion für Informationen über den Nutzer

Ein Beispiel für die Anwendung von KI-Agenten ist die Nutzung in Webbrowsern. Hier können sie autonom Informationen suchen, Daten extrahieren oder sogar Transaktionen durchführen, um dem Nutzer bestimmte Aufgaben abzunehmen.

Reasoning-Frameworks

Es gibt verschiedene Arbeitsweisen, die beschreiben, wie ein Agent seine Ziele erreicht. Dabei bieten sie jeweils verschiedene Vor- und Nachteile. Nachfolgend werden zwei der bekanntesten Frameworks erklärt.

ReAct (Reasoning and Acting)

Das bekannteste Framework, bei dem der Agent nach jeder Aktion und jeder erhaltenen Information reflektiert und plant, um zu entscheiden, welche Handlung als nächstes durchgeführt werden soll. Der Agent iteriert dabei durch drei Phasen, bis entweder das Ziel oder eine Abbruchbedingung (z.B. unlösbar) erreicht ist:

Thought (Denken): Der Agent überlegt, was er als nächstes tun sollte
Action (Handlung): Er führt eine konkrete Aktion aus, zum Beispiel eine Internetsuche
Observation (Beobachtung): Er wertet das Ergebnis seiner Aktion aus

Dieses iterative Vorgehen ermöglicht es dem Agenten, Probleme Schritt für Schritt zu lösen und seine Antworten kontinuierlich zu verbessern. Dies ist vor allem bei komplexeren Aufgaben sinnvoll, wo die Zwischenergebnisse nicht immer vorhersehbar, aber oft entscheidend für den weiteren Verlauf der Aufgabenlösung sind.

Plan-and-Solve

Bei Planungsbasierten Frameworks erstellt der Agent zuerst einen detaillierten Plan, bevor er handelt. Dabei zerlegt das Hauptproblem in Teilprobleme, plant die Reihenfolge der Lösungsschritte, führt den Plan Schritt für Schritt aus, und beobachtet dann (oder zwischendurch) das Ergebnis. Durch das detaillierte Planen können diese Agenten potenzielle Herausforderungen eher vorhersehen und Ressourcen effizienter zuweisen.

Ein weiteres konkretes Beispiel für ein Planungsbasiertes Framework ist ReWOO (Reasoning Without Observation). Bei dem Framework antizipiert der Agent die notwendigen Schritte zur Zielerreichung und führt sie aus, ohne während des Prozesses zusätzliche Beobachtungen zu machen. Dadurch ist die Ausführung sehr schnell, ist aber aufgrund der fehlenden Auswertung als Zwischenschritte eher für den Einsatz bei leicht verständlichen und konkreten Aufgaben geeignet.

Die Wahl des geeigneten Frameworks hängt also immer von der spezifischen Anwendung und den Anforderungen des jeweiligen Systems ab.

Multiagentensysteme

Mit der steigenden Komplexität der Aufgaben, die so ein Agentensystem bewältigen soll, kommt oft auch die Notwendigkeit, solche Systeme performanter und effizienter zu gestalten. Da kommen Multiagentensysteme ins Spiel. Sie arbeiten mehrere Agenten zusammen, um komplexe Aufgaben zu bewältigen. Sie können miteinander kommunizieren und ihre Aktionen koordinieren. Der Vorteil der Nutzung solcher Multiagentensysteme besteht darin, dass verschiedene Modelle, Parameter und System Prompts je nach Aufgabe des Agenten eingesetzt werden können. Während einfache Anfragen beispielsweise effizient von kleineren LLMs bearbeitet werden, können rechenintensive Aufgaben, wie die detaillierte Analyse wissenschaftlicher Arbeiten oder komplexe logische Schlussfolgerungen, an leistungsstärkere Reasoning-Modelle oder andere spezialisierte KI-Agenten delegiert werden. Dies sorgt für eine effiziente Ressourcennutzung und eine optimierte Aufgabenverteilung. Zusätzlich können sich Agenten in einem solchen System gegenseitig mit Wissen versorgen. Beispielsweise kann ein spezialisierter Agent, der Daten extrahiert, seine Ergebnisse an einen anderen Agenten weitergeben, der darauf basierend weiterführende Berechnungen oder Schlussfolgerungen zieht. Ein gut gestaltetes Multiagentensystem ermöglicht eine adaptive und skalierbare Lösung für viele KI-Anwendungen.

Architekturdiagramm eines Komplexeren KI-Agentensystems mit einem Koordinator-Agent für die Interaktion mit dem Nutzer und der Planung der Schritte, und mehreren spezialisierten Subagenten zum ausführen von dedizierten Aufgaben. Der Übersichtshalber sind die Antworten der Subagenten an den Koordinator-Agenten nicht auf dem Diagram verzeichnet.

Beispielhafte Anfrage eines Nutzern

User-Input
Erstelle mir einen Blogartikel über mein Produkt. Poste ihn bitte auf LinkedIn. Anschließend möchte ich, dass eine Slack-Nachricht an meine Mitarbeitenden gesendet wird, die darüber informiert, dass ein neuer Blogartikel erstellt wurde.

Wir nutzen an dieser Stelle Plan-and-Solve, da hier ein Koordinator-Agent die Planung aller notwendigen Schritte am Anfang durchführt. Folgende Schritte würden nun basierend auf der Architektur aus dem vorangegangenen Diagram passieren:

1. Analyse der Anfrage durch den Koordinator-Agenten und Aufbau einer Aufgabenplanung für die Sub-Agents

2. Sucht nach dem Namen und Informationen zu dem Produkt des Nutzers im Speicher, und gibt diese an den Koordinator-Agenten zurück.

3. Koordinator-Agent gibt dem RAG-Agenten die Aufgabe, relevanten Informationen zu dem Produkt aus der Vektordatenbank zu holen. Der spezialisierte RAG-Agent weiß anhand der ihm vorliegenden Beschreibungen aller angeschlossenen Vektordatenbanken, in welcher die relevanten Informationen zu finden sein könnten, und durchsucht diese. Anschließend trägt er die Ergebnisse in Bezug auf die Anfrage zusammen und liefert die Zusammenfassung dem Koordinator-Agenten.

4. Der Koordinator-Agent verfasst auf Basis der Informationen nun einen Blog-Artikel. An dieser Stelle könnte beispielsweise auch ein dedizierter Writer-Agent genutzt werden. Der Einfachheitshalber ist dieser nicht im Beispiel enthalten.

5. Der fertige Blogartikel wird dann an den Social-Media-Agent übergeben der diesen als LinkedIn Beitrag postet, und bei Slack die Mitarbeitenden über die Veröffentlichung benachrichtigt. Anschließend sagt der Social-Media-Agent dem Koordinator-Agent bescheid, dass die Aufgabe erfolgreich erledigt wurde.

6. Der Koordinator-Agent liefert dem Nutzer nun eine Antwort, in der der Nutzer über den Erfolg der Aufgabe informiert wird.

Use-Cases für Agentensysteme

Nun, wo wir einige technische Details und Beispiele für Agentensysteme gesehen haben, stellt sich die Frage, für was diese alles eingesetzt werden können. Dabei gibt es bei ihren Einsatzmöglichkeiten viele Möglichkeiten. Hier sind einige Beispiele, wie diese den Arbeitsalltag erleichtern oder sogar gänzlich verändern können.

Kundenservice und Support
Durch den Einsatz von intelligenten Chatbots oder virtuellen Assistenten, die weit mehr leisten als Standardantworten, können Agentensysteme den Kundenservice transformieren. Diese Systeme interagieren in natürlicher Sprache, erkennen Kundenbedürfnisse proaktiv, lösen einfachere Anliegen und leiten, wo es notwendig ist, direkt an die richtigen menschlichen Ansprechpartner weiter.

Personalmanagement und HR
Im Bereich Human Resources können KI-Agenten den gesamten Rekrutierungs- und Onboarding-Prozess unterstützen. Sie analysieren Bewerbungsunterlagen, identifizieren passende Kandidaten anhand vordefinierter Kriterien und beantworten Mitarbeiteranfragen autonom. Dadurch wird nicht nur die Effizienz gesteigert, sondern auch ein personalisierter und schneller Service gewährleistet.

Finanzwesen und Risikomanagement
Agentic AI kann kontinuierlich Finanzdaten überwachen und analysieren, um Markttrends sowie potenzielle Risiken frühzeitig zu erkennen. Autonome Systeme treffen eigenständig Entscheidungsvorschläge, etwa zur Portfolioanpassung oder zur Betrugserkennung, und ermöglichen so eine dynamische und datengetriebene Steuerung finanzieller Prozesse.

Bildung und E-Learning
Im Bildungssektor ermöglichen Agentensysteme die Erstellung individueller Lernpfade, indem sie den Fortschritt der Lernenden analysieren und Inhalte passgenau an deren Bedürfnisse anpassen. Dies führt zu einem personalisierten Lernprozess, der auf den jeweiligen Kenntnisstand und Lernfortschritt eingeht.

Es gibt noch viel mehr Use-Cases, die allesamt zeigen, dass die Fähigkeiten solcher KI-Agenten, selbstständig und flexibel zu agieren, den Unternehmen sowie jedem Einzelnen von uns ganz neue Möglichkeiten bieten.

Dein eigenes Agentensystem

Es gibt viele Möglichkeiten KI-Agenten zu erstellen und zu nutzen. Je nach Anforderungen und Komplexität kann von No-Code-SaaS-Lösungen bis hin zu komplett selbst programmierten Agentensystemen alles gewählt werden. Hierfür stehen bereits massig Services, Tools und Frameworks zur Verfügung. Hier sind ein paar Beispiele:

Einfach & Schnell

n8n - No‑Code-Workflow-Automatisierungstool, das über eine intuitive Drag‑&‑Drop-Oberfläche die Verknüpfung diverser Dienste ermöglicht und schnelle Automatisierungen realisiert. Freie Nutzung privat (Fair‑Code‑Lizenz mit Einschränkungen bei großem kommerziellem Einsatz).

CrewAI - Cloudbasierte SaaS-Lösung, mit der sich KI-Agenten schnell und ohne tiefgehende technische Kenntnisse erstellen lassen – ideal für einen schnellen Einstieg. SaaS (abonnementbasierter Cloud-Service).

Langflow - Visuelle Open‑Source-Plattform, die den Aufbau und das Testen von LLM‑Anwendungen per Drag‑&‑Drop ermöglicht und sich sehr gut für schnelles Prototyping eignet. Open Source (frei nutzbar für private und kommerzielle Projekte).

smolagents - Minimalistisches Python Framework zur schnellen Implementierung kleiner KI-Agenten, das durch minimalen Overhead und schnelle Resultate überzeugt. Open Source (frei nutzbar für private und kommerzielle Projekte).

Komplex & Flexibel

LangGraph - LangGraph ist eine Python-Bibliothek innerhalb des LangChain-Ökosystems und ermöglicht die Erstellung tiefgreifender Agentensysteme für anspruchsvolle Anwendungsfälle. Open Source (frei nutzbar für private und kommerzielle Projekte).

PydanticAI - Kombiniert die Stärken von Pydantic mit LLM-Funktionalitäten, um robuste und typsichere KI-Lösungen zu erstellen. Open‑Source (frei nutzbar für private und kommerzielle Projekte).

AutoGen - AutoGen ist ein fortschrittliches Framework zur Orchestrierung von Multi-Agenten-Systemen, das ebenfalls komplexe Interaktionen und Automatisierung in anspruchsvollen Szenarien ermöglicht. Open Source (frei nutzbar für private und kommerzielle Projekte).

Schlusswort

Wir sind der Ansicht, dass Agentensysteme weit mehr als nur ein vorübergehender Hype sind – sie repräsentieren einen bedeutenden Schritt in Richtung Zukunft. Die aktuellen Entwicklungen zeigen, dass Agentensysteme zunehmend komplexe Prozesse autonom bewältigen können, was uns ganz neue Möglichkeiten eröffnet. Insgesamt glauben wir, dass Agentensysteme einen fundamentalen Wandel sowohl im Privatleben als auch in der Arbeitswelt bewirken werden.

War dieser Beitrag hilfreich?

Beitrag teilen

Blog-Autor*in

Daniel Ladischenski

AI Consultant & Engineer

Du hast noch Fragen zu diesem Thema? Dann sprich mich einfach an.

Weitere Beiträge

von Daniel Ladischenski

Open Source trifft Milliardenmarkt: DeepSeek-R1 mischt die KI-Welt auf

Am 27. Januar 2025 erlebte die Technologiebörse einen unerwarteten Einbruch: Der NVIDIA-Aktienkurs fiel um über 17%, wodurch der Konzern zeitweilig fast 600 Milliarden US-Dollar an Börsenwert verlor und damit einen neuen historischen Rekord am Aktienmarkt...

Künstliche Intelligenz
Generative KI
LLM

29.1.2025 | 8 Minuten Lesezeit

Daniel Ladischenski

Dein Job bei codecentric?

Jobs

Agile Developer und Consultant (w/d/m)

Alle Standorte

Jetzt für unseren Newsletter anmelden

Alles Wissenswerte auf einen Klick:
Unser Newsletter bietet dir die Möglichkeit, dich ohne großen Aufwand über die aktuellen Themen bei codecentric zu informieren.