4. Unterrichtsblock

Kursinhalte

Begriffserklärung KI-Assistent
Unterschied KI-Assistent & KI-Agenten
Arten von KI-Agenten
Komponenten eines KI-Agenten
Erstelle einen KI-Agenten mit MS AutoGen

Einführung in KI-Agenten

Was ist ein KI-Assistent?

Ein KI-Assistent ist ein digitales System, das mithilfe von Künstlicher Intelligenz Aufgaben für Menschen übernimmt. Er kann Informationen verarbeiten, Entscheidungen vorbereiten und sogar selbstständig handeln – je nach Komplexität.

Typische Beispiele:

Sprachassistenten wie Siri, Alexa oder Google Assistant
Chatbots in Kundenservices
Schreib- und Recherchehilfen wie ChatGPT
Agenten, die Termine koordinieren, E-Mails beantworten oder Webseiten analysieren

Wie unterscheiden sich KI-Assistenten und KI-Agenten?

Ein KI-Assistent hilft dir bei klar definierten Aufgaben – z. B. eine E-Mail zusammenfassen, einen Termin setzen oder eine Frage beantworten. Er wartet auf deinen Befehl.

Ein KI-Agent hingegen verfolgt eigene Ziele. Er erkennt Muster, plant Schritte, trifft Entscheidungen und führt Aktionen aus – oft ohne direkte Anweisung. Beispiel: Ein Agent analysiert dein Postfach, priorisiert Nachrichten, schlägt Antworten vor und bucht automatisch Termine.

Aufgabe 1 – Was steckt hinter KI-Agenten?

Begriffe erkennen und erklären: Schau dir das folgende Video aufmerksam an und notiere mindestens 5 neue Fachbegriffe, die im Zusammenhang mit KI-Agenten genannt werden (z. B. Workflow, Steuerlogik, Gedächtnis, Zielverfolgung, Agentenarchitektur). Erkläre jeden Begriff in eigenen Worten und gib ein Beispiel, wo dieser in einem KI-System eine Rolle spielt.
Hinweis: Du kannst auch Begriffe wählen, die du schon kennst, wenn sie im Video in einem neuen Zusammenhang erklärt werden.
Aufbau eines KI-Agenten: Erstelle eine einfache Skizze oder Liste, die zeigt, aus welchen Komponenten ein KI-Agent besteht. Nutze dazu die Begriffe aus Teil 1 und ergänze sie mit eigenen Ideen. → Beispiel: Wahrnehmung, Planung, Handlung, Gedächtnis, Kommunikation
Was unterscheidet einen KI-Agenten von einem klassischen KI-Modell?: Schreibe einen kurzen Text (ca. 5–7 Sätze), in dem du erklärst, was ein KI-Agent mehr kann als ein reines Sprachmodell wie ChatGPT. → Denke dabei an Begriffe wie Zielverfolgung, Autonomie, Kontextverständnis.

Gedächtnis bei KI-Agenten

Gedächtnis- und Kontextmanagement steuern, wie ein KI-Agent Informationen behält und nutzt. Kurzzeitgedächtnis hält den aktuellen Chatverlauf, damit der Agent kohärent antwortet. Langzeitgedächtnis speichert Wissen über Sessions hinweg, etwa Nutzerpräferenzen oder wichtige Fakten, und macht den Agenten überdauernd leistungsfähiger.

Kurzzeitgedächtnis

Das Kurzzeitgedächtnis umfasst alles, was der Agent während einer laufenden Sitzung „weiß“ – also den aktuellen Gesprächsverlauf, die letzten Eingaben und Antworten. Es funktioniert wie ein Chatprotokoll, das dem Agenten hilft, auf vorherige Aussagen zu reagieren, Rückfragen zu stellen oder Zusammenhänge herzustellen.

Merkmale:

Flüchtig: Es endet, sobald die Sitzung geschlossen wird.
Token-basiert: Der Speicher ist begrenzt – ältere Inhalte werden abgeschnitten, wenn das Modell an seine Kontextgrenze stößt.
Beispiel: Wenn du dem Agenten zuerst sagst „Ich bin Lehrerin“, kann er später darauf Bezug nehmen – aber nur solange die Sitzung aktiv ist.

Langzeitgedächtnis

Das Langzeitgedächtnis speichert Informationen über mehrere Sitzungen hinweg. Es ist vergleichbar mit einem Notizbuch, in dem der Agent sich wichtige Dinge merkt – etwa deinen Namen, deine Interessen oder frühere Aufgaben.

Merkmale:

Persistent: Bleibt erhalten, auch wenn die Sitzung beendet wird.
Selektiv: Nicht alles wird gespeichert – nur das, was als relevant markiert oder extrahiert wird.
Beispiel: Ein Agent merkt sich, dass du dich für UI/UX interessierst, und schlägt dir beim nächsten Mal passende Inhalte vor.

Zusammenspiel beider Gedächtnisformen

Das Kurzzeitgedächtnis sorgt für flüssige, kontextbezogene Antworten im Moment.
Das Langzeitgedächtnis ermöglicht personalisierte, nachhaltige Interaktionen.
In fortgeschrittenen Systemen können Inhalte aus dem Kurzzeitgedächtnis ins Langzeitgedächtnis übertragen werden – z. B. wenn du sagst: „Merke dir das bitte.“

Welche Arten von KI-Agenten gibt es – und wie unterscheiden sie sich?

KI-Agenten sind nicht alle gleich. Je nach Aufgabe, Komplexität und Umgebung unterscheiden sich ihre Fähigkeiten und ihr Aufbau. Manche reagieren nur auf Eingaben, andere planen voraus, lernen dazu oder arbeiten mit anderen Agenten zusammen.

Agententypen im Überblick:

Agententyp	Eigenschaften	Beispiel
Reaktiver Agent	Reagiert direkt auf Eingaben, ohne Gedächtnis oder Planung	Einfache Chatbots, automatische Antworten
Planender Agent	Verfolgt ein Ziel, entwickelt Strategien, trifft Entscheidungen	KI zur Routenplanung oder Aufgabensteuerung
Lernender Agent	Verbessert sich durch Erfahrung oder Feedback	Empfehlungssysteme, adaptive Lernsoftware
Kommunikativer Agent	Tauscht Informationen mit anderen Agenten oder Menschen aus	Kundenservice-Agenten, kollaborative Tools
Multi-Agenten-System	Mehrere Agenten arbeiten zusammen, oft mit verteilten Rollen	Logistiksysteme, komplexe Simulationen

Aufgabe 2 – Agententypen vergleichen

Überlege ein eigenes Beispiel für einen KI-Agenten im Alltag und ordne ihn einem Typ zu. Erkläre, warum du diesen Typ gewählt hast.

Ordne die Agententypen nach ihrer Komplexität – vom einfachsten zum anspruchsvollsten. Begründe deine Reihenfolge in 2–3 Sätzen.

Wähle zwei Agententypen und beschreibe, wie sie sich in ihrer Arbeitsweise unterscheiden. Nutze Begriffe wie Zielverfolgung, Gedächtnis, Kommunikation.

Komponenten eines KI-Agenten im Detail

Ein KI-Agent ist mehr als nur ein Sprachmodell. Er besteht aus mehreren funktionalen Bausteinen, die zusammenarbeiten, um Informationen zu verarbeiten, Entscheidungen zu treffen und Aufgaben auszuführen. Je nach Komplexität und Einsatzbereich können diese Komponenten unterschiedlich ausgeprägt sein.

1. Wahrnehmung (Inputverarbeitung)

Der Agent nimmt Informationen aus seiner Umgebung auf – z. B. Texteingaben, Sensordaten, Bilder oder strukturierte Daten. Beispiel: Ein Chatbot verarbeitet die Frage eines Nutzers als Textinput.

2. Gedächtnis (Speicherung & Kontext)

Ein Agent kann Informationen speichern, um sie später wiederzuverwenden. Das Gedächtnis kann kurzfristig (Session-Kontext) oder langfristig (Nutzerprofil, Verlauf) sein. Beispiel: Ein virtueller Assistent merkt sich Termine oder Vorlieben des Nutzers.

3. Zielverfolgung (Planung & Strategie)

Der Agent verfolgt ein definiertes Ziel und entwickelt Strategien, um dieses zu erreichen. Dazu gehört das Abwägen von Optionen und das Treffen von Entscheidungen. Beispiel: Ein KI-Agent plant eine Reiseroute basierend auf Zeit, Budget und Nutzerpräferenzen.

4. Steuerlogik (Entscheidungsregeln)

Die Steuerlogik legt fest, wie der Agent auf bestimmte Situationen reagiert. Sie kann regelbasiert, modellgestützt oder lernfähig sein. Beispiel: Wenn ein Nutzer „Stornieren“ sagt, leitet der Agent automatisch den passenden Prozess ein.

5. Kommunikation (Interaktion mit Mensch oder Maschine)

Der Agent kann mit Menschen oder anderen Agenten kommunizieren – meist über natürliche Sprache, aber auch über Schnittstellen oder APIs. Beispiel: Ein Kundenservice-Agent beantwortet Fragen und leitet komplexe Anliegen weiter.

6. Handlungskompetenz (Ausführung von Aufgaben)

Der Agent führt konkrete Aktionen aus – z. B. Informationen abrufen, E-Mails versenden, Buchungen durchführen oder Systeme steuern. Beispiel: Ein KI-Agent bucht automatisch einen Arzttermin, nachdem er Symptome analysiert hat.

Zusammenfassung als Schema:

Komponente	Funktion	Beispiel
Wahrnehmung	Eingaben erfassen	Texte, Bilder, Sensordaten
Gedächtnis	Informationen speichern	Nutzerprofil, Verlauf
Zielverfolgung	Strategien entwickeln	Reiseplanung, Aufgabenmanagement
Steuerlogik	Entscheidungen treffen	Regelbasierte Reaktion auf Eingaben
Kommunikation	Interaktion mit Mensch/Maschine	Chat, API, Sprache
Handlungskompetenz	Aufgaben ausführen	Buchung, E-Mail, Datenanalyse

Aufgabe 3 – Struktur eines KI-Agenten

Teil 1 – Mindmap erstellen

Erstelle eine Mindmap zum Aufbau eines KI-Agenten. Nutze dabei die folgenden Begriffe als zentrale Äste und ergänze sie mit eigenen Stichpunkten, Beispielen oder kurzen Erklärungen:

Wahrnehmung

Gedächtnis

Zielverfolgung

Steuerlogik

Kommunikation

Handlungskompetenz

Tipp: Achte darauf, dass die Begriffe sinnvoll miteinander verbunden sind.

 Teil 2 – Ethische Reflexion

Sollten KI-Agenten selbstständig Entscheidungen treffen dürfen – z. B. in der Medizin, im Straßenverkehr oder in der Schule? Begründe deine Meinung in wenigen Sätzen. Du kannst dabei auf Verantwortung, Vertrauen, Kontrolle oder mögliche Risiken eingehen.

Quiz: Was weißt du über KI-Agenten?

Beantworte die folgenden Fragen, indem du die jeweils richtige Antwort auswählst.

1. Was unterscheidet einen KI-Agenten grundlegend von einem klassischen Sprachmodell wie ChatGPT?

☐ KI-Agenten benötigen keine Datenbasis
☐ KI-Agenten können keine Texte generieren
☐ KI-Agenten arbeiten ausschließlich offline
☐ KI-Agenten verfolgen Ziele und führen eigenständig Aktionen aus

2. Welche Komponente eines KI-Agenten ist für die Speicherung von Informationen zuständig?

☐ Steuerlogik
☐ Kommunikation
☐ Gedächtnis
☐ Wahrnehmung

3. Welcher Agententyp reagiert ausschließlich auf aktuelle Eingaben und besitzt kein Gedächtnis?

☐ Kommunikativer Agent
☐ Planender Agent
☐ Reaktiver Agent
☐ Lernender Agent

4. Welche Komponente eines KI-Agenten entscheidet, welche Aktion als Nächstes ausgeführt wird?

☐ Gedächtnis
☐ Steuerlogik
☐ Kommunikation
☐ Wahrnehmung

5. Was versteht man unter der Zielverfolgung eines KI-Agenten?

☐ Das Entwickeln von Strategien zur Erreichung eines definierten Ziels
☐ Die Kommunikation mit anderen Agenten
☐ Die Fähigkeit, Sprache zu analysieren
☐ Das Speichern von Nutzerdaten

Top 7 kostenlose KI-Agenten

Name	Beschreibung	Geeignet für…
AutoGen (Microsoft)	Multi-Agenten-Framework mit Rollen, Gedächtnis, Kommunikation. Sehr gut dokumentiert.	Einsteiger:innen, Agenten-Simulationen
LangChain	Modulares Framework für Agenten, Tools, Gedächtnis und Ketten. Sehr flexibel.	Fortgeschrittene, Tool-Integration
CrewAI	Agenten arbeiten wie ein Team mit Rollenverteilung und Zielverfolgung.	Berufssimulation, Projektarbeit
SmolAgents	Minimalistische Agenten mit klarer Struktur und einfacher Erweiterung.	Leichte Projekte, Codeverständnis
OpenAgents	Sammlung von Agenten mit Toolzugriff, Gedächtnis und Webintegration.	Recherche, Web-Aktionen, APIs
LangGraph	Graph-basierte Agentensteuerung mit Zustandslogik und Wiederholbarkeit.	Prozesssteuerung, komplexe Abläufe
Hugging Face Agent API	Agenten mit Open-Source-Modellen, einfache Integration über Transformers.	Chatbots, Textanalyse, einfache Aufgaben

Aufgabe 4 – KI-Agenten verstehen und anwenden

Teste zwei Agenten und vergleiche ihre Zielverfolgung, Gedächtnis und Handlungskompetenz.

Reflexion: „Welcher Agententyp passt zu welcher Aufgabe?“

Microsoft AutoGen

AutoGen ist ein kostenloses, Open-Source-Framework von Microsoft, mit dem du in Python intelligente KI-Agenten erstellen kannst. Es wurde speziell dafür entwickelt, die Arbeit mit großen Sprachmodellen (LLMs) wie GPT zu vereinfachen und zu strukturieren.

Im Gegensatz zu einem einfachen Chat mit einem KI-Modell erlaubt AutoGen dir, mehrere Agenten mit unterschiedlichen Rollen und Fähigkeiten zu definieren. Diese Agenten können miteinander kommunizieren, Aufgaben übernehmen, Entscheidungen treffen und sogar gemeinsam Probleme lösen.

Was kann AutoGen?

Mit AutoGen kannst du z. B.:

Antwort-Agenten erstellen, die auf Fragen reagieren oder Texte generieren
Planungs-Agenten bauen, die Aufgaben analysieren und an andere Agenten weitergeben
Multi-Agenten-Systeme simulieren, in denen mehrere Agenten zusammenarbeiten – z. B. ein „Fragesteller“, ein „Experte“ und ein „Ausführer“
Agenten mit Gedächtnis, Zielverfolgung und Kommunikationslogik ausstatten
die Kommunikation zwischen Agenten automatisieren oder manuell steuern

 Wie funktioniert AutoGen technisch?

Du definierst Agenten als Python-Objekte mit Namen, Rollen und Verhalten
Du kannst festlegen, ob ein Agent automatisch antwortet oder auf menschliche Eingaben wartet
Die Agenten nutzen ein Sprachmodell (z. B. GPT-4) im Hintergrund, um ihre Antworten zu generieren
Die Kommunikation erfolgt über einfache Python-Funktionen wie initiate_chat() oder send()
Du kannst auch externe Tools, APIs oder Datenquellen einbinden

Aufgabe 5 – Erstelle einen KI-Agenten mit Microsoft AutoGen

Voraussetzungen

Visual Studio Code mit Python-Erweiterung
Python 3.10 oder höher installiert
Internetverbindung
Optional: OpenAI API-Key (für GPT-Zugriff)
Autogen-Bibliothek

AutoGen installieren – Schritt für Schritt

Öffne Visual Studio Code
Erstelle ein neues Projekt oder öffne einen Ordner z. B. mein_agent
Öffne das Terminal
- Gehe oben auf „Terminal“ → „Neues Terminal“
- Es öffnet sich unten ein Fenster mit einer Eingabezeile
Gib den Installationsbefehl ein

Drücke Enter
Die Installation startet und dauert ein paar Sekunden

Warte, bis „Successfully installed autogen“ erscheint und du kannst in Python starten:

Falls du eine Fehlermeldung bekommst wie „pip nicht gefunden“, kannst du stattdessen versuchen:

5. Installation prüfen:
- Im Python-Interpreter oder in einer Datei folgende Zeile ausführen:

Aufgabenstellung

Programmiere in Python einen KI-Agenten, der ein selbst gewähltes Ziel verfolgt, eigenständig Informationen sammelt und das Ergebnis zusammenfasst.

1. Neues Projekt & virtuelle Umgebung anlegen

Ordner anlegen und wechseln:bashmkdir mein_agent && cd mein_agent
Virtuelle Umgebung erstellen:bashpython -m venv env
Umgebung aktivieren
- Windows:bashenv\Scripts\activate
- macOS/Linux:bashsource env/bin/activate

2. OpenAI API-Key setzen

Windows (PowerShell):powershellsetx OPENAI_API_KEY "dein_api_schlüssel"
macOS/Linux (bash/zsh):bashexport OPENAI_API_KEY="dein_api_schlüssel"

3. Benötigte Klassen importieren

Erstelle in deinem Editor eine Datei agent.py und füge am Anfang diese Zeilen ein:

import os
from autogen import AssistantAgent, UserProxyAgent, GroupChat, GroupChatManager

4. Ziel definieren

Direkt unter den Imports formulierst du dein Forschungsziel als String:

goal = (
    "Recherchiere Einsatzbereiche von KI in der Medizin "
    "und fasse die wichtigsten Erkenntnisse in fünf Sätzen zusammen."
)

5. Agenten & Chat-Manager erstellen

Ergänze in agent.py:

assistant = AssistantAgent(name="Researcher")
user_proxy = UserProxyAgent(name="Student", human_input_mode="NEVER")
groupchat = GroupChat(agents=[user_proxy, assistant], messages=[])
manager = GroupChatManager(groupchat=groupchat)

6. Agenten starten & Ergebnis ausgeben

Füge am Ende von agent.py diese Zeilen ein und speichere:

user_proxy.initiate_chat(manager, message=goal)
manager.run()

Führe das Skript im Terminal aus:

python agent.py

Erscheint im Terminal eine inhaltliche Zusammenfassung? – Wenn ja, dann ist dein KI-Agent erfolgreich in Python eingebunden.

Parameter-Tuning & Prompt-Einstellungen

Parameter beeinflussen die Funktionsweise des Sprachmodells auf Token-Ebene:

Wichtige Parameter

temperature: Steuert Zufälligkeit; niedrige Werte liefern deterministischere, präzisere Antworten, hohe Werte erzeugen kreativeren Content
max_tokens: Legt die maximale Länge der Antwort fest, damit sie weder zu kurz noch zu lang ausfällt
top_p: Filtert Token nach kumulierter Wahrscheinlichkeit; senkt man top_p, wird die Auswahl der wahrscheinlichsten Tokens eingeschränkt
frequency_penalty: Bestraft Wiederholungen, damit dein Agent sich nicht ständig wiederholt
Durch systematisches Ausprobieren dieser Werte findest du die beste Balance zwischen Kreativität, Verständlichkeit und Fokus.

Code-Beispiel

assistant = AssistantAgent(
    name="Researcher",
    model="gpt-4",
    temperature=0.3,
    max_tokens=400,
    top_p=0.9,
    frequency_penalty=0.5
)

Aufgabe 6

Bildet Kleingruppen und führt je drei Durchläufe mit unterschiedlichen temperature-Werten (z. B. 0.1, 0.5, 1.0) durch

Vergleicht die Antworten: Was ändert sich in Stil, Länge und Genauigkeit?

Haltet eure Beobachtungen in einer kurzen Tabelle fest und diskutiert, welche Einstellung für welche Aufgabe sinnvoll ist

Logging & Ausgabeanalyse

Logging protokolliert alle wichtigen Schritte und Entscheidungen deines KI-Agenten, während Ausgabeanalyse die protokollierten Daten und generierten Antworten auswertet, um Abläufe zu verstehen und zu optimieren.

Was bewirkt Logging:

erfasst Zeitstempel, Log-Level (INFO, DEBUG, ERROR) und Nachrichten
dokumentiert Schrittfolge: von der Initialisierung bis zur Ausgabe
hilft bei der Fehlersuche, Performance-Messung und Nachvollziehbarkeit
gibt Transparenz über interne Prozesse und erleichtert spätere Analysen

Beispielcode

import logging

logging.basicConfig(
  level=logging.INFO,
  format="%(asctime)s %(levelname)s %(message)s"
)

logging.info("Starte Agentenkonfiguration")
# … Agenten-Setup und Dialog …
logging.info("Agentenlauf beendet")

Was macht Ausgabeanalyse

inspiziert die erzeugten Antworten auf Vollständigkeit, Stil und Genauigkeit
vergleicht Ausgaben verschiedener Durchläufe oder Parametereinstellungen
identifiziert wiederkehrende Muster, Inkonsistenzen und Potenziale
visualisiert Abläufe und Ergebnisse zum besseren Verständnis (Tabellen, Sequenzdiagramme)

Beispiel:

Tabelle mit drei Agenten-Läufen und Spalten für Laufzeit, Token-Anzahl und Ergebnisqualität
Sequenzdiagramm, das die Nachrichten zwischen UserProxy und AssistantAgent zeigt

Aufgabe 7

Aktiviert das Logging und startet euren Agenten mit einem einfachen Ziel

Lest das Log im Terminal und notiert, welche Schritte der Agent unternommen hat

Visualisiert den Ablauf in einem Sequenzdiagramm oder einer Tabelle, z. B.

Schritt 1: Student-Agent sendet Ziel
Schritt 2: Researcher-Agent analysiert Ziel
Schritt 3: Researcher-Agent antwortet mit Zusammenfassung

Externe Tools & Plugins einbinden

Autogen erlaubt es, dem Agenten zusätzliche Tools zur Verfügung zu stellen, zum Beispiel eine Websuche oder die Ausführung von Code. So erweitert ihr die Handlungskompetenz des Agents.

Code-Beispiel: WebSearchTool einbinden

from autogen import AssistantAgent, UserProxyAgent, GroupChat, GroupChatManager
from autogen.tools import WebSearchTool

assistant = AssistantAgent(name="Researcher")
assistant.add_tool(WebSearchTool())

user_proxy = UserProxyAgent(name="Student", human_input_mode="NEVER")
groupchat = GroupChat(agents=[user_proxy, assistant], messages=[])
manager = GroupChatManager(groupchat=groupchat)

goal = "Suche nach aktuellen Studien zu KI in der Medizin und fasse die Quellen in drei Sätzen zusammen."
user_proxy.initiate_chat(manager, message=goal)
manager.run()

Aufgabe 8

Bindet zusätzlich ein CodeExecutionTool oder ein anderes praktisches Plugin ein (z. B. für Tabellen- oder PDF-Erstellung)

Lasst den Agenten mit diesem Tool eine Action ausführen, zum Beispiel einfachen Code laufen lassen oder Daten in eine CSV exportieren

Dokumentiert die Tool-Aufrufe und beschreibt in wenigen Sätzen, wie die Tool-Integration die Agenten-Autonomie erhöht