4. Unterrichtsblock

KI Entwicklerkurs

Kursinhalte

  • Begriffserklärung KI-Assistent
  • Unterschied KI-Assistent & KI-Agenten
  • Arten von KI-Agenten
  • Komponenten eines KI-Agenten
  • Erstelle einen KI-Agenten mit MS AutoGen

Einführung in KI-Agenten

Was ist ein KI-Assistent?

Ein KI-Assistent ist ein digitales System, das mithilfe von Künstlicher Intelligenz Aufgaben für Menschen übernimmt. Er kann Informationen verarbeiten, Entscheidungen vorbereiten und sogar selbstständig handeln – je nach Komplexität.

Typische Beispiele:

  • Sprachassistenten wie Siri, Alexa oder Google Assistant
  • Chatbots in Kundenservices
  • Schreib- und Recherchehilfen wie ChatGPT
  • Agenten, die Termine koordinieren, E-Mails beantworten oder Webseiten analysieren

Wie unterscheiden sich KI-Assistenten und KI-Agenten?

Ein KI-Assistent hilft dir bei klar definierten Aufgaben – z. B. eine E-Mail zusammenfassen, einen Termin setzen oder eine Frage beantworten. Er wartet auf deinen Befehl.

Ein KI-Agent hingegen verfolgt eigene Ziele. Er erkennt Muster, plant Schritte, trifft Entscheidungen und führt Aktionen aus – oft ohne direkte Anweisung. Beispiel: Ein Agent analysiert dein Postfach, priorisiert Nachrichten, schlägt Antworten vor und bucht automatisch Termine.

Aufgabe 1 – Was steckt hinter KI-Agenten?

  • Begriffe erkennen und erklären: Schau dir das folgende Video aufmerksam an und notiere mindestens 5 neue Fachbegriffe, die im Zusammenhang mit KI-Agenten genannt werden (z. B. Workflow, Steuerlogik, Gedächtnis, Zielverfolgung, Agentenarchitektur). Erkläre jeden Begriff in eigenen Worten und gib ein Beispiel, wo dieser in einem KI-System eine Rolle spielt.
    Hinweis: Du kannst auch Begriffe wählen, die du schon kennst, wenn sie im Video in einem neuen Zusammenhang erklärt werden.
  • Aufbau eines KI-Agenten: Erstelle eine einfache Skizze oder Liste, die zeigt, aus welchen Komponenten ein KI-Agent besteht. Nutze dazu die Begriffe aus Teil 1 und ergänze sie mit eigenen Ideen. → Beispiel: Wahrnehmung, Planung, Handlung, Gedächtnis, Kommunikation
  • Was unterscheidet einen KI-Agenten von einem klassischen KI-Modell?: Schreibe einen kurzen Text (ca. 5–7 Sätze), in dem du erklärst, was ein KI-Agent mehr kann als ein reines Sprachmodell wie ChatGPT. → Denke dabei an Begriffe wie Zielverfolgung, Autonomie, Kontextverständnis.

Gedächtnis bei KI-Agenten

Gedächtnis- und Kontextmanagement steuern, wie ein KI-Agent Informationen behält und nutzt. Kurzzeitgedächtnis hält den aktuellen Chatverlauf, damit der Agent kohärent antwortet. Langzeitgedächtnis speichert Wissen über Sessions hinweg, etwa Nutzerpräferenzen oder wichtige Fakten, und macht den Agenten überdauernd leistungsfähiger.

Kurzzeitgedächtnis

Das Kurzzeitgedächtnis umfasst alles, was der Agent während einer laufenden Sitzung „weiß“ – also den aktuellen Gesprächsverlauf, die letzten Eingaben und Antworten. Es funktioniert wie ein Chatprotokoll, das dem Agenten hilft, auf vorherige Aussagen zu reagieren, Rückfragen zu stellen oder Zusammenhänge herzustellen.

Merkmale:

  • Flüchtig: Es endet, sobald die Sitzung geschlossen wird.
  • Token-basiert: Der Speicher ist begrenzt – ältere Inhalte werden abgeschnitten, wenn das Modell an seine Kontextgrenze stößt.
  • Beispiel: Wenn du dem Agenten zuerst sagst „Ich bin Lehrerin“, kann er später darauf Bezug nehmen – aber nur solange die Sitzung aktiv ist.

Langzeitgedächtnis

Das Langzeitgedächtnis speichert Informationen über mehrere Sitzungen hinweg. Es ist vergleichbar mit einem Notizbuch, in dem der Agent sich wichtige Dinge merkt – etwa deinen Namen, deine Interessen oder frühere Aufgaben.

Merkmale:

  • Persistent: Bleibt erhalten, auch wenn die Sitzung beendet wird.
  • Selektiv: Nicht alles wird gespeichert – nur das, was als relevant markiert oder extrahiert wird.
  • Beispiel: Ein Agent merkt sich, dass du dich für UI/UX interessierst, und schlägt dir beim nächsten Mal passende Inhalte vor.

Zusammenspiel beider Gedächtnisformen

  • Das Kurzzeitgedächtnis sorgt für flüssige, kontextbezogene Antworten im Moment.
  • Das Langzeitgedächtnis ermöglicht personalisierte, nachhaltige Interaktionen.
  • In fortgeschrittenen Systemen können Inhalte aus dem Kurzzeitgedächtnis ins Langzeitgedächtnis übertragen werden – z. B. wenn du sagst: „Merke dir das bitte.“
Workflow eines KI-Agenten

Welche Arten von KI-Agenten gibt es – und wie unterscheiden sie sich?

KI-Agenten sind nicht alle gleich. Je nach Aufgabe, Komplexität und Umgebung unterscheiden sich ihre Fähigkeiten und ihr Aufbau. Manche reagieren nur auf Eingaben, andere planen voraus, lernen dazu oder arbeiten mit anderen Agenten zusammen.

Agententypen im Überblick:

AgententypEigenschaftenBeispiel
Reaktiver AgentReagiert direkt auf Eingaben, ohne Gedächtnis oder PlanungEinfache Chatbots, automatische Antworten
Planender AgentVerfolgt ein Ziel, entwickelt Strategien, trifft EntscheidungenKI zur Routenplanung oder Aufgabensteuerung
Lernender AgentVerbessert sich durch Erfahrung oder FeedbackEmpfehlungssysteme, adaptive Lernsoftware
Kommunikativer AgentTauscht Informationen mit anderen Agenten oder Menschen ausKundenservice-Agenten, kollaborative Tools
Multi-Agenten-SystemMehrere Agenten arbeiten zusammen, oft mit verteilten RollenLogistiksysteme, komplexe Simulationen

Aufgabe 2 – Agententypen vergleichen

Überlege ein eigenes Beispiel für einen KI-Agenten im Alltag und ordne ihn einem Typ zu. Erkläre, warum du diesen Typ gewählt hast.

Ordne die Agententypen nach ihrer Komplexität – vom einfachsten zum anspruchsvollsten. Begründe deine Reihenfolge in 2–3 Sätzen.

Wähle zwei Agententypen und beschreibe, wie sie sich in ihrer Arbeitsweise unterscheiden. Nutze Begriffe wie Zielverfolgung, Gedächtnis, Kommunikation.

Komponenten eines KI-Agenten im Detail

Ein KI-Agent ist mehr als nur ein Sprachmodell. Er besteht aus mehreren funktionalen Bausteinen, die zusammenarbeiten, um Informationen zu verarbeiten, Entscheidungen zu treffen und Aufgaben auszuführen. Je nach Komplexität und Einsatzbereich können diese Komponenten unterschiedlich ausgeprägt sein.

1. Wahrnehmung (Inputverarbeitung)

Der Agent nimmt Informationen aus seiner Umgebung auf – z. B. Texteingaben, Sensordaten, Bilder oder strukturierte Daten. Beispiel: Ein Chatbot verarbeitet die Frage eines Nutzers als Textinput.

2. Gedächtnis (Speicherung & Kontext)

Ein Agent kann Informationen speichern, um sie später wiederzuverwenden. Das Gedächtnis kann kurzfristig (Session-Kontext) oder langfristig (Nutzerprofil, Verlauf) sein. Beispiel: Ein virtueller Assistent merkt sich Termine oder Vorlieben des Nutzers.

3. Zielverfolgung (Planung & Strategie)

Der Agent verfolgt ein definiertes Ziel und entwickelt Strategien, um dieses zu erreichen. Dazu gehört das Abwägen von Optionen und das Treffen von Entscheidungen. Beispiel: Ein KI-Agent plant eine Reiseroute basierend auf Zeit, Budget und Nutzerpräferenzen.

4. Steuerlogik (Entscheidungsregeln)

Die Steuerlogik legt fest, wie der Agent auf bestimmte Situationen reagiert. Sie kann regelbasiert, modellgestützt oder lernfähig sein. Beispiel: Wenn ein Nutzer „Stornieren“ sagt, leitet der Agent automatisch den passenden Prozess ein.

5. Kommunikation (Interaktion mit Mensch oder Maschine)

Der Agent kann mit Menschen oder anderen Agenten kommunizieren – meist über natürliche Sprache, aber auch über Schnittstellen oder APIs. Beispiel: Ein Kundenservice-Agent beantwortet Fragen und leitet komplexe Anliegen weiter.

6. Handlungskompetenz (Ausführung von Aufgaben)

Der Agent führt konkrete Aktionen aus – z. B. Informationen abrufen, E-Mails versenden, Buchungen durchführen oder Systeme steuern. Beispiel: Ein KI-Agent bucht automatisch einen Arzttermin, nachdem er Symptome analysiert hat.

Zusammenfassung als Schema:

KomponenteFunktionBeispiel
WahrnehmungEingaben erfassenTexte, Bilder, Sensordaten
GedächtnisInformationen speichernNutzerprofil, Verlauf
ZielverfolgungStrategien entwickelnReiseplanung, Aufgabenmanagement
SteuerlogikEntscheidungen treffenRegelbasierte Reaktion auf Eingaben
KommunikationInteraktion mit Mensch/MaschineChat, API, Sprache
HandlungskompetenzAufgaben ausführenBuchung, E-Mail, Datenanalyse

Aufgabe 3 – Struktur eines KI-Agenten

Teil 1 – Mindmap erstellen

Erstelle eine Mindmap zum Aufbau eines KI-Agenten. Nutze dabei die folgenden Begriffe als zentrale Äste und ergänze sie mit eigenen Stichpunkten, Beispielen oder kurzen Erklärungen:

  • Wahrnehmung
  • Gedächtnis
  • Zielverfolgung
  • Steuerlogik
  • Kommunikation
  • Handlungskompetenz

Tipp: Achte darauf, dass die Begriffe sinnvoll miteinander verbunden sind.

 Teil 2 – Ethische Reflexion

Sollten KI-Agenten selbstständig Entscheidungen treffen dürfen – z. B. in der Medizin, im Straßenverkehr oder in der Schule? Begründe deine Meinung in wenigen Sätzen. Du kannst dabei auf Verantwortung, Vertrauen, Kontrolle oder mögliche Risiken eingehen.

Quiz: Was weißt du über KI-Agenten?

Beantworte die folgenden Fragen, indem du die jeweils richtige Antwort auswählst.

1. Was unterscheidet einen KI-Agenten grundlegend von einem klassischen Sprachmodell wie ChatGPT?

  • ☐ KI-Agenten benötigen keine Datenbasis
  • ☐ KI-Agenten können keine Texte generieren
  • ☐ KI-Agenten arbeiten ausschließlich offline
  • ☐ KI-Agenten verfolgen Ziele und führen eigenständig Aktionen aus

2. Welche Komponente eines KI-Agenten ist für die Speicherung von Informationen zuständig?

  • ☐ Steuerlogik
  • ☐ Kommunikation
  • ☐ Gedächtnis
  • ☐ Wahrnehmung

3. Welcher Agententyp reagiert ausschließlich auf aktuelle Eingaben und besitzt kein Gedächtnis?

  • ☐ Kommunikativer Agent
  • ☐ Planender Agent
  • ☐ Reaktiver Agent
  • ☐ Lernender Agent

4. Welche Komponente eines KI-Agenten entscheidet, welche Aktion als Nächstes ausgeführt wird?

  • ☐ Gedächtnis
  • ☐ Steuerlogik
  • ☐ Kommunikation
  • ☐ Wahrnehmung

5. Was versteht man unter der Zielverfolgung eines KI-Agenten?

  • ☐ Das Entwickeln von Strategien zur Erreichung eines definierten Ziels
  • ☐ Die Kommunikation mit anderen Agenten
  • ☐ Die Fähigkeit, Sprache zu analysieren
  • ☐ Das Speichern von Nutzerdaten

Top 7 kostenlose KI-Agenten

NameBeschreibungGeeignet für…
AutoGen (Microsoft)Multi-Agenten-Framework mit Rollen, Gedächtnis, Kommunikation. Sehr gut dokumentiert.Einsteiger:innen, Agenten-Simulationen
LangChainModulares Framework für Agenten, Tools, Gedächtnis und Ketten. Sehr flexibel.Fortgeschrittene, Tool-Integration
CrewAIAgenten arbeiten wie ein Team mit Rollenverteilung und Zielverfolgung.Berufssimulation, Projektarbeit
SmolAgentsMinimalistische Agenten mit klarer Struktur und einfacher Erweiterung.Leichte Projekte, Codeverständnis
OpenAgentsSammlung von Agenten mit Toolzugriff, Gedächtnis und Webintegration.Recherche, Web-Aktionen, APIs
LangGraphGraph-basierte Agentensteuerung mit Zustandslogik und Wiederholbarkeit.Prozesssteuerung, komplexe Abläufe
Hugging Face Agent APIAgenten mit Open-Source-Modellen, einfache Integration über Transformers.Chatbots, Textanalyse, einfache Aufgaben

Aufgabe 4 – KI-Agenten verstehen und anwenden

Teste zwei Agenten und vergleiche ihre Zielverfolgung, Gedächtnis und Handlungskompetenz.

Reflexion: „Welcher Agententyp passt zu welcher Aufgabe?“

Microsoft AutoGen

AutoGen ist ein kostenloses, Open-Source-Framework von Microsoft, mit dem du in Python intelligente KI-Agenten erstellen kannst. Es wurde speziell dafür entwickelt, die Arbeit mit großen Sprachmodellen (LLMs) wie GPT zu vereinfachen und zu strukturieren.

Im Gegensatz zu einem einfachen Chat mit einem KI-Modell erlaubt AutoGen dir, mehrere Agenten mit unterschiedlichen Rollen und Fähigkeiten zu definieren. Diese Agenten können miteinander kommunizieren, Aufgaben übernehmen, Entscheidungen treffen und sogar gemeinsam Probleme lösen.

Was kann AutoGen?

Mit AutoGen kannst du z. B.:

  • Antwort-Agenten erstellen, die auf Fragen reagieren oder Texte generieren
  • Planungs-Agenten bauen, die Aufgaben analysieren und an andere Agenten weitergeben
  • Multi-Agenten-Systeme simulieren, in denen mehrere Agenten zusammenarbeiten – z. B. ein „Fragesteller“, ein „Experte“ und ein „Ausführer“
  • Agenten mit Gedächtnis, Zielverfolgung und Kommunikationslogik ausstatten
  • die Kommunikation zwischen Agenten automatisieren oder manuell steuern

 Wie funktioniert AutoGen technisch?

  • Du definierst Agenten als Python-Objekte mit Namen, Rollen und Verhalten
  • Du kannst festlegen, ob ein Agent automatisch antwortet oder auf menschliche Eingaben wartet
  • Die Agenten nutzen ein Sprachmodell (z. B. GPT-4) im Hintergrund, um ihre Antworten zu generieren
  • Die Kommunikation erfolgt über einfache Python-Funktionen wie initiate_chat() oder send()
  • Du kannst auch externe Tools, APIs oder Datenquellen einbinden

Aufgabe 5 – Erstelle einen KI-Agenten mit Microsoft AutoGen

Voraussetzungen

  • Visual Studio Code mit Python-Erweiterung
  • Python 3.10 oder höher installiert
  • Internetverbindung
  • Optional: OpenAI API-Key (für GPT-Zugriff)
  • Autogen-Bibliothek

AutoGen installieren – Schritt für Schritt

  1. Öffne Visual Studio Code
  2. Erstelle ein neues Projekt oder öffne einen Ordner z. B. mein_agent
  3. Öffne das Terminal
    • Gehe oben auf „Terminal“ → „Neues Terminal“
    • Es öffnet sich unten ein Fenster mit einer Eingabezeile
  4. Gib den Installationsbefehl ein
  • Drücke Enter
  • Die Installation startet und dauert ein paar Sekunden

Warte, bis „Successfully installed autogen“ erscheint und du kannst in Python starten:

Falls du eine Fehlermeldung bekommst wie „pip nicht gefunden“, kannst du stattdessen versuchen:

  • 5. Installation prüfen:
    • Im Python-Interpreter oder in einer Datei folgende Zeile ausführen:

Aufgabenstellung

Programmiere in Python einen KI-Agenten, der ein selbst gewähltes Ziel verfolgt, eigenständig Informationen sammelt und das Ergebnis zusammenfasst.

1. Neues Projekt & virtuelle Umgebung anlegen

  1. Ordner anlegen und wechseln:bashmkdir mein_agent && cd mein_agent
  2. Virtuelle Umgebung erstellen:bashpython -m venv env
  3. Umgebung aktivieren
    • Windows:bashenv\Scripts\activate
    • macOS/Linux:bashsource env/bin/activate

2. OpenAI API-Key setzen

  • Windows (PowerShell):powershellsetx OPENAI_API_KEY "dein_api_schlüssel"
  • macOS/Linux (bash/zsh):bashexport OPENAI_API_KEY="dein_api_schlüssel"

3. Benötigte Klassen importieren

Erstelle in deinem Editor eine Datei agent.py und füge am Anfang diese Zeilen ein:

import os
from autogen import AssistantAgent, UserProxyAgent, GroupChat, GroupChatManager

4. Ziel definieren

Direkt unter den Imports formulierst du dein Forschungsziel als String:

goal = (
    "Recherchiere Einsatzbereiche von KI in der Medizin "
    "und fasse die wichtigsten Erkenntnisse in fünf Sätzen zusammen."
)

5. Agenten & Chat-Manager erstellen

Ergänze in agent.py:

assistant = AssistantAgent(name="Researcher")
user_proxy = UserProxyAgent(name="Student", human_input_mode="NEVER")
groupchat = GroupChat(agents=[user_proxy, assistant], messages=[])
manager = GroupChatManager(groupchat=groupchat)

6. Agenten starten & Ergebnis ausgeben

Füge am Ende von agent.py diese Zeilen ein und speichere:

user_proxy.initiate_chat(manager, message=goal)
manager.run()

Führe das Skript im Terminal aus:

python agent.py

Erscheint im Terminal eine inhaltliche Zusammenfassung? – Wenn ja, dann ist dein KI-Agent erfolgreich in Python eingebunden.

Parameter-Tuning & Prompt-Einstellungen

Parameter beeinflussen die Funktionsweise des Sprachmodells auf Token-Ebene:

Wichtige Parameter

  • temperature: Steuert Zufälligkeit; niedrige Werte liefern deterministischere, präzisere Antworten, hohe Werte erzeugen kreativeren Content
  • max_tokens: Legt die maximale Länge der Antwort fest, damit sie weder zu kurz noch zu lang ausfällt
  • top_p: Filtert Token nach kumulierter Wahrscheinlichkeit; senkt man top_p, wird die Auswahl der wahrscheinlichsten Tokens eingeschränkt
  • frequency_penalty: Bestraft Wiederholungen, damit dein Agent sich nicht ständig wiederholt
  • Durch systematisches Ausprobieren dieser Werte findest du die beste Balance zwischen Kreativität, Verständlichkeit und Fokus.

Code-Beispiel

assistant = AssistantAgent(
    name="Researcher",
    model="gpt-4",
    temperature=0.3,
    max_tokens=400,
    top_p=0.9,
    frequency_penalty=0.5
)

Aufgabe 6

Bildet Kleingruppen und führt je drei Durchläufe mit unterschiedlichen temperature-Werten (z. B. 0.1, 0.5, 1.0) durch

Vergleicht die Antworten: Was ändert sich in Stil, Länge und Genauigkeit?

Haltet eure Beobachtungen in einer kurzen Tabelle fest und diskutiert, welche Einstellung für welche Aufgabe sinnvoll ist

Logging & Ausgabeanalyse

Logging protokolliert alle wichtigen Schritte und Entscheidungen deines KI-Agenten, während Ausgabeanalyse die protokollierten Daten und generierten Antworten auswertet, um Abläufe zu verstehen und zu optimieren.

Was bewirkt Logging:

  • erfasst Zeitstempel, Log-Level (INFO, DEBUG, ERROR) und Nachrichten
  • dokumentiert Schrittfolge: von der Initialisierung bis zur Ausgabe
  • hilft bei der Fehlersuche, Performance-Messung und Nachvollziehbarkeit
  • gibt Transparenz über interne Prozesse und erleichtert spätere Analysen

Beispielcode

import logging

logging.basicConfig(
  level=logging.INFO,
  format="%(asctime)s %(levelname)s %(message)s"
)

logging.info("Starte Agentenkonfiguration")
# … Agenten-Setup und Dialog …
logging.info("Agentenlauf beendet")

Was macht Ausgabeanalyse

  • inspiziert die erzeugten Antworten auf Vollständigkeit, Stil und Genauigkeit
  • vergleicht Ausgaben verschiedener Durchläufe oder Parametereinstellungen
  • identifiziert wiederkehrende Muster, Inkonsistenzen und Potenziale
  • visualisiert Abläufe und Ergebnisse zum besseren Verständnis (Tabellen, Sequenzdiagramme)

Beispiel:

  • Tabelle mit drei Agenten-Läufen und Spalten für Laufzeit, Token-Anzahl und Ergebnisqualität
  • Sequenzdiagramm, das die Nachrichten zwischen UserProxy und AssistantAgent zeigt

Aufgabe 7

Aktiviert das Logging und startet euren Agenten mit einem einfachen Ziel

Lest das Log im Terminal und notiert, welche Schritte der Agent unternommen hat

Visualisiert den Ablauf in einem Sequenzdiagramm oder einer Tabelle, z. B.

  • Schritt 1: Student-Agent sendet Ziel
  • Schritt 2: Researcher-Agent analysiert Ziel
  • Schritt 3: Researcher-Agent antwortet mit Zusammenfassung

Externe Tools & Plugins einbinden

Autogen erlaubt es, dem Agenten zusätzliche Tools zur Verfügung zu stellen, zum Beispiel eine Websuche oder die Ausführung von Code. So erweitert ihr die Handlungskompetenz des Agents.

Code-Beispiel: WebSearchTool einbinden

from autogen import AssistantAgent, UserProxyAgent, GroupChat, GroupChatManager
from autogen.tools import WebSearchTool

assistant = AssistantAgent(name="Researcher")
assistant.add_tool(WebSearchTool())

user_proxy = UserProxyAgent(name="Student", human_input_mode="NEVER")
groupchat = GroupChat(agents=[user_proxy, assistant], messages=[])
manager = GroupChatManager(groupchat=groupchat)

goal = "Suche nach aktuellen Studien zu KI in der Medizin und fasse die Quellen in drei Sätzen zusammen."
user_proxy.initiate_chat(manager, message=goal)
manager.run()

Aufgabe 8

Bindet zusätzlich ein CodeExecutionTool oder ein anderes praktisches Plugin ein (z. B. für Tabellen- oder PDF-Erstellung)

Lasst den Agenten mit diesem Tool eine Action ausführen, zum Beispiel einfachen Code laufen lassen oder Daten in eine CSV exportieren

Dokumentiert die Tool-Aufrufe und beschreibt in wenigen Sätzen, wie die Tool-Integration die Agenten-Autonomie erhöht