
Agentic AI im Testumfeld – unsere Eindrücke aus Hamburg
Die „Trends in Testing" von imbus ist schon länger ein Thema in unserem Team. Die Kollegen gehen regelmäßig zu dieser Roadshow. Dieses Jahr habe ich mich erstmals entschlossen, selbst dabei zu sein – zusammen mit Rico und Hendrik. Am Freitag, 20. März, waren wir im Gastwerk Hamburg.
Das Thema diesen Jahres: Agentic AI. Und das Motto: „Licence to execute" – Geheimagent 007 lässt grüßen. Die Veranstaltung war durchgehend mit James-Bond-Metaphern unterlegt, was ich angesichts des Themas ziemlich charmant fand. Aber hinter dem Wortspiel steckt eine echte Frage: Welche Befugnisse sollte man einer KI erteilen, die selbstständig handelt?
Ich persönlich habe im Kundenumfeld noch keine Berührungspunkte mit agentischer KI. Genau deshalb war der Tag besonders wertvoll – ich wollte mitbekommen, was schon möglich ist und was andere diesbezüglich aufgebaut haben.
Vom Chatbot zum Agenten
Das Programm startete mit einem Überblick zur Geschichte der KI: vom ChatGPT-Launch 2022 bis zur heutigen Ära autonomer Agenten wie OpenClaw. Was mir dabei klargeworden ist: Der Unterschied zwischen Chat-Bot-KI und Agentic AI ist größer, als ich gedacht hätte. Bei der klassischen KI stelle ich eine Frage und bekomme eine Antwort. Ein KI-Agent hingegen bekommt einen Auftrag – und entscheidet dann selbst, wie er ihn ausführt.
Das Beispiel, das hängengeblieben ist: der Zahnarzttermin. Ob die KI eine E-Mail schreibt, den Kalender öffnet oder mit wem sie Terminvorschläge abstimmt – alles liegt in ihrem Ermessen. Was sie darf und was nicht, hängt davon ab, welche Tools und Zugriffsrechte sie bekommen hat. Da wird einem schnell klar, warum isolierte Umgebungen und präzise Prompts so wichtig sind.
Wer hat die Kontrolle?
Ein Vortrag, der mich besonders interessiert hat, behandelte die Frage: An welcher Stelle kontrolliert der Mensch, was die KI tut? Direkt bei jedem Schritt, oder erst am Ende beim Ergebnis? Wo sitzt der vielbesagte „human in the loop"? Die Parallele zur Delegation an einen Kollegen fand ich treffend: Auch da entscheidet das Vertrauen und das Risikoprofil einer Aufgabe darüber, ob man bereits ist, sie abzugeben.
Beim Thema Prompting wurde verdeutlicht, wie viele verschiedene Ebenen existieren: Was kommt vom Hersteller, was wird systemweit festgelegt und was definiert man für den konkreten Einsatzzweck? Die KI kann in verschiedene Rollen schlüpfen und ihre Vorgehensweise erläutern. Das ist sinnvoll, denn nur mit Begründung hat man eine Chance nachzuvollziehen, welchen Weg das Modell gehen möchte.
Stand der Dinge
Am Nachmittag sahen wir Kurzberichte aus der KI-Praxis von imbus und welche Projekte schon in Umsetzung sind. Testfallgenerierung ist dabei ein Thema: KI kann helfen, den ersten Aufschlag zu liefern, insbesondere wenn man vor einer leeren Testmatrix sitzt. Auch Code Reviews wurden erwähnt – da sehe ich ebenso einen klaren Mehrwert, auch wenn das für mein Projektumfeld im Testmanagement weniger relevant ist.
Begleitend gab es während der Vorträge Abstimmungen im Plenum der 50 Anwesenden: Wer nutzt was, wer noch nicht? Mit erwartbarem Ergebnis – es gibt Leute, die Agentic AI bereits aktiv einsetzen, und solche, die noch beobachten. Ich kann mir sehr gut vorstellen, dass uns das Thema weiter begleitet. Da lohnt es sich dranzubleiben.




