20. September 2024
Bei all der Begeisterung über generative KI – wobei Chatbots wie ChatGPT und Bildgenerierungstools wie Midjourney oder Grok2 im Mittelpunkt stehen – übersieht man leicht die umfassenderen Automatisierungsmöglichkeiten, die Large Language Models (LLMs) bieten.
KI-Chatbots können zwar die persönliche Produktivität massiv steigern, die Erschließung unternehmensweiter Produktivität erfordert jedoch einen anderen Ansatz, der darüber hinausgeht. Im Wesentlichen funktionieren Chatbots wie ein „Gehirn im Glas“: Sie sind beschränkt auf das, was sie aufgrund ihrer Trainingsdaten wissen. Sie sind nicht über die neuesten Ereignisse nach ihrem Training informiert und können nicht auf Unternehmensdaten zugreifen, die hinter Firewalls gespeichert sind.
Um diese Mängel zu beheben, können Techniken wie Retrieval Augmented Generation (RAG) eingesetzt werden, um Internetsuchergebnisse in Echtzeit, Geschäftsdokumente oder Daten aus CRM-Systemen einzubinden und die KI mit aktuelleren und kontextrelevanteren Informationen zu versorgen. Dieser Ansatz erhöht die Genauigkeit der Antworten des KI-Modells und reduziert Halluzinationen (bei denen die KI Wissenslücken mit plausibel klingenden, aber faktisch falschen Ergebnissen füllt).
Eine wahrhaft intelligente Automatisierung eines Unternehmens oder Workflows erfordert allerdings mehr als nur die Generierung einer Ausgabe: KI-Modelle müssen in der Lage sein, auf Ereignisse zu reagieren und basierend auf den von ihnen ausgewerteten Daten Aktionen auszulösen. Dieser proaktive Ansatz ist für die Erstellung von Systemen mit intelligentem Verhalten und greifbaren Geschäftsergebnissen unerlässlich.
Von großen Sprachmodellen zu KI-Agenten
Hier kommen KI-Agenten ins Spiel. Generative KI-Chatbots können Ihnen beim Erstellen, Zusammenfassen, Entdecken und Lernen helfen, während KI-Agenten sich auf das Ausführen von Aktionen konzentrieren – sie kombinieren die Leistungsfähigkeit von LLMs zur Auswertung von Daten und Vorhersage eines gewünschten Ergebnisses (das nächste Wort oder Pixel in einer Sequenz) mit der Fähigkeit, durch Automatisierung Maßnahmen zu ergreifen.
KI-Agenten verbinden Intelligenz und Automatisierung, um autonome Systeme zu schaffen, die unabhängig arbeiten, Entscheidungen treffen und sich an verändernde Umgebungen anpassen. Sie versprechen, eine der langjährigen Herausforderungen der Automatisierung zu lösen: die Anfälligkeit traditioneller Automatisierungsprozesse und Roboter (RPA). Angenommen, ein automatisierter Prozess stößt auf einen Fehler, ein Dokument oder einen Datenpunkt, den er nicht verarbeiten kann. In diesem Fall gerät der Prozess in einen Ausnahmezustand, der oft kostspielige menschliche Eingriffe zur Behebung erfordert.
Durch die Kombination der Vielseitigkeit und der Argumentationsfähigkeiten von Large Language Models mit der Automatisierung von Arbeitsabläufen und robotergesteuerter Prozessautomatisierung können KI-Agenten Aufgaben automatisieren, die eine langfristige Planung und Interaktion in komplexen, dynamischen Umgebungen erfordern, was einen bedeutenden Fortschritt bei der Verwirklichung der Automatisierungs- und Straight-Through-Processing-Ziele von Unternehmen darstellt.
Wesentliche Merkmale von KI-Agenten
KI-Agenten weisen einige wichtige Merkmale auf, und das unabhängig davon, ob sie für Aufgaben in einer offenen Welt entwickelt wurden (wo ihnen eine große Freiheit in Bezug auf die Tools und Ansätze eingeräumt wird, die sie zum Erreichen eines Ergebnisses verwenden können) oder ob sie nur innerhalb strenger Leitplanken mit einer begrenzten Anzahl von Optionen operieren sollen. Zu diesen Merkmalen gehören:
- Autonomie: KI-Agenten arbeiten unabhängig, treffen Entscheidungen, führen Aufgaben auf der Grundlage vordefinierter oder dynamisch generierter Ziele aus und passen sich ohne menschliches Eingreifen an sich verändernde Umgebungen an.
- Zielorientiert: KI-Agenten werden mit bestimmten Zielen im Blick entwickelt und arbeiten effizient darauf zu, diese Ziele zu erreichen.
- Interaktivität: KI-Agenten können mit verschiedenen Workflow-Komponenten interagieren – wie Datenquellen, RPA-Robotern, APIs anderer Softwaresysteme oder sogar menschlichen Benutzern –, um Informationen zu sammeln, Entscheidungen zu treffen und Aufgaben auszuführen.
Framework für die Verwaltung von KI-Agenten
Für die effektive Nutzung von KI-Agenten ist ein robustes Framework unerlässlich. Dieses Framework sollte die folgenden Schlüsselfaktoren berücksichtigen:
- Eingaben und Ausgaben: Die Dokumente, Daten, Benutzeraufforderungen usw., die verwendet werden, um den Arbeitsablauf des KI-Agenten dynamisch zu konfigurieren und mit Kontext zu versehen.
- Zulässige Aktionen und Regeln: Die Aktionen, Funktionen oder APIs, die der Agent verwenden darf, sowie die Leitplanken, um das Verhalten des Agenten zu steuern.
- Agent-Framework: Die zugrunde liegende Struktur, die die Erstellung und den Betrieb von KI-Agenten unterstützt.
- Workflow: Die Prozesse, mit denen KI-Agenten arbeiten und wie sie verwaltet werden. Frameworks sollten ebenfalls festlegen, wann eine Automatisierung abgeschlossen ist und ob menschliches Eingreifen erforderlich ist.
- SLA (Service Level Agreement): Die vereinbarten Leistungsstandards, um sicherzustellen, dass KI-Agenten die Erwartungen an Geschwindigkeit, Genauigkeit und Zuverlässigkeit erfüllen.
- Sicherheitssystem: Mechanismen, die sicherstellen, dass KI-Agenten innerhalb sicherer und ethischer Grenzen arbeiten.
- Audit-Historie: Eine Aufzeichnung der von KI-Agenten ergriffenen Maßnahmen, um Verantwortlichkeit und Transparenz zu gewährleisten.
Ein ideales Framework ist mit begrenzter Schulung einfach zu implementieren, sodass Geschäftsanwender ohne tiefgreifende technische Kenntnisse mit No-Code- und Copilot-Chat-Oberflächen ihre eigenen KI-Agenten und Automatisierungen erstellen können. Angesichts des hohen Innovationstempos im Bereich der KI sollten die Frameworks zudem unabhängig von einem bestimmten Large Language Model arbeiten, um eine langfristige Bindung an einen bestimmten Anbieter zu vermeiden.
Auch eine nahtlose Integration in eine bestehende Automatisierungsplattform kann von Vorteil sein. Die Einbindung neuer KI-Agenten in bestehende Automatisierungsprozesse und Arbeitsabläufe beschleunigt oft die KI-gestützte Kapitalrendite (ROI).
Erstellen von KI-Agenten mit TotalAgility
Intelligente Automatisierungsplattformen wie TotalAgility unterstützen KI-Agenten problemlos. Wir bieten zwei Ansätze zur Erstellung von KI-Agenten in TotalAgility an, nämlich:
KI-gestützte Prozesse: Workflow-Prozesse, die LLMs verwenden, um Entscheidungen zu treffen oder den Pfad zu steuern, dem eine Instanz des Prozesses folgt.
Jeder Schritt im Workflow führt eine bestimmte Aufgabe aus, wie das Abrufen einer E-Mail, einer Website oder eines Dokuments oder das Extrahieren von Daten aus einem verbundenen System über eine API oder einen Roboter. Dann fordert es das Large Language Model auf, diese Inhalte und Informationen anhand definierter Kriterien zu bewerten, die als Eingabeaufforderungen und Systemanweisungen angegeben sind. Der Aufruf des LLM ist nur ein weiterer Schritt im Prozess. Eingabeaufforderungen werden verwendet, um das LLM anzuweisen, eine Antwort in einem Format zurückzugeben, das der Workflow verwenden kann, z. B. als JSON-Daten in einem definierten Format oder oder einem booleschen Wert „true/false“. Dies ermöglicht es dem LLM, zu reagieren und den Fluss oder Pfad zu steuern, der im Workflow eingeschlagen wird.
Benutzerdefinierte LLMs: Diese verfügen über spezifische Schnittstellen, mit denen über Chat-Vervollständigungen interagiert oder als Teil eines Workflows aufgerufen werden kann.
Benutzerdefinierte LLMs sind eine leistungsstarke neue Funktion, die in TotalAgility 8 eingeführt wurde und es möglich machen, mithilfe von Low-Code-Tools im Handumdrehen KI-Agenten zu erstellen. In der Regel nutzen sie vortrainierte Basismodelle (wie GPT4 von Open AI) und erweitern diese um andere automatisierte Aktionen, wie das Suchen nach relevanten Inhalten aus einer Unternehmensdatenbank, das Abrufen von Daten aus dem CRM oder die Verwendung von Internet-Suchergebnissen, um Antworten auf aktuelle und relevante Kontextdaten zu stützen. Benutzerdefinierte LLMs können zudem in jeden Aufruf Aktivitäten einbetten, wie das Speichern von Prompts und Antworten oder das Abgleichen der generierten Ausgabe anhand vorgegebener Kriterien oder sogar mit den Ergebnissen eines anderen LLMs. Einmal erstellt, kann das benutzerdefinierte LLM verwendet werden, um eine Chat-Komponente in einem Webformular zu betreiben oder als Aktivitätsschritt in einem KI-gestützten Prozess aufgerufen zu werden.
Beispiele für KI-Agenten
KI-Agenten lassen sich auf verschiedene Geschäftsanforderungen zuschneiden und bieten eine breite Palette von Funktionen, um bisher schwer zu automatisierende Szenarien zu bewältigen. Hier sind einige Beispiele:
- RAG-Agent: Dieser Agent verwendet Retrieval Augmented Generation, um Dokumente, Daten und Suchergebnisse zu verarbeiten und synthetisierte Informationen oder Erkenntnisse bereitzustellen. Dies verbessert die Antwortqualität von LLMs und reduziert die Häufigkeit falscher oder halluzinierter Antworten.
- E-Mail-Responder: Automatisiert den Prozess des Beantwortens von E-Mails, einschließlich des Verstehens des Inhalts, des Generierens geeigneter Antworten und des Versendens.
- Forschungsagent: Kombiniert RAG, Suchfunktionen und Dokumentenverarbeitung, um Informationen für Forschungszwecke zu sammeln und zu synthetisieren. Zitate und Verweise auf unterstützende Inhalte können automatisch hinzugefügt werden, um die Transparenz und das Vertrauen in die Ergebnisse zu verbessern.
- Kundendienstagent: Bearbeitet Kundenanfragen, indem er auf E-Mails antwortet, bei Bedarf weitere Informationen anfordert und Lösungen anbietet oder Probleme eskaliert.
- Angebots- und Vorschlagsgenerierung: Stellt die erforderlichen Unterlagen und Korrespondenzen für Informationsanfragen und Angebotsanfragen zusammen und überprüft sie.
- Ereignisüberwachung: Überprüft Live-Feeds zu Nachrichten, Preisen, Wettbewerbern oder Informationsdaten, samt automatischer Meldung von und Reaktion auf relevante Ereignisse.
Anwendungsfälle für KI-Agenten
KI-Agenten können in verschiedenen Branchen und Funktionen eingesetzt werden, um die Effizienz und Produktivität zu steigern. Hier sind einige spezifische Anwendungsfälle:
- Kundensupport: KI-Agenten können Kundenanfragen bearbeiten, sofortige Antworten liefern und komplexe Probleme an menschliche Agenten weiterleiten. Dies reduziert die Antwortzeiten und verbessert die Kundenzufriedenheit.
- Vertrieb und Marketing: KI-Agenten können Kundendaten analysieren, Trends prognostizieren und Marketingkampagnen personalisieren. Sie können zudem Follow-up-E-Mails automatisieren und Kundenbeziehungen verwalten.
- Personalwesen: KI-Agenten können Einstellungsprozesse rationalisieren, indem sie Lebensläufe prüfen, Vorstellungsgespräche planen und sogar Erstgespräche führen. Darüber hinaus können Sie das Onboarding und die Schulung von Mitarbeitern verwalten.
- Finanzen: KI-Agenten können routinemäßige Finanzaufgaben wie Rechnungsverarbeitung, Ausgabenmanagement und Finanzberichterstattung automatisieren. Sie können ebenfalls bei der Betrugserkennung und dem Risikomanagement helfen.
- Gesundheitswesen: KI-Agenten können bei der Verwaltung von Patientendaten, der Terminplanung und der Bereitstellung medizinischer Informationen helfen. Sie können zudem die Telemedizin unterstützen, indem sie virtuelle Konsultationen erleichtern.
- Lieferketten-Management: KI-Agenten können die Bestandsverwaltung optimieren, Sendungen verfolgen und Unterbrechungen der Lieferkette vorhersagen. Außerdem können sie die Auftragsabwicklung und das Lieferantenmanagement automatisieren.
Der Einstieg ist einfach
Zwar können viele codebasierte Tools und Frameworks (z. B. LangChain, Azure Semantic Kernel) für die programmgesteuerte Erstellung von KI-Agenten eingesetzt werden, es ist jedoch auch einfach, KI-Agenten mithilfe von Low-Code-Workflows und Automatisierungstools zu erstellen, die von Automatisierungsplattformen wie TotalAgility bereitgestellt werden.
Der integrierte KI-Copilot kann Ihnen sogar dabei helfen, die Logik in Ihrem KI-Agenten zu modellieren – basierend auf Ihrer Beschreibung dessen, was Sie erreichen möchten. Geben Sie einfach die Automatisierungsziele, die Eingaben (Ereignisse, Inhalte, Daten, Kanäle) und Ausgaben (Aktionen, Inhalte, Systemaufrufe usw.) an, und der Copilot erstellt die Schritte für den KI-Agenten für Sie.
Die Zukunft der KI-Agenten
KI-Agenten stellen einen bedeutenden Fortschritt auf dem Gebiet der Automatisierung dar, da sie die Intelligenz von LLMs mit der Fähigkeit zum Handeln kombinieren. Durch den Einsatz von KI-Agenten können Unternehmen komplexe Arbeitsabläufe automatisieren, die Produktivität steigern und eine höhere Effizienz erreichen. Mit der weiteren Entwicklung der Technologie werden sich die möglichen Anwendungen von KI-Agenten erweitern und noch mehr Möglichkeiten für Innovation und Wachstum bieten.
Ein Verständnis der Kernfunktionen, der wesentlichen Merkmale und der praktischen Anwendungsfälle von KI-Agenten versetzt Geschäfts- und Technologieexperten in die Lage, die Leistung von KI besser nutzen, um die unternehmensweite Produktivität und Transformation voranzutreiben.
Das Potenzial von KI-Agenten endet hier jedoch nicht. Ein einzelner KI-Agent kann zwar viel leisten, aber durch die Zusammenführung mehrerer KI-Agenten zu kollaborativen Teams kann jeder Agent sein spezifisches Fachwissen zu verschiedenen Teilen eines Geschäftsprozesses beitragen. Wenn man KI-Agenten entwickelt, die modular und wiederverwendbar sind, können diese größere und komplexere Probleme innerhalb eines organisierten Rahmens lösen, was eine reibungslose Koordination und optimierte Effizienz gewährleistet. Eine modulare und wiederverwendbare Gestaltung von KI-Agenten ermöglicht es Agenten-Teams, als anpassungsfähige Einheiten auf ein gemeinsames Ziel hinzuarbeiten und so die grenzenlosen Möglichkeiten fortschrittlicher KI-gestützter Automatisierung voll auszuschöpfen. Durch den Einsatz von Agententeams sind die Möglichkeiten der KI-gestützten Automatisierung endlos.