ChatGPT bekommt Agent-Modus: KI erledigt jetzt Aufgaben im Web

Veröffentlicht von Timo Altmeyer am 18. Juli 2025

Mit dem neuen Agent-Modus durchsucht ChatGPT Webseiten, füllt Formulare aus, klickt Buttons und kann damit sogar Reisen buchen, Reservierungen vornehmen oder komplexe Aufgaben automatisiert lösen. In Großbritannien ist der Rollout bereits gestartet, Deutschland soll bald folgen.

OpenAI ChatGPT Agent Hero

Vom Chatbot zum digitalen Assistenten

Was bisher nur als KI-gestützter Dialog funktionierte, wird mit dem Agent-Modus zum echten Werkzeug. ChatGPT kann nun aktiv handeln und zwar auf einem isolierten virtuellen Rechner im Hintergrund. Dort klickt sich die KI durch Webseiten, tippt Texte, ruft Daten ab und interagiert mit grafischen Benutzeroberflächen, als wäre ein Mensch am Werk.

Technisch gesehen kombiniert der Agent-Modus zwei bestehende OpenAI-Tools. Den Operator, der Webseiten bedienen kann und Deep Research, ein Recherche-Tool für mehrstufige Analysen. Mit dem Agent-Modus verschmelzen beide Ansätze, womit ChatGPT in Echtzeit zwischen Informationsbeschaffung und Handlung wechseln kann.

Der neue Modus zeigt seine Stärken vor allem dann, wenn es um konkrete Aufgaben geht, die sonst Zeit und Nerven kosten. Hier ein paar Beispiele, wie ChatGPT im Agent-Modus ganz praktisch eingesetzt werden kann:

  • Reiseplanung vom Flug bis zur Hotelbuchung
    Der Agent-Modus kann komplexe Reiseplanungen eigenständig durchführen. Er recherchiert Flüge, vergleicht Verfügbarkeiten, analysiert Hotelbewertungen und bereitet Buchungen automatisiert vor. Besonderheiten wie Gepäckoptionen, Lage des Hotels oder Stornobedingungen werden dabei berücksichtigt. Die finale Freigabe erfolgt stets durch den Nutzer.
  • Zielgerichtetes Online-Shopping
    Für gezielte Produktsuchen kann ChatGPT Webshops nach bestimmten Kriterien durchforsten. Dabei werden Preislimits, Designwünsche, Bewertungen und Versanddetails beachtet. Geeignete Produkte werden strukturiert aufbereitet und auf Wunsch im Warenkorb abgelegt, inklusive direkter Links für den finalen Kauf.
  • Restaurantrecherche mit Reservierung
    Auch bei der Suche nach geeigneten Restaurants unterstützt der Agent-Modus. Er analysiert Rezensionen, Verfügbarkeiten und Menüangebote, achtet auf spezielle Anforderungen wie vegetarische Küche oder Barrierefreiheit und reserviert bei Bedarf direkt über die Webseite des Anbieters.

 

Nutzer behalten die Kontrolle

Trotz aller Automatisierung bleibt der Mensch die Nummer 1 in der Entscheidungsschleife. Bevor ChatGPT eine E-Mail abschickt, ein Formular überträgt oder eine Buchung durchführt, holt es sich aktiv die Zustimmung des Nutzers. Hochsensible Aktionen wie Finanztransaktionen oder rechtliche Beratung sind grundsätzlich ausgeschlossen.

Wer möchte, kann den Browser jederzeit übernehmen, Aufgaben abbrechen oder nur bestimmte Aktionen gezielt freigeben. OpenAI will so sicherstellen, dass der Agent-Modus keine Blackbox ist, sondern transparent und kontrollierbar bleibt.

Auch für Arbeitsabläufe interessant

Neben privaten Alltagsaufgaben lässt sich der Agent-Modus auch in professionelle Workflows integrieren. ChatGPT kann etwa Wettbewerbsanalysen durchführen, Präsentationen erstellen oder Daten in Tabellenform auswerten. Über verschiedene Schnittstellen lässt sich der Agent direkt mit anderen Tools wie Kalendern, E-Mail-Postfächern oder Projektmanagement-Systemen verbinden.

In ersten Tests zeigte sich der Agent-Modus deutlich leistungsstärker als bisherige GPT-Modelle und übertrifft laut OpenAI in vielen Bereichen sogar menschliche Benchmarks.

Bald auch in Deutschland?

Noch ist der neue Agent-Modus nur für Nutzerinnen und Nutzer in Großbritannien verfügbar, vorausgesetzt sie nutzen ein Pro-, Plus- oder Team-Abo. Wann genau die Funktion in Deutschland startet, hat OpenAI noch nicht bekannt gegeben. Der Launch soll laut OpenAI jedoch zeitnah erfolgen.

Quelle: OpenAI Pressemeldung

Hinterlasse hier deinen Kommentar