# aiSuite May Release 2026

Mai 2026

Im Mai haben wir die aiSuite an mehreren Stellen gezielt weiterentwickelt, mit einem klaren Fokus auf bessere Nutzererlebnisse, sauberere Wissensgrundlagen und mehr praktische Einsatzmöglichkeiten im Arbeitsalltag. Im aiStudio sorgen Token-Streaming, erweitertes Webcrawling und neue Optionen für Chat-Verlauf und Website-Einbettung dafür, dass Chatbots und Avatare schneller, konsistenter und präziser nutzbar werden. Im aiWorkplace stehen vor allem neue Tool-Integrationen und zusätzliche Modelle im Mittelpunkt, die dir mehr Flexibilität geben, aber auch bewusst gesteuert werden sollten.

Wie immer gilt: Wenn du wissen möchtest, welche Funktionen für euren Einsatz besonders sinnvoll sind, unterstützt dich unser Customer-Success-Team gerne.

# Chatbots, Telefonbots und Avatare im aiStudio

# Schnelleres Antworterlebnis durch Token-Streaming

Mit Release 6.36 wurde Token-Streaming eingeführt. Antworten werden nun standardmäßig bereits während der Generierung angezeigt, statt erst komplett fertig berechnet zu werden. Dadurch verkürzt sich die wahrgenommene Wartezeit deutlich und der Chat wirkt direkter und natürlicher.

Chatbot mit Token-Streaming
Chatbot mit Token-Streaming

Für Chatbots lässt sich das unter Konfiguration > Chatbot-Interface > Design steuern. Für Avatare findest du die Option unter Konfiguration > Avatar-Interface > Chat-Modus.

# Bessere Antwortqualität durch saubereres Webcrawling

Im Mai haben wir auch das Webcrawling im aiStudio erweitert. Du kannst jetzt HTML-Tags und CSS-Klassen definieren, die beim Crawling nicht in die Chunks übernommen werden sollen. Das klingt technisch, hat in der Praxis aber einen klaren Vorteil: Deine Wissensbasis wird sauberer, irrelevante Seitenelemente wie Navigationsbereiche, Teaser oder Layout-Reste landen seltener im Suchindex.

Konfiguration von ignoriertem HTML und CSS beim Website-Crawling
Konfiguration von ignoriertem HTML und CSS beim Website-Crawling

Gerade bei größeren Websites oder stark template-basierten Seiten hilft dir das, die Wissensbasis sauberer aufzubauen und Störsignale im Index zu reduzieren.

# Nahtloseres Nutzererlebnis durch Chat-Verlauf und flexiblere Website-Einbettung

Auch die Einbettung von Chatbots auf Websites wurde im Mai weiter verbessert. Für als Placeholder eingebundene Chatbots gibt es jetzt zusätzliche Konfigurationsmöglichkeiten: Die Anzeigedauer des Begrüßungsfähnchens ist einstellbar und auf Wunsch kann es nur einmal angezeigt werden.

Zusätzlich kann der Chat nun beim Navigieren über mehrere Seiten hinweg geöffnet bleiben. Passend dazu lässt sich jetzt für jeden Chatbot und Avatar konfigurieren, ob und wie lange der Konversationsverlauf gespeichert wird. Wenn die Funktion aktiv ist, bleibt der bisherige Chat nach dem Schließen und erneuten Öffnen sichtbar.

Für Chatbots findest du die Einstellung unter Konfiguration > Chatbot-Interface > Verhalten, für Avatare unter Konfiguration > Avatar-Interface > Chat-Modus.

Der Nutzen liegt vor allem in einer konsistenteren Nutzerführung: Wenn ein Chat über mehrere Seiten hinweg erhalten bleibt und der Verlauf nicht verloren geht, lassen sich Gespräche einfacher fortsetzen. Das ist besonders hilfreich bei längeren Entscheidungsprozessen, komplexeren Anliegen oder dann, wenn dein Bot auf andere Seiten weiterleitet.

# aiWorkplace: Dein CompanyGPT

# Tool-Integrationen: Direkt im Chat mit externen Systemen arbeiten

Im aiWorkplace lassen sich Integrationen jetzt zentral über den Menüpunkt Integrationen verbinden. Anschließend kannst du sie zusammen mit Tools über das Plus-Symbol im Chat auswählen, durchsuchen und nutzen.

Zum Portfolio gehören inzwischen unter anderem Outlook, Teams, Excel, OneDrive, SharePoint, Google Calendar, Gmail, Google Drive, Google Sheets, Confluence, Jira und Notion.

Integrations-Seite im aiWorkplace
Integrations-Seite im aiWorkplace

Der große Vorteil: Du musst Inhalte nicht mehr erst aus anderen Systemen herauskopieren. Stattdessen kann der aiWorkplace direkt auf angebundene Dienste zugreifen. So kannst du zum Beispiel E-Mails zusammenfassen, Confluence-Inhalte als Kontext nutzen, Jira-Tickets abrufen oder auch Aktionen auslösen, etwa E-Mails versenden, Termine anlegen oder Dokumente erstellen.

Nutzung der Outlook-Integration zur Erstellung von E-Mails
Nutzung der Outlook-Integration zur Erstellung von E-Mails

Ein ehrlicher Hinweis dazu: Tool-Integrationen dieser Art sind technisch anspruchsvoll und hängen stark von den APIs der jeweiligen Anbieter ab. Zuverlässigkeit und Stabilität sind branchenweit – auch bei Wettbewerbern – noch keine Selbstverständlichkeit. Das spiegeln auch unsere internen Tests wider. Für ein konsistenteres Ergebnis empfiehlt sich, Integrationen in einer frischen Chat-Session zu nutzen, die gewünschte Integration bewusst anzuwählen und Anfragen präzise und schrittweise zu formulieren.

In unseren Tests haben sich vor allem diese Szenarien als vergleichsweise verlässlich erwiesen:

  • Outlook: Anzeige und Zusammenfassung der letzten E-Mails sowie E-Mail-Versand und -Entwurf funktionieren gut. Stichwort- oder absenderbasierte Suche ist derzeit noch unzuverlässiger.
  • Gmail: Stichwortbasierte Suche mit konkretem Zeitraum funktioniert gut, z. B. „Zeig mir PayPal-E-Mails der letzten 7 Tage". Auch die Zusammenfassung der letzten ungelesenen E-Mails klappt verlässlich. Absenderbasierte Suche ist wie bei Outlook noch etwas unzuverlässig.
  • Google Calendar: Abfrage bevorstehender Termine sowie das Erstellen von Events mit klar angegebenem Titel, Start- und Endzeit funktionieren gut.
  • Teams: Die Teams-Integration eignet sich am besten in Agenten, in denen eine Chat- oder Channel-ID bereits hinterlegt ist – etwa um automatisiert in einen Kanal zu posten oder Nachrichten auszulesen. Im freien Chat ist die Nutzung unpraktisch, da Teams zur Zuordnung zwingend eine Chat-ID benötigt, die Nutzer:innen in der Regel nicht zur Hand haben.

# Neue Modelle: Mehr Auswahl, aber am besten bewusst kuratieren

Auch bei den Modellen hat sich im Mai einiges getan. Neu hinzugekommen sind unter anderem Anthropic Claude Opus 4.7, Gemini 3.5 Flash und Gemini 3.1 Flash Lite. Zusätzlich wurde das Open-Source-Portfolio deutlich erweitert, unter anderem um neue Modelle von Google, Qwen, DeepSeek, NVIDIA, MiniMax, Moonshot AI und Z.ai.

Die größere Auswahl ist grundsätzlich ein Vorteil, sollte aber in Organisationen bewusst gesteuert werden. Zu viele Optionen überfordern viele Nutzer*innen eher, als dass sie helfen. Sinnvoller ist eine kuratierte Modellliste mit klaren Empfehlungen für typische Aufgaben. Unten findet ihr unsere Empfehlungen zu den neuen Modellen.

Preis- und Qualitätsindikation ausgewählter Modelle
Preis- und Qualitätsindikation ausgewählter Modelle

# Unsere Empfehlung: Diese Modelle solltest du dir jetzt ansehen

# Gemini 3.5 Flash

Gemini 3.5 Flash ist aus unserer Sicht aktuell ein sehr gutes Alltagsmodell für viele Organisationen. Das Modell ist schnell, multimodal und mit einem Kontextfenster von 1 Million Token auch für längere Dokumente, Recherchen und umfangreichere Arbeitskontexte gut geeignet. Bei Bedarf kann "erweitertes Denken" zugeschaltet werden, wenn eine Aufgabe etwas mehr Tiefe erfordert.

Empfehlung: Gut geeignet für Recherchen, Zusammenfassungen, Dokumentenanalyse und viele typische Wissensaufgaben im Alltag.

# Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite ist vor allem dann interessant, wenn Kosten und Volumen im Vordergrund stehen. Das Modell ist sehr günstig und eignet sich deshalb gut für einfache, häufige Aufgaben wie Übersetzungen, kurze Zusammenfassungen oder erste Entwürfe.

Empfehlung: Eine gute Ergänzung für einfache Standardaufgaben mit hohem Volumen. Für anspruchsvollere Aufgaben würden wir eher Gemini 3.5 Flash empfehlen.

# Claude Opus 4.7

Claude Opus 4.7 ist vor allem für komplexere Aufgaben interessant. Das betrifft zum Beispiel längere Analysen, anspruchsvolleres Schreiben, strukturierte Ausarbeitung und komplexeres Coding. Gegenüber dem Vorgänger wurden insbesondere Coding und Instruction Following verbessert. Wichtig ist aber der neue Tokenizer: Je nach Inhalt können für dieselbe Eingabe mehr Tokens anfallen als bisher. Dadurch können die Gesamtkosten steigen, obwohl der Preis pro Token gleich bleibt.

Empfehlung: Sinnvoll für Aufgaben, bei denen Qualität und mehrschrittige Bearbeitung klar wichtiger sind als Kosten. Für kostensensitive Unternehmen kann es sich lohnen, eher beim Vorgänger Opus 4.6 zu bleiben. Für breite Standardnutzung würden wir es eher nicht als erstes Modell setzen.

# DeepSeek V4 Pro

DeepSeek V4 Pro ist eine interessante Option für Teams, die ein leistungsfähiges Modell mit gutem Preis-Leistungs-Verhältnis suchen. Es eignet sich besonders für strukturierte Aufgaben wie Coding, Datenanalyse und umfangreichere Textverarbeitung. Im Vergleich zu vielen proprietären Spitzenmodellen ist es deutlich günstiger.

Empfehlung: Lohnt sich für Teams, die technische oder volumenintensive Aufgaben bearbeiten und dabei bewusst auf Effizienz achten.

# Weitere Modelle, die einen Blick wert sein könnten

Neben den vier genannten gibt es einige Neuzugänge, die je nach Anforderung interessant sein können:

  • DeepSeek V4 Flash als leichtere DeepSeek-Variante für einfachere oder kostenkritische Aufgaben.
  • Kimi K2.6 von Moonshot AI ist vor allem für agentische Workflows interessant und wird in der Praxis häufig für mehrstufige Aufgaben positiv bewertet.
  • Gemma 4 26B A4B aus Googles Open-Source-Reihe ist besonders dann relevant, wenn ein offeneres Modell aus einem etablierten Google-Ökosystem gewünscht ist.
  • Qwen3.5 122B A10B ist ein leistungsstarkes Open-Source-Modell, das vor allem bei anspruchsvolleren Wissens- und Textaufgaben interessant sein kann, analog zu den Claude-Modellen.

Für diese Modelle würden wir aktuell keine breite Standardempfehlung aussprechen. Bei konkreten Anforderungen kann sich ein gezielter Test aber lohnen.

# KI-Power-Hour: Content-Strategie für KI

Guter Content ist die Grundlage jeder erfolgreichen KI-Anwendung. Doch wie müssen Inhalte strukturiert, segmentiert und gepflegt werden, damit KI-Systeme verlässlich damit arbeiten können?

In dieser KI-Power-Hour schauen wir auf die Schnittstelle zwischen Content Management und KI und sprechen darüber, worauf es bei der inhaltlichen Vorbereitung für Eure KI-Use-Cases ankommt.

Unser Gast Christoph Zensen, Produktmanager bei pirobase imperia, verbindet fundiertes Wissen aus Content-Management-Systemen mit praktischer Erfahrung aus KI-Projekten.

Im Fokus stehen unter anderem:

  • Wie wählt man geeigneten Content für einen Chatbot aus?
  • Wie werden Inhalte sinnvoll segmentiert und strukturiert?
  • Wie spielen ein Webseiten-CMS und ein KI-Tool wie aiStudio effektiv zusammen?
  • Wie kann Content für KI-Anwendungen gezielt getestet und optimiert werden?

Die KI-Power-Hour richtet sich an alle, die ihre Inhalte nicht nur verwalten, sondern strategisch für KI nutzbar machen möchten, insbesondere an Content-Verantwortliche für Webseiten und digitale Plattformen sowie KI-Projektverantwortliche.

Freut euch auf praxisnahe Einblicke, konkrete Empfehlungen und viel Raum für Fragen aus der Community.

Mehr erfahren und anmelden: Kauz AI Power Hour