#
Verfügbare Large Language Models (LLMs)
Hier finden Sie eine Übersicht der im aiStudio aktuell verfügbaren Large Language Models (LLMs). Diese Übersicht basiert auf Herstellerangaben und zeigt für jedes Modell Kernfähigkeiten, potenzielle Grenzen sowie Einsatzempfehlungen – damit Sie KI-Lösungen optimal auf Ihre Use Cases abstimmen können.
Alle in aiStudio angebotenen Modelle werden innerhalb der EU gehostet und entsprechen somit vollständig den Anforderungen der DSGVO – für maximale Datensicherheit und Datenschutz.
#
OpenAI
Modell | Beschreibung | Context Window | Training abgeschlossen |
---|---|---|---|
GPT-5 | Aktuelles Flagship-Modell von OpenAI mit multimodalen Fähigkeiten und erweiterten Funktionen im Textverständnis, logischem Schließen (Reasoning), Code-Generierung und agentenbasierten Aufgaben in verschiedenen Bereichen. Stärken: Verbesserte Reasoning-Fähigkeiten und Programmierleistung ️Zu beachten: hohe Latenz Use Cases: Reasoning-RAG, Data Collection-Agenten |
400k | Oktober 2024 |
GPT-5 nano | Schnelle Variante von GPT-5, optimiert für Zusammenfassung, Klassifikation. Stärken: Multimodalität, Function Calling ️Zu beachten: Eingeschränkte Reasoning-Fähigkeiten im Vergleich zum großen Modell, präzises Prompting notwendig, nicht für umfassende, mehrstufige Anwendungen geeignet, mögliche Einschränkungen bei Multimodalität, höhere Latenz im Vergleich zu anderen mini-/nano-Modellen Use Cases: Einfachstes RAG: klare, fokussierte Aufgaben wie Zusammenfassung, Klassifikation, einfache Antworten. |
400k | März 2024 |
GPT-4.1 | Präzisionsmodell für textbasierte Standardanwendungen und Inhaltsoptimierung. Führend im nicht-reasoning Bereich. Stärken: Textqualität, Prompt-Effizienz, Mehrsprachigkeit, Multimodalität, Function Calling, hohe Geschwindigkeit. ️Zu beachten: Kein Advanced Reasoning. Use Cases: Allrounder für komplexeres RAG und Custom Agenten. |
1 Mio | Juni 2024 |
GPT-4.1 mini | Kompakte Lösung für schnelle Textinteraktionen und Routineanfragen. Stärken: Mehrsprachigkeit, Multimodalität, Function Calling, hohe Geschwindigkeit. Zu beachten: Verlangt exaktes Prompting. Use Cases: Simpleres RAG, einfache Agenten. |
1 Mio | Juni 2024 |
GPT-4.1 nano | Ultrakompakte Basisversion für einfache Dialoge und Echtzeit-Applikationen. Besonders geeignet für einfache Textverarbeitung und kurze Hilfestellungen. Stärken: Höchstgeschwindigkeit, Massenskalierung, Mehrsprachigkeit, Multimodalität, Function Calling. Zu beachten: Nur Basisfunktionalitäten, verlangt exaktes Prompting. Use Cases: Einfachstes RAG: Keyword-Abfragen, Statuschecks. |
1 Mio | Juni 2024 |
o4 mini | Experte für strukturierte Datenextraktion und automatisierte Analyseprozesse mit hoher logischer Präzision. Stärken: Systematische Informationsgewinnung, logische Verknüpfung, komplexe Analysen, Mehrsprachigkeit, Multimodalität, Function Calling, hohe Geschwindigkeit. Zu beachten: Längere Verarbeitungszeit bei hochkomplexen Anfragen. Use Cases: Reasoning-RAG, strukturierte Datenextraktion, Data Collection und Custom Agenten. |
200k | Juni 2024 |
o3 mini | Premium-Lösung für theoretische Fragestellungen und wissenschaftliches Reasoning mit algorithmischer Tiefe. Stärken: Forschungsorientierte Analyse, theoretische Modellierung, kausale Schlussfolgerungen, Mehrsprachigkeit, Function Calling. ️Zu beachten: Höhere Ressourcennutzung für Maximalleistung, mittlere Geschwindigkeit. Use Cases: Reasoning-RAG, Analyse, Hypothesenprüfung, Data Collection und Custom Agenten. |
200k | Februar 2024 |
GPT-4 Turbo | Allrounder mit breitem Wissensspektrum und zuverlässiger Performance für diverse Anwendungen. Stärken: Ausgewogene Leistung, bewährte Stabilität, Mehrsprachigkeit, Multimodalität, Function Calling. ️Zu beachten: Modell mit veralteter Architektur, deshalb geringe Antwortgeschwindigkeit – trotz des Namens "Turbo". Use Cases: Komplexeres RAG und Custom Agenten. |
128k | Dezember 2023 |
GPT-4o | („o“ für „omni“) Vollständig multimodales Modell für Echtzeit-Interaktionen mit Text, Bild und Audio, optimiert für flüssige Dialoge und intuitive Anwendungen. Stärken: Vollständige Multimodalität, fließende, natürliche Dialoge, Function Calling. Zu beachten: Erfordert präzises Prompting für optimale Ergebnisse, variable Antwortgeschwindigkeit, zeigt Leistungseinbußen bei sehr komplexen Aufgaben oder hohem Datenvolumen. Use Cases: Simpleres RAG, einfache Agenten. |
128k | Oktober 2023 |
GPT-4o mini | Balanciert Geschwindigkeit und Multimodalität für alltägliche Bild-Text-Anwendungen mit konsistenter Performance. Stärken: Extrem schnell, Mehrsprachigkeit, Multimodalität, Function Calling. ️ Zu beachten: Nur einfache Tasks. Use Cases: Einfaches RAG, einfache Agenten mit Tools. |
128k | Oktober 2023 |
#
Anthropic
Modell | Beschreibung | Context Window | Training abgeschlossen |
---|---|---|---|
Claude 4 Sonnet | Top-Modell für anspruchsvolle Programmiererklärungen und technische Konzeptentwicklung. Es hat beeindruckender Leistung für Text-Generierung, Tool-Nutzung, Suche, Agentensuche mit der richtigen Geschwindigkeit. Stärken: Code-Verständnis, Technische Kreativität, Führend in Code/Tools, Mehrsprachigkeit, Multimodalität, Function Calling, hohe Geschwindigkeit. ️Zu beachten: Sprachpriorisierung: Bei mehrsprachigen Prompts Dominanz von Englisch – explizite Sprachangabe erforderlich. Use Cases: Premium-RAG: Forschung, Analysen, starkes Reasoning, Agenten mit Tools. |
200k | Mai 2025 |
Claude 3.7 Sonnet | Entschlüsselt komplexe logische Zusammenhänge mit verbesserter Abstraktionsfähigkeit. Stärker im logischen Reasoning für anspruchsvolle Fragestellungen mit verbesserter Verarbeitungstiefe. Stärken: Logisches Denken, Schlussfolgerungsstärke, Argumentationsstärke, Mehrsprachigkeit, Multimodalität, Function Calling. ️Zu beachten: Unstabile Mehrsprachigkeit, Geschwindigkeit unter 3.5, sprachspezifische Anforderungen erfordern präzise Prompt-Formulierungen. Use Cases: Komplexeres RAG, SQL-Agenten, Agenten mit Tools. |
200k | November 2024 |
Claude 3.5 Sonnet | Meistert mehrschichtige Textanalysen und natürliche Dialoge mit herausragendem Sprachgefühl. Das Modell ist auch sehr gut in Logik, Mathe, Antwortqualität. Stärken: Sprachliche Fähigkeiten, Kontexttiefe, Argumentationsklarheit, Mehrsprachigkeit, Function Calling, versteht Kontext und Nuancen außergewöhnlich gut. Zu beachten: Neigt zu sehr ausführlichen Antworten und überflüssiger Höflichkeit, nicht multimodal. Use Cases: Sehr komplexeres RAG, SQL-Agenten, Agenten mit Tools. |
200k | April 2024 |
#
Meta
Modell | Beschreibung | Context Window | Training abgeschlossen |
---|---|---|---|
Llama 3.1 405B | Bewährte Open-Source-Lösung für generelle Textanwendungen mit breitem Wissensspektrum. Stärken: Open Source, Mehrsprachigkeit, Grundlagenwissen Zu beachten: Langsam bei komplexen Prompts, Qualität stark abhängend von Finetuning, keine Multimodalität, kein Function Calling, repetitive Antworten, benötigt starkes Prompting. Use Cases: Simpleres RAG: Basis-QA. |
128k | Juli 2024 |
#
Mistral
Modell | Beschreibung | Context Window | Training abgeschlossen |
---|---|---|---|
Mistral Small | Marktführer in der Kategorie der kleinen Modelle mit der neuesten Version v3, die im Januar 2025 veröffentlicht wurde. Liefert blitzschnelle Antworten für Alltagsanfragen und einfache Übersetzungen. Stärken: Echtzeit-Performance, Mehrsprachigkeit, Multimodalität, Function Calling, hohe Geschwindigkeit. Zu beachten: Begrenzte Analysekomplexität, kleines Kontextfenster. Use Cases: Gut für einfache RAG-Tasks. |
32k | Januar 2025 |
Pixtral | Spezialist für Bildinterpretation und visuell-textuelle Zusammenhänge. Es ist ein Modell mit 12 Milliarden Parametern, das Bildinhalte in präzise Textbeschreibungen transformieren kann. Stärken: Bildverständnis, visuelle Intelligenz, schnelle Objekterkennung. Zu beachten: Textfokus sekundär. Use Cases: Visuelles RAG: Bild-Text-Korrelation, Objektidentifikation. |
128k | September 2024 |
Mistral Large | Ist das fortschrittlichste LLM von Mistral AI. Löst technische und wissenschaftliche Problemstellungen mit tiefem Fachverständnis. Es ist hervorragend für akademische Texte und Code-Erklärungen. Stärken: Komplexe Analysen, technisches Verständnis, Code-Fähigkeiten, Mehrsprachigkeit, Function Calling. Zu beachten: Antwortzeit bei Maximalauslastung erhöht, neigt zu Halluzinationen beim unsauberem Prompting, keine Multimodalität, kleines Kontextfenster, inkonsistent mit Agenten mit Tools. Use Cases: Komplexeres RAG, Custom Agenten. |
32k | unbekannt |
#
Google
Modell | Beschreibung | Context Window | Training abgeschlossen |
---|---|---|---|
Gemini 2.5 Flash | Ist die neueste Version des Reasoning Modells mit extra Speed mit den besten Fähigkeiten für multimodale Aufgaben. Es ist besonders gut darin, verschiedene Datenarten zu kombinieren und komplexe Analysen durchzuführen. Stärken: Beste Multimodalität, komplexe Synthese, Mehrsprachigkeit, Function Calling, hohe Geschwindigkeit. Zu beachten: Ungeeignet für Data Collection Agenten, folgt nicht immer den Formatierungsanweisungen, Tool-Usage erfordert teils expliziteres Prompting. Use Cases: Komplexeres RAG: Multidokumenten-Analyse, Cross-Data-Synthese, Custom Agenten. |
1 Mio | Juni 2025 |
Gemini 2.0 Flash | Bietet zuverlässige Leistung für kreative Aufgaben und textbasiertes Reasoning mit reduzierter Halluzinationsneigung. Stärken: Kreativität, Präzision, Textqualität, hohe Geschwindigkeit, Multimodalität. Zu beachten: Folgt nicht immer den Formatierungsanweisungen, ungeeignet für Data Collection Agenten. Use Cases: Simpleres RAG: Dokumenten-QA, Custom Agenten, ungeeignet für Tool-Calls. |
1 Mio | August 2024 |
Gemini 1.5 Flash | Analysiert große Dokumente und Datenmengen extrem schnell und effizient mit branchenführendem Kontextfenster. Ideal für Forschungsaufgaben und Detailrecherchen. Stärken: Schnellste Gemini-Version, große Kontextverarbeitung Zu beachten: Folgt nicht immer den Formatierungsanweisungen. Use Cases:: Sehr starke RAG-Performance, besonders bei langen Kontexten, Custom Agenten, ungeeignet für Tool-Calls. |
1 Mio | September 2024 |