- Kein Roboter
- Posts
- OpenAIs neue Modelle 🧠– Copilot automatisiert Computernutzung 🤖 – GPT-4.1 mit 1 Million Token 🚀
OpenAIs neue Modelle 🧠– Copilot automatisiert Computernutzung 🤖 – GPT-4.1 mit 1 Million Token 🚀
Hallo an die Geräte zu Hause,
Na, diese Woche schon deep gereasoned? Falls nein, ranhalten, denn die Arbeitswoche ist kĂĽrzer als sonst! Deswegen gibt es auch den KI-Newsletter heute auch schon am Donnerstag.
Eine Woche voller spannender Entwicklungen liegt hinter uns – von neuen Reasoning-Modellen über Desktop-Automatisierung bis hin zu massiven Kontextfenstern. Alles Tools, die eure Arbeit produktiver und kreativer gestalten können.
Lasst uns direkt eintauchen!
🗞️ Das Wichtigste
(1) OpenAI veröffentlicht neue Reasoning-Modelle o3 und o4-mini
OpenAI hat mit o3 und o4-mini eine komplett neue Modellfamilie vorgestellt, die speziell fĂĽr komplexes Reasoning entwickelt wurde.
Das Flaggschiff o3 setzt neue Maßstäbe in Bereichen wie Programmieren, Mathematik, Wissenschaft und multimodalen Aufgaben. Mit o4-mini bietet OpenAI zudem eine schnellere, kompaktere Alternative, die dennoch leistungsfähiger ist als frühere Mini-Modelle. Was diese Modelle besonders macht: Sie können verschiedene Tools innerhalb von ChatGPT (Websuche, Python, Bildgenerierung etc.) kombinieren, um komplexe Probleme zu lösen.
Besonders spannend ist die parallel veröffentlichte Codex CLI – ein Open-Source Coding-Agent, der Reasoning-Modelle direkt mit Programmieraufgaben verbindet. Wer regelmäßig Code schreibt oder komplexe Problemlösungen benötigt, erhält damit ein deutlich leistungsfähigeres Werkzeug als bisher.
Für Digitalarbeiter bedeutet dies: Die KI wird nicht nur bei der Ideenfindung, sondern auch bei der vollständigen Umsetzung komplexer Projekte immer stärker. Die Kombination aus verbessertem Reasoning und Werkzeugnutzung könnte viele Arbeitsabläufe revolutionieren. [Link]

(2) Microsoft Copilot kann jetzt Computer-Interfaces bedienen
Microsoft hat eine bahnbrechende Funktion in Copilot Studio eingeführt: Die "Computer Use"-Fähigkeit ermöglicht es Nutzern, KI-Agenten zu erstellen, die Websites und Desktop-Anwendungen direkt bedienen können. Diese Agenten können grafische Benutzeroberflächen bedienen, indem sie Schaltflächen anklicken, Menüs auswählen und Felder ausfüllen.
Was dieses Feature besonders wertvoll macht: Es funktioniert auch bei Systemen ohne dedizierte APIs. Dank eingebauter Reasoning-Fähigkeiten kann die KI sich sogar an Änderungen in der Benutzeroberfläche anpassen. Die gesamte Verarbeitung erfolgt auf Microsoft-Infrastruktur, wobei Unternehmensdaten vom Modelltraining ausgeschlossen werden – ein wichtiger Punkt für Datenschutz-sensible Organisationen.
Für Teams in Marketing, Sales und Projektmanagement eröffnet dies völlig neue Automatisierungsmöglichkeiten. Wiederkehrende, zeitraubende Aufgaben, die bisher nicht automatisiert werden konnten, lassen sich nun an KI-Agenten delegieren. Stellt euch vor: Eure KI könnte Dateneingaben in verschiedene Systeme übernehmen, regelmäßige Reports erstellen oder komplexe Workflows über mehrere Anwendungen hinweg ausführen – alles ohne Programmierung oder API-Integration. [Link]

(3) OpenAI veröffentlicht GPT-4.1-Modelle mit gigantischem Kontextfenster
OpenAI hat eine neue GPT-4.1-Modellfamilie speziell für Entwickler veröffentlicht. Diese API-exklusiven Modelle bringen bedeutende Verbesserungen bei Coding-Fähigkeiten und der Befolgung komplexer Anweisungen – und können bis zu 1 Million Token an Kontext verarbeiten.
Die Familie umfasst drei Modelle: GPT-4.1, GPT-4.1 mini und GPT-4.1 nano, die alle GPT-4o bei Entwicklungsaufgaben übertreffen. Das gigantische Kontextfenster von einer Million Token ist bei allen Modellen verfügbar – ein Game-Changer für komplexe Anwendungen. Zum Vergleich: GPT-4o verarbeitet maximal 128.000 Token, während ältere Modelle bei 8.000-32.000 Token lagen.
Ein weiterer Pluspunkt: Die GPT-4.1-Modelle sind kostengünstiger als GPT-4o für typische Anfragen. OpenAI hat die Preise in der gesamten Familie reduziert, was die Entwicklung anspruchsvoller KI-Anwendungen zugänglicher macht.
Für digitale Professionals bedeutet dies: Die Integration umfangreicher Dokumente, ganzer Codebases oder komplexer Datensätze wird deutlich praktischer. Wer Tools auf Basis dieser APIs entwickelt, kann nun Nutzern ermöglichen, mit ganzen Dokumentensammlungen, langen Gesprächsverläufen oder umfangreichen Projekten in einem Durchgang zu arbeiten. [Link]

Werbung: Ausgesperrt von den neuesten Funktionen 🇪🇺 ? Mit einem VPN bleibst du am Ball und kannst die neuesten Tools auch innerhalb der EU schon heute nutzen. Mit NordVPN schon ab 3,99€ im Monat »
🔥 Kurz & Knackig
Anthropic hat Claude um autonome Recherche-Fähigkeiten und Google Workspace-Integration erweitert. Der KI-Assistent kann jetzt selbstständig im Web und in verbundenen Arbeitsdaten recherchieren sowie sicher auf E-Mails, Kalender und Dokumente zugreifen – ein bedeutender Produktivitäts-Boost für Wissensarbeiter. [Link]
OpenAI entwickelt offenbar ein Social-Network-Prototyp, der die umfangreiche ChatGPT-Nutzerbasis nutzen könnte. Das Netzwerk soll ChatGPTs Bildgenerierungsfunktionen integrieren, während CEO Sam Altman bereits Feedback zur potenziellen Plattform einholt. [Link]
Google hat Veo 2, sein Videogenerierungsmodell, für Advanced-Plan-Nutzer in der Gemini-App sowie in Whisk und AI Studio veröffentlicht – ein weiterer Schritt in Richtung multimodaler KI-Kreativwerkzeuge für Content-Ersteller. [Link]
Das war’s für diese Woche. Bis nächsten Freitag mit einer frischen Ladung KI-Updates!