• Kein Roboter
  • Posts
  • ChatGPT Code Interpreter: Praxistipps und Anwendungsbeispiele

ChatGPT Code Interpreter: Praxistipps und Anwendungsbeispiele

Was genau der Code Interpreter ist, wie er funktioniert, und was man alles damit anstellen kann, erfährst du in diesem Post.

Endlich ist der heiß erwartete ChatGPT Code Interpreter von OpenAI für alle Plus Accounts ($20/Monat) verfügbar. Und die Funktionen haben es in sich – er kann deutlich mehr als das „Dolmetschen“, das der Name nahelegt.

Was genau der Code Interpreter ist, wie er funktioniert, und was man alles damit anstellen kann, erfährst du in diesem Post.

Was ist die Funktionsweise vom ChatGPT Code Interpreter?

Der Code Interpreter ist eine Funktion, die ChatGPT Plus Nutzer*innen zur Verfügung steht, mit der Python-Code in einer Python-Sandbox-Umgebung ausgeführt werden kann, um eine beliebige Aufgabe zu erledigen. Das klingt erst einmal wie eine Funktion für Programmierer*innen, aber kann bei einer Vielzahl von verschiedenen Aufgaben helfen.

Code Interpreter kann also Python-Code erzeugen und ausführen.

Damit kannst du etwa Berechnungen durchführen, die dann mithilfe eines Python Scripts erledigt werden, statt nur mit dem Language Modell, und damit nachvollziehbarer und häufiger korrekt sein sollten:

Neben dem Erzeugen und Ausführen von Code auf Basis der Chateingabe, ist es möglich Dateien hochzuladen.

Für den Upload wird ein temporärer Speicherplatz zur Verfügung gestellt und eine Vielzahl von Dateitypen akzeptiert, zum Beispiel:

  1. Textdateien (.txt, .csv, .json, .xml etc.): Diese Dateien können verwendet werden, um Textdaten bereitzustellen, die verarbeitet oder analysiert werden sollen.

  2. Datenbankdateien (.db, .sql etc.): Diese Dateien können verwendet werden, um Datenbanken bereitzustellen, die abgefragt oder manipuliert werden sollen.

  3. Bild- und Medien-Dateien (.jpg, .png, .mp3, .mp4 etc.): Diese Dateien können verwendet werden, um Bild- oder Mediendaten bereitzustellen, die analysiert oder manipuliert werden sollen.

  4. Dokumentdateien (.pdf, .docx etc.): Diese Dateien können verwendet werden, um Dokumentdaten bereitzustellen, die analysiert oder manipuliert werden sollen.

  5. Python-Dateien (.py, .ipynb): Diese Dateien können verwendet werden, um Python-Code bereitzustellen, der ausgeführt werden soll.

Im nächsten Schritt kann mit den hochgeladenen Dateien gearbeitet werden. Und hier wird es richtig interessant, denn für Python existieren zahlreiche Packages, mit deren Hilfe Funktionen wie zum Beispiel Videobearbeitung möglich sind.

Das Gute ist: damit muss man sich eigentlich gar nicht auskennen! Für die Nerds, die Liste der integrierten Packages ist wie folgt:

Quelle: @Gavriel_Cohen auf Twitter

Sobald also diese zwei Funktionalitäten – Dateien hochladen & Code ausführen – kombiniert werden, eröffnen sich spannende Möglichkeiten. Zum Beispiel:

  • Mit OCR den Text aus einem Bild oder einer PDF-Datei extrahieren

  • Die Tonspur aus einem Video extrahieren

  • Ein Video in 3 Teile schneiden

  • Eine CSV Datei hochladen und die darin enthaltenen Daten analysieren und visualisieren

  • Sämtliche „chatte mit einem Dokument“ Operationen durchführen

  • QR-Codes generieren

  • Ein mathematisches Problem lösen

Du siehst schon die disruptive Natur des Ganzen – einige Start-ups können ohne Probleme vom Funktionsumfang des Code Interpreters ersetzt werden. Wie das Ganze am besten in der Praxis funktioniert, folgt nun in diesem Artikel.

Code Interpreter aktivieren

Bevor du loslegen kannst, musst du den Code Interpreter unter SettingsBeta features aktivieren:

Danach musst du ihn in jedem Chat, in dem du darauf zugreifen willst, auswählen:

Beispiel 1: Daten analysieren und visualisieren

Für diesen Selbstversuch habe ich mich an Daten gewagt, an die sich nur die mutigsten Analysten und CSV-Öffner trauen: die Daten der Bundesrepublik!
Unter govdata.de gibt es zahlreiche Daten über Deutschland – ich habe mich für ein CSV entschieden, das den Namen „Einnahmen und Ausgaben der Bundesrepublik Deutschland für technische Forschung und Entwicklung (…)“ trägt.

Mein Ziel dieser kleinen Übung: Verstehen, was das für Daten sind, und welche interessanten Erkenntnisse darin stecken könnten.

Beim Öffnen der CSV am MacBook ahnt man schon, dass es sich um Material mit Potenzial für posttraumatische Belastungsstörungen handelt:

Nach ein wenig hin und her – hier der gesamte Chatverlauf – lassen sich einzelne Zeilen über die Jahre hinweg visualisieren. Das ist schon mal ganz cool, wenn man sich die Ausgangsdaten ansieht, in denen jedes Jahr 3 Spalten hat:

Es war aber wünschenswert, einen besseren Überblick über die Daten zu bekommen, statt spezifisch in einzelne Zeilen hineinzuzoomen. Nach noch mehr hin und her, vor allem um herauszufinden, was ich eigentlich will, haben wir dieses gestapelte Flächendiagramm erstellt, welches ich eigentlich ganz hilfreich finde:

Das ist jetzt nur ein semi-beeindruckendes Beispiel von mir, welches vor allem die prinzipielle Herangehensweise aufzeigen soll.

Ich verlinke an dieser Stelle noch einige weitere sehenswerte Beispiele zum Thema Code Interpreter und Datenanalyse/-visualisierung:

US-Leuchttürme in einem GIF visualisiert

Customer Lifetime Value Berechnungen

Gemeldete KFZ in Berliner Stadtteilen

Weitere Anwendungsbeispiele

Ein Video aus einem GIF erstellen und einen Zoomeffekt hinzufügen

Eine Farbpalette aus einem Foto extrahieren und als PNG speichern

Ein Asteroiden Shooter Game erstellen

… wird noch weiter ergänzt! Wenn du spannende Anwendungen findest, schicke sie uns gerne durch!