Fun mit KI - Project Lead GmbH

KI ist seit der Veröffentlichung von ChatGPT in aller Munde. Natürlich habe ich die Fähigkeiten des Modells schon ausprobiert und auch schon den einen oder anderen Text damit erstellt. Spannende Anwendungsfälle gibt es ja schon einige, also warum nicht auch mal selber ausprobieren was alles möglich ist. Da Programmieren nicht zu meinen Fähigkeiten gehört, habe ich mich mit Riccardo Causo zusammengesetzt. Als Software Architekt ist er der Profi und hat Entwicklungsumgebung und API-Keys besser im Griff als ich.

Wir haben uns also kürzlich an einem Nachmittag in ein Kaffee gesetzt und uns überlegt, was denn spannend wäre. Erstmal haben wir den neuen Chatbot von Google Google Bard ausprobiert. Dieser Funktioniert soweit gleich wie der ChatGPT, also beschlossen wir den mal herauszufordern.

Wir fragen Google Bard danach, uns ein Python Skript zu welches es erlaubt mit einem LLM eine Zusammenfassung eines PDF Dokuments zu erstellen. Bard gibt uns nett eine Antwort und liefert ca. 40 Zeilen Code und eine Anleitung. Wir versuchen’s und Riccardo setzt Umgebung und Dependencies (deren drei) auf. Nun lassen wir das Skript laufen und oh Wunder, kriegen einen Fehler. Riccardo war schon etwas kritisch ob des generierten Skripts, aber es geht ja ums Versuchen. Wir beklagen uns also bei Bard und geben die Fehlermeldung mit. Inkl. Entschuldigung kriegen wir Hinweise und ein neues Stück Code. Bei den zwei weiteren Versuchen kriegen wir das Skript trotz neuen Hilfestellung von Bard nicht zum laufen. Nach dem dritten Versuch kapituliert Bard und lässt uns mit dem Hinweis darauf, dass er «nur eine KI ist» im Stich.

Wir suchen also nach einer Anleitung im Netz und werden fündig. Es ist ja nicht so, dass wir etwas neues Erfinden wollen. So finden wir eine gute Anleitung und können auch hier ein fertiges Skript beziehen. Nun kann dies keine PDF’s lesen sondern nur Dokumente (also Text), wir versuchen es mit dem entsprechenden Code aus dem Skript von Bard und siehe da, es klappt. Der Mensch ist also beim Programmieren der Maschine (zumindest Bard) noch überlegen.

Wir spielen mit unserem Skript und lassen die AGB von Interrail zusammenfassen. Erstaunlich wie treffend die Zusammenfassung ist. Als wir das Skript etwas erweitert hatten, konnten wir sogar noch Kontext mitgeben und unsere Zusammenfassung in anderen Sprachen oder in bestimmten Ausprägungen (z.B. eine juristische Zusammenfassung) erstellen lassen. Auch hier waren wir vom Modell überzeugt. Wir nutzten übrigen ChatGPT 3.5 von OpenAI über deren API.

Ein Anwendungsfall könnte zum Beispiel das Zusammenfassen von Blogposts (wie diesem hier) sein um dann einen Teaser auf LinkedIn oder Twitter (äh X) zu veröffentlichen. Für mich als nicht-Programmierer ist die Erkenntnis aus unserem Sonntagnachmittag, dass ich mich nicht auf eine KI verlassen beim erstellen von Code ohne genau zu verstehen was ich mache. Ich brauche also für solche Anwendungen weiterhin einen Entwickler – auch wenn ich den Code vermeintlich verstehe. Die Anwendungsfälle sind vielfältig und die Integrationsmöglichkeiten bieten viel Komfort (was ja Microsoft mit dem Cockpit anpreist). Ich werde sicher weiterhin die Chat-Interfaces nutzen, ich aber für Skripts oder Integrationen an die Spezialisten wenden.

Dank geht an Riccardo für seine Geduld und den spassigen Nachmittag. Das Titelbild wurde übrigens mit DeepAI generiert und die Zusammenfassung für LinkedIn mit ChatGPT.