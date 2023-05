von Jacqueline Haddadian ChatGPT mausert sich vom Problemschüler zum Streber: Innerhalb von wenigen Monaten hat sich der Chatbot gravierend bei der Lösung von Abituraufgaben verbessert. Aber woran liegt das?

Deutsch, Geschichte, Mathe, Ethik und Informatik – in diesen fünf Fächern musste sich die Künstliche Intelligenz (KI) ChatGPT beweisen und Abiturprüfungsaufgaben lösen. Noch im Februar war der Chatbot an den Prüfungsaufgaben des letzten Jahres, welche ihm Computerlinguisten des Bayerischen Rundfunks (BR) vorgelegt hatten, gescheitert. Das Programm erzielte ungenügende Punktzahlen und war in fast allen Fächern durchgefallen.

Bei einem erneuten Versuch wurden die KI vor kurzem mit den diesjährigen Prüfungsfragen konfrontiert. Den Start machten die Aufgaben des Geschichtsabiturs 2023. Hier wurden unter anderem der Wandel der Gesellschaft vom 15. bis zum 19. Jahrhundert mit der Bedeutung der Eisenbahn und der Stellung der jüdischen Bevölkerung abgefragt. Judith Bruniecki, Geschichtslehrerin am Gymnasium in München-Moosach, bewertete die hierzu von ChatGPT vorgebrachten Lösungen mit einer Note Zwei. "Schwierigkeiten hat die KI vor allem dann, wenn es darum geht, etwas zu beurteilen, abzuwägen und vielleicht sogar noch um die Ecke zu denken", sagt Bruniecki dem BR. Für die Lösung der Geschichtsabiaufgaben 2022 erhielt das Programm noch eine Drei plus.

ChatGPT arbeitet gründlicher und "auf einem durchgehend sehr hohen Niveau"

Auch in Ethik verbesserte sich die KI – von einer Vier minus zu einer Zwei minus. "Im Vergleich zum letzten Mal, als die KI nur ganz knapp bestanden hat, ist dies ein großer Fortschritt", sagt Winfried Kober, Ethik-Lehrer am Ludwig-Thoma-Gymnasium Prien. Insgesamt wären die Antworten sprachlich gut formuliert und deutlich auf die Aufgabenstellung ausgerichtet. Kober stellte zwar fest, dass es an manchen Stellen an der Wiedergabe von Fachbegriffen mangelt, erkannte aber dennoch insgesamt eine Leistungssteigerung.

Ebenfalls im Fach Deutsch zeigte der Chatbot klare Verbesserungen. Im Februar wurde seine Leistungen von einem Deutschlehrer mit den Worten "Viel Gelaber, wenig Substanz" kommentiert und mit drei Punkten bewertet. Damit wär die KI durch die Prüfung gefallen. Bei der geforderten Interpretation einer Parabel von Ilse Aichinger schlug sich ChatGPT wacker. "Ich finde, das ist sprachlich auf einem durchgehend sehr hohen Niveau", sagt Christoph Willing, Deutschlehrer am St.-Anna-Gymnasium in München. Er vergab an die KI zehn Punkte für ihre gründliche und tiefgehende Textinterpretation, was einer Zwei Minus entspricht.

Lehrer findet Leistungsverbesserung der KI "bisschen beängstigend"

Ähnlich gut überzeugte der Chatbot in Mathe. “Während man im letzten Durchgang teils nicht nachvollziehbaren Kauderwelsch zu lesen bekam, sind die Antworten dieses Mal sehr gut strukturiert und der Lösungsweg ist fast immer effizient und gut nachvollziehbar”, so Thomas Spindler, Mathematiklehrer am Luisen-Gymnasium in München.

Die gravierendste Steigerung legte die KI aber ausgerechnet im Fach Informatik hin. An den Abiaufgaben aus dem Jahr 2022 scheiterte sie und fiel mit zwei Punkten durch. Jetzt kam sie auf ganze elf Punkte, also die Note Zwei. Hermann Kees, Informatiklehrer Joseph-Bernhard-Gymnasium in Türkheim findet: "Die KI hat sehr, sehr viel richtig gemacht und ich finde diese Entwicklung fast schon ein bisschen beängstigend."

Fortschritt durch neues Modell

Aber woran liegt es, dass die KI bei den diesjährigen Abituraufgaben durch die Bank weg besser abschneidet? Im Februar löste noch das Modell, welches auf GPT 3.5 basiert, die Aufgaben. Das mittlerweile verfügbare GPT 4.0 kann vergleichsweise mehr Daten verarbeiten und ist genauer in der Textausgabe. Dem BR zufolge ist GPT 4.0 damit "leistungsfähiger und, wenn man so will auch schlauer".

