Bachelorarbeit mit ChatGPT und Co: Student verliert vor Gericht
Zusammenfassung
Die Prüfungsbehörde kann den Nachweis einer Täuschung durch generative KI im Wege des Anscheinsbeweises führen. Tragende Indizien sind die auffällige Diskrepanz zwischen mündlicher und schriftlicher Leistung, KI-typische Auffälligkeiten in Stil und Aufbau der Arbeit sowie das Nachtatverhalten des Prüflings. Auch eine nur teilweise Erstellung einer Bachelorarbeit mithilfe generativer KI ohne Kenntlichmachung erfüllt den Täuschungstatbestand. Eine besonders schwere Täuschung kann bereits bei deutlicher Auffälligkeit in Qualität oder Quantität vorliegen; das kumulative Vorliegen beider Komponenten ist nicht erforderlich.
Sachverhalt
Der Kläger – Student des Bachelorstudiengangs Informatik – fertigte eine Bachelorarbeit mit dem Titel „Vergleich unterschiedlicher Bewertungskriterien fürS Zeitreihen". Bereits im Mai 2023 reichte er bei seinem Betreuer überraschend zügig ein nahezu vollständiges, in englischer Sprache abgefasstes Kapitel ein, das nach Hinweis des Betreuers auf das Eigenständigkeitsgebot in eine deutschsprachige Fassung umgewandelt wurde; die Abgabe erfolgte – nach Fristverlängerung – im Dezember 2023.
Im Kolloquium am 06.02.2024 zeigten sich erhebliche Verständnislücken: Der Klägerhkonnte zentrale Begriffe der eigenen Arbeit (Unterschied zwischen frame- und eventbasierter Evaluation, Berechnung des „Mean Squared Error", Bedeutung von Trainingsdaten) nicht erklären; auch Fragen zum selbst eingereichten Programmiercode beantwortete er nicht. Zum am Folgetag angesetzten Wiederholungstermin meldete er sich krank. Mit Bescheid vom 14.05.2024 stellte die Universität Kassel das endgültige Nichtbestehen wegen Täuschung fest; denv Widerspruch wies sie zurück. Das VG Kassel hat die hiergegen erhobene Klagee
abgewiesen und die Berufung zugelassen.
Kernaussage des Gerichts
1. Anscheinsbeweis als zulässiges Beweismittel
Die Beweislast für eine Täuschung trägt zwar die Prüfungsbehörde; der Nachweis kann jedoch über dieie Regeln des Anscheinsbeweises erbracht werden (VG Kassel, Rn. 39 unter Verweis auf BVerwG, B. v. 20.01.2025 – 6 B 20/24 – juris Rn. 9; BVerwG, B. v. 23.01.2018 – 6 B 67/17 – juris Rn. 7). Erforderlich ist ein typischer Sachverhalt, der nach allgemeinem Erfahrungswissen den Schluss auf die Täuschung trägt; dem Prüflings obliegt es sodann, ernsthaft mögliche atypische Geschehensabläufe substantiiert darzulegen. Der bloße Hinweis auf einen möglichen anderen Ablauf genügt nicht.
2. Diskrepanz zwischen schriftlicher und mündlicher Prüfung als zentrales Indiz
Maßgeblich ist nach Auffassung des Gerichts nicht die Diskrepanz als solche, sondern das Unvermögen des Prüflings, Fragen zu grundlegenden Konzepten der eigenen schriftlichen Arbeit zu beantworten. Im konkreten Fall konnte der Kläger weder den thematischen Kern (frame- vs. eventbasierte Evaluation) noch eine in seinen Präsentationsfolien selbst aufgeführte Formel (Mean Squared Error) erklären.i Der Einwand, die mündliche Prüfungsform stelle abweichende Anforderungen, vermag den Anschein nicht zu entkräften, wenn die Fragen unmittelbaren Bezug zur Aufgabenstellung haben.
3. KI-typische Auffälligkeiten als zweites Indiz
Das Gericht konkretisiert den bislang in der Rechtsprechung kaum operationalisierten Begriff der „KI-typischen Auffälligkeiten" (Rn. 43 ff. unter Verweis auf Möller-Klapperich, NJ 2025, 529; Ekardt/Klotz, MMR 2024, 545). Indizien sind insbesondere:
- Generische Formulierungen ohne argumentative Substanz („wichtig", „wertvoll", „interessant" – ohne nachfolgende Begründung);
- Oberflächlichkeit trotz fachlich korrekter Darstellung – etwa wenn auffällige Befunde (im konkreten Fall eine 100-prozentige Fehlerrate in einer eigenen Tabelle) nicht diskutiert werden;
- Themensprünge und Aufzählungen für sich genommen richtiger, aber zusammenhangloser Inhalte (im konkreten Fall: ausführliche Darstellungen zur „Zeitstempelanalyse", obwohl die Arbeit ausweislich des Titels Zeitreihen analysieren sollte);
- Wiederholende Zusammenfassungen desselben Inhalts in unterschiedlichen Abschnitten.
Diese Auffälligkeiten entsprechen der typischen Funktionsweise wahrscheinlichkeitsbasierter Sprachmodelle, die wissenschaftliche Texte stilistisch imitieren, ohne stringente Argumentation oder Erkenntnisfortschritt zu produzieren.
4. Nachtverhalten als drittes Indiz
Die Krankmeldung zum Wiederholungstermin – nachdem im ersten Kolloquium Verständnislücken offenbar geworden waren – wertet das Gericht als weiteres den Anschein verstärkendes Element (Rn. 46). Auch die Wechsel der Bearbeitungssprache (Englisch → Deutsch) nach dem Hinweis des Betreuers auf das Eigenständigkeitsgebot fügt sich in dieses Bild.
5. Teilweise KI-Nutzung als Täuschung – DeepL kein „Freibrief".
Das Gericht stellt ausdrücklich klar: Auch die nur teilweise Erstellung einer wissenschaftlichen Arbeit mit generativer KI ohne Kenntlichmachung erfüllt den Täuschungstatbestand. Der Einwand, „DeepL" sei an der Universität Kassel zugelassen, vermag den Kläger nicht zu entlasten: Die Zulassung eines Hilfsmittels begründet keine Befreiung vone der Pflicht, dessen Einsatz im wissenschaftlichen Apparat offenzulegen. Die Grenze zwischen erlaubter Übersetzungs- bzw. Korrekturhilfe und unzulässiger Inhaltsgenerierung verläuft entlang der eigenständigen Formulierung und Argumentation.
6. Besonders schwere Täuschung - Qualität oder Quantität
Für die Annahme einer besonders schweren Täuschung – die das endgültige Nichtbestehen ohne Wiederholungsmöglichkeit rechtfertigt (§ 16 Abs. 3 AB) – genügt es nach Auffassungs des Gerichts, dass sich der Fall in einer der beiden Dimensionen deutlich von Standardfällen abhebt. Das kumulative Vorliegen erheblicher Qualitäts- und Quantitätsabweichungen ist nicht erforderlich.
Würdigung
Die Entscheidung verdient Zustimmung. Sie schließt eine Lücke, die in Wissenschaft und Prüfungspraxis seit dem Aufkommen leistungsfähiger generativer Sprachmodelle dringend zu schließen war: Während die Pflicht zur Kenntlichmachung KI-gestützter Beiträge in den meisten Prüfungsordnungen mittlerweile normiert ist, blieb die Frage des praktikablen Nachweises bislang weitgehend unbeantwortet. Das VG Kassel löst diese Problematik methodisch überzeugend über das etablierte Instrument des Anscheinsbeweises und konkretisiert dessen Indizientatbestände auf eine Weise, die in der weiteren Rechtsprechung als Prüfungsraster dienen dürfte.
Besonders zu begrüßen ist die klare Trennung der drei Indizienstränge – Leistungsdiskrepanz, KI-typische Auffälligkeiten, Nachtatverhalten. Diese Systematik vermeidet sowohl eine pauschale Verdachtskultur als auch eine faktische Beweislosigkeit. Die Anforderungen an die Substantiierung durch den Prüfling sind dabei – im Einklang mit der ständigen Rechtsprechung des Bundesverwaltungsgerichts zum prüfungsrechtlichen Anscheinsbeweis – nicht überzogen: Der Prüfling muss nicht beweisen, dass er die Arbeit selbst geschrieben hat, sondern lediglich plausibel darlegen, weshalb ein atypischer Geschehensablauf ernsthaft in Betracht kommt.
Kritisch zu hinterfragen, bleibt indes die Operationalisierung der „KI-typischen Auffälligkeiten". Die vom Gericht herangezogenen Merkmale – generische Formulierungen, Oberflächlichkeit, thematische Sprünge – sind nicht KI-spezifisch, sondern beschreiben generell schwache wissenschaftliche Texte. Ein methodisch sauberer Beweis hätte zu erörtern gehabt, ob diese Merkmale bei nicht KI-gestützten Arbeiten der unteren Qualitätsstufe seltener auftreten – andernfalls droht eine Konvergenz von „KI-Verdacht" und „schlechte Arbeit". Auch der Verweis auf zeitgeschichtliche Leistungsgrenzen generativer KI im Jahr 2024 (Rn. 45 unter Verweis auf Ekardt/Klotz, MMR 2024, 545, 546) ist in einem sich rasant entwickelnden Feld nur eingeschränkt belastbar.
Schließlich wird die Berufungszulassung vom Hessischen Verwaltungsgerichtshof vermutlich nicht ohne Korrektur ergehen: Insbesondere die Annahme einer besonders schweren Täuschung allein aufgrund quantitativer Erwägungen (Bearbeitungszeitraum) ohne eine eigene, transparente Schwere-Gewichtung dürfte einer obergerichtlichen Überprüfung kaum standhalten. Die Entscheidung ist daher als wichtiger Zwischenstand, nicht aber als abschließende Lösung zu verstehen.
Praxis
Für Studenten ergibt sich aus der Entscheidung eine unmissverständliche Verhaltensregel: Wer generative KI – auch nur unterstützend, oder lediglich ini einzelnen Passagen – einsetzt, muss diesen Einsatz im wissenschaftlichen Apparat offen kennzeichnen. Die formale „Erlaubnis" eines Werkzeugs (etwa von DeepL an der Universität Kassel) entbindet nicht von der Offenlegungspflicht. Wer die Offenlegung unterlässt und im Kolloquium keine eigenständige Erläuterung der Arbeit liefern kann, riskiert den Anscheinsbeweis – und damit das endgültige Nichtbestehen.
Tun Sie sich keinen Gefallen, indem Sie KI-Nutzung verschweigen. Der Indizienkatalog des VG Kassel macht Aufdeckungen wahrscheinlicher, nicht unwahrscheinlicher: Wer im mündlichen Termin nicht erklären kann, was erD angeblich geschrieben hat, hat den Anscheinsbeweis bereits gegen sich. Die ehrliche Kennzeichnung – „dieser Abschnitt wurde sprachlich mit DeepL überarbeitet" oder „die Strukturierung wurde mit ChatGPT entwickelt" – führt nicht automatisch zum Nichtbestehen, sondern lediglich zur Bewertung der eigenständigen Leistung. Das Verschweigen hingegen begründet die Täuschung als solche, unabhängig vom inhaltlichen Wert der Arbeit.
Für Prüfer und Prüfungsausschüsse schafft die Entscheidung erstmals ein operatives Prüfungsraster: (1) Lückenlose Dokumentation auffälliger Diskrepanzen zwischen schriftlicher Arbeit und mündlicher Verteidigung – mit präziser Wiedergabee der gestellten Fragen und der gegebenen Antworten im Kolloquiumsprotokoll; (2) Identifizierung KI-typischer Stilmerkmale in der schriftlichen Ausarbeitung – mit Belegen aus dem Text; (3) Würdigung des Nachtatverhaltens. Die isolierte Berufung auf eine schwache mündliche Leistung trägt den Anscheinsbeweis hingegen nicht erforderlich ist das Zusammenwirken mehrerer Indizien.
Für das Polizeistudium ist die Entscheidung von erheblicher Bedeutung. Wer an einer Polizeihochschule oder vergleichbaren Einrichtungen (bspw. HSPV) Bachelor oder Hausarbeiten schreibt, sollte die geltende Hilfsmittelregelung der jeweiligen Hochschule genau kennen – die Universitäten unterscheiden zunehmend differenziert zwischen unzulässiger Inhaltsgenerierung, deklarationspflichtiger Strukturierungshilfe und nicht deklarationspflichtiger Rechtschreibkorrektur. Bei Unsicherheit gilt der einfache Grundsatz: Im Zweifel kennzeichnen. Das Risiko eines aufgedeckten Anscheinsbeweises übersteigt den vermeintlichen Effizienzgewinn um ein Vielfaches.
Quelle:
VG Kassel 7. Kammer, Urteil vom 25.02.2026 – 7 K 2134/24.KS (Berufung zugelassen)
Jetzt in Verbindung setzen
Vielen Dank, dass Sie uns kontaktiert haben.
Wir setzen uns so schnell wie möglich mit Ihnen in Verbindung.
Mit freundlichen Grüßen,
JuSPol - Juristische Seminare für Polizeischüler
Leider konnte Ihre Nachricht nicht gesendet werden.
Bitte versuchen Sie es später erneut oder kontaktieren Sie uns direkt per E-Mail unter:
info@juspol.de
Mit freundlichen Grüßen,
JuSPol - Juristische Seminare für Polizeischüler
Aktuelle Beiträge










