Leistungsnachweise im Zeitalter von GKI: Resultate aus dem Call HSLUnext – ZLLFblog. Zentrum für Lernen, Lehren und Forschen

Die Diskussion um Leistungsnachweise (LNW) an der HSLU hat sich durch Generative KI (GKI) grundlegend verschoben. Klassische Formate geraten unter Druck, während neue Kombinationen aus Projektarbeit, Reflexion und mündlicher Prüfung entstehen.

Im Projekt HSLUnext hat sich das Arbeitsteam «KI in der Lehre» mit der Frage auseinandergesetzt, wie können Leistungsnachweise in einer digitalisierten Bildungslandschaft so gestaltet werden, dass die Eigenleistung der Studierenden sichtbar und überprüfbar ist? Im Zentrum steht die Entwicklung praxisnaher und kompetenzorientierter Prüfungsformate sowie die stärkere Gewichtung der Prozessbegleitung und mündlicher Prüfungen.

Zu diesem Zweck lancierte die Gruppe Lehre im Rahmen des Projektes HSLUnext einen Call für bereits bestehende Beispiele von Leistungsnachweisen aus den verschiedenen Departementen. Ausgangspunkt war die Annahme, dass GKI potenziell an jedem Punkt des Vorbereitungs- und Prüfungsprozesses eingesetzt werden kann. Es gingen Beiträge aus fünf Departementen ein, welche hinsichtlich ihrer Praktikabilität und möglichen Übertragbarkeit auf die anderen Departemente der Hochschule bewertet wurden. Dafür verwendeten wir ein gemeinsames Bewertungsraster mit den Kriterien Validität, Reliabilität, Fairness und Skalierbarkeit. Unter diesen Begriffen verstehen wir Folgendes:

Validität: Ob ein Leistungsnachweis tatsächlich die Kompetenzen misst, die er zu prüfen vorgibt.
Reliabilität: Ob eine Prüfung zwischen verschiedenen Prüfenden und über mehrere Durchführungen hinweg vergleichbare Ergebnisse liefert.
Fairness: Ob der Leistungsnachweis gleiche Voraussetzungen für alle Studierenden gewährleistet.
Skalierbarkeit: Ob Vorbereitung, Durchführung und Bewertung mit den vorhandenen Ressourcen hinsichtlich Zeit und Studierendenzahl praktikabel umsetzbar sind.

Die folgende Auswahl zeigt exemplarisch, wie unterschiedlich mit der Herausforderung GKI umgegangen wird – und welche Spannungsfelder dabei sichtbar werden.

Projektbasierte Leistungsnachweise: Hohe Validität, komplexe Bewertung

Im Bereich Spatial Design Media (Departement Design Film Kunst) prüfen Dozierende projektbasierte Formate wie Pitch + Artefakt. Diese weisen eine sehr hohe Validität auf: Studierende zeigen reale Kompetenzen, die direkt anschlussfähig an berufliche Praxis sind. Gleichzeitig sind solche Formate hinsichtlich Reliabilität und Fairness anspruchsvoll. Die Skalierbarkeit ist ebenfalls begrenzt: Projekte sind aufwendig in Betreuung und Bewertung. Dennoch zeigt sich hier ein klarer Trend – weg von standardisierten Prüfungen hin zu performativen, komplexen Leistungen.

Prozessorientierte Abgaben: Dokumentation als Absicherung

Im Modul Informationsvisualisierung (Departement Informatik) wird der Prozess selbst zum Leistungsnachweis: Abgabe mit Dokumentation und Screencast. Hier verschiebt sich der Fokus von Ergebnis zu Entstehung. Das stärkt die Fairness, da individuelle Beiträge sichtbarer und vergleichbarer werden. Gleichzeitig bleibt die Reliabilität moderat – Prozesse sind schwer standardisierbar, sowohl Erstellung als auch Bewertung sind zeitintensiv. Interessant ist hier die implizite Antwort auf GKI: Wenn Ergebnisse leicht generierbar sind, wird der Prozess zur eigentlichen Prüfungsleistung.

Erweiterte Wissensquelle: KI als Sparringpartner

Einige Formate bleiben strukturell unverändert (klassische Abgaben), integrieren aber GKI als kritischen Sparringpartner. Diese hybriden Modelle zeigen gemischte Ergebnisse. Die Validität bleibt solide, da weiterhin komplexe Aufgaben gestellt werden. Die Reliabilität sinkt tendenziell, weil unklar ist, was die Eigenleistung der Studierenden ist. Effizienzgewinne entstehen primär auf Seiten der Studierenden, da GKI die Erstellung von Leistungsnachweisen beschleunigt, während der Aufwand für Dozierende bei Bewertung, Validierung und Sicherung der Eigenleistung eher zunimmt als abnimmt. Ebenfalls bleibt die Fairness eine offene Frage, da Studierende, die GKI nutzen, aufgrund ihrer Stärken in Sprache und Überzeugungskraft potenziell günstiger bewertet werden als Studierende, die darauf verzichten.

Mündlich dominierte Formate: Reaktion auf KI

Im CAS Digital Construction (Departement Technik & Architektur) wird stärker auf mündliche Prüfungen gesetzt (70% mündlich) als Reaktion auf GKI. Mündliche Formate erhöhen die Fairness und Validität deutlich: Eigenleistung wird unmittelbar sichtbar. Gleichzeitig steigen Anforderungen an Standardisierung und Vergleichbarkeit. Die Skalierbarkeit ist ambivalent: Die Durchführung wird aufwendiger, aber die Evaluation mündlicher Prüfungen ist schneller als bei langen schriftlichen Arbeiten.

Instrumentelle Prüfungen: Kommunikation mit und über KI

Im Modul „Mit KI für Organisationen kommunizieren“ (Departement Wirtschaft) taucht ein spannendes Hybridformat mit Prüfungsaufgabe auf Papier auf, kombiniert mit digitalen, reflektiven Abgaben. Hier wird bewusst ein kontrollierter Raum geschaffen, in dem KI keinen direkten Zugriff hat. Gleichzeitig bleibt die Transferleistung zentral. Somit schaffen die Dozierende ein Format, das ausgeglichen ist: solide Validität (Transfer) mit einer höheren Reliabilität (standardisierte Prüfungssituation). Dennoch bleibt offen, ob solche hybriden Formate lediglich eine Übergangslösung für ein grundlegendes Problem tertiärer Leistungsnachweise darstellen oder wie wirksam Prüfungsaufsichten künftig das Fotografieren und Transkribieren papierbasierter Prüfungsaufgaben verhindern können.

Fazit der Leistungsnachweise im GKI-Zeitalter – höhere Validität, neue Zielkonflikte bei Reliabilität, Fairness und Skalierbarkeit

Über die verschiedenen Beispiele hinweg wird ein zentrales Spannungsfeld deutlich: Leistungsnachweise mit hoher Praxisnähe erreichen zwar eine stärkere Validität, verlieren jedoch an Reliabilität, da ihre Bewertung weniger standardisierbar ist. Gleichzeitig verschiebt GKI den Fokus klar vom Endprodukt hin zum Entstehungsprozess. Formate, die Dokumentation, Reflexion und mündliche Verteidigung integrieren, gewinnen an Bedeutung, weil sie die Eigenleistung besser sichtbar machen. Diese Entwicklung hat jedoch ihren Preis: Der Aufwand für Betreuung und Bewertung steigt erheblich, wodurch die Skalierbarkeit zu kritischen Herausforderungen werden.

Eine einheitliche Lösung ist nicht erkennbar. Stattdessen bewegen wir uns in einem experimentellen Feld zwischen drei Polen: kontrollierten, standardisierten Prüfungsformaten, komplexen praxisnahen Aufgabenstellungen und Verfahren zur Sicherung der Nachvollziehbarkeit individueller Leistungen. GKI wirkt dabei weniger als isoliertes Problem, sondern als Beschleuniger dieser Entwicklung. Sie zwingt dazu, die Zielsetzung von Leistungsnachweisen neu zu klären: weg von der reinen Reproduktion oder Darstellung von Ergebnissen, hin zur überprüfbaren Fähigkeit, fundierte Entscheidungen zu treffen, Annahmen zu begründen und Urteilskraft zu zeigen.

Image by F1 Digitals from Pixabay

Beitrag teilen in