Document [original]

Rösken, F., Klingbeil, K., Barzel, B. & Schacht, F. (2024). Fallbasierte Er-

fassung von Diagnose- und Förderkompetenz: Eine Untersuchung des

Potentials des verstehensorientierten Online-Tools SMART mit Blick auf

Professionalisierung von Lehrkräften. In T. Mayer, L. Meyer-Jenßen, D.

Töpper & N. Uhlendorf (Hrsg.), Interdisziplinäre Beiträge zur Bildungsfor-

schung 2024 (S.111–132). Berlin Universities Publishing.

https://doi.org/10.14279/depositonce-20132

Dieser Beitrag ist unter der Creative Commons Lizenz CC BY 4.0 lizen-

ziert.

Dies gilt nicht für anderweitig gekennzeichnete Inhalte.

https://creativecommons.org/licenses/by/4.0

INTER

DISZIPLINÄRE

BEITRÄGE

ZUR

BILDUNGS

FORSCHUNG

111

Fabian Rösken, Katrin Klingbeil, Bärbel Barzel & Florian Schacht

Fallbasierte Erfassung von Diagnose- und Förderkompetenz: Eine Untersuchung

des Potentials des verstehensorientierten Online-Tools SMART

mit Blick auf Professionalisierung von Lehrkräften

Zusammenfassung: Verstehensorientierte digitale Diagnose-Tools wie SMART („Specific Mathematics

Assessments that Reveal Thinking“) können Lehrkräfte beim formativen Assessment im

Mathematikunterricht unterstützen. SMART stellt nicht nur Diagnoseaufgaben in einer Online-Umgebung

bereit, sondern insbesondere auch eine erweiterte Analyse der Antwortmuster. Dadurch erhalten

Lehrkräfte im direkten Anschluss an die Testdurchführung Hinweise auf vorhandene Fehlvorstellungen

ihrer Schüler:innen. Ergänzend können konkrete Förderhinweise und Unterrichtsvorschläge den

Lehrkräften bei der anschließenden Adaption des Unterrichts helfen. Insofern kann SMART nicht nur

Auswirkungen auf die Unterrichtsgestaltung und das Verständnis der Schüler:innen haben, sondern auch

auf die Lehrkräfteprofessionalisierung, da Lehrkräfte sich mit der Diagnose und Förderung ihrer eigenen

Schüler:innen forschungsbasiert auseinandersetzen können. Um diese Professionalisierung sichtbar zu

machen, untersucht dieser Beitrag die Entwicklung der Diagnose- und Förderkompetenz von

Mathematiklehrkräften mit Hilfe von Fallbeispielen vor und nach dem Einsatz von SMART im Bereich

elementarer Algebra. Dazu wird ein bestehendes Verfahren zur Erfassung von Diagnosekompetenz für

den Bereich Algebra adaptiert und um die Komponente der Förderkompetenz erweitert. Erste Ergebnisse

in der Untersuchung von fünf Lehrkräften legen nahe, dass eine qualitative Erfassung der Diagnose- und

Förderkompetenz möglich ist und dass sich die Wirksamkeit von SMART vor allem im Bereich der

Förderkompetenz nachzeichnen lassen.

Schlüsselwörter: professionelle Kompetenzen, Lehrkräfteprofessionalisierung, technologiegestützte

Diagnose und Förderung

Abstract: Understanding-oriented digital diagnostic tools such as SMART (“Specific Mathematics

Assessments that Reveal Thinking”) can support teachers in formative assessment in mathematics

teaching. SMART not only provides diagnostic tasks in an online environment, but also, and in particular,

an extended analysis of response patterns. This provides teachers with information about the

misconceptions of their students. In addition, concrete teaching suggestions can help teachers in the

subsequent adaptation of their lessons. In this respect, SMART can not only have an impact on lesson

design and student understanding, but also on teacher professionalisation, as teachers can deal with the

diagnosis and support of their own students in a research-based way. In order to make this

professionalisation visible, this paper investigates the development of mathematics teachers' diagnostic

and support competence with the help of case studies before and after the use of SMART in the area of

elementary algebra. For this, an existing procedure for recording diagnostic competence is adapted for the

area of algebra and extended to include the component of support competence. Initial results from the

study of five teachers suggest that a qualitative assessment of diagnostic and support competence is

possible and that the effectiveness of SMART can be traced.

Keywords: professional competences, teacher professionalisation, technology-supported formative

assessment

1. Diagnostizieren und Fördern als professionelle Kompetenz

1.1. Diagnosekompetenz

Die Diagnosekompetenz von Lehrkräften gilt als zentrale Voraussetzung für

erfolgreiches Lernen der Schüler:innen (Helmke, 2012). Dabei umfassen Diagnosen viele

112

zusammenhängende Aufgabenbereiche, wie die Anwendung und Auswertung von

Testinstrumenten sowie die Beobachtung und Bewertung des Denkens der

Schüler:innen während des Lernens (Leuders et al., 2022). Das Hauptziel besteht darin,

Informationen über die Schüler:innen, den Lernprozess selbst und die erzielten

Lernergebnisse für anschließende Adaptionen im unterrichtlichen Handeln zu sammeln.

Unter Berücksichtigung dieser unterschiedlichen Aufgaben empfehlen Leuders und

Kolleg:innen (2022) eine Differenzierung des Begriffs der „Diagnose“ in die Bereiche des

„diagnostischen Denkens“ und „diagnostischen Handelns“. „Diagnostisches Denken“

wird dabei als die internale Verarbeitung von diagnostischen Informationen aufgefasst,

während diagnostisches Handeln über konkrete externale Indikatoren (wie bspw. die

Verschriftlichung der Gedanken) sichtbar wird (vgl. Loibl et al., 2020, Abbildung 1).

In bisherigen Studien wurden in gleichem Maße diagnostisches Denken und

diagnostisches Handeln untersucht, wobei informelle Diagnosen im Unterrichtskontext

besonders im Fokus der Forschung zur diagnostischen Kompetenz standen (Leuders et

al., 2022). Häufig wird zudem ausschließlich auf die Messung der Urteilsgenauigkeit als

Indikator für diagnostische Kompetenz zurückgegriffen (Südkamp et al., 2012). Dieser

Ansatz kann allerdings dahingehend kritisiert werden, dass die Urteilsgenauigkeit nur

einen kleinen Aspekt der diagnostischen Kompetenz ausmacht und hinterfragt werden

kann, ob diese überhaupt ein Maß für das Verhalten von Lehrkräften sein sollte (Leuders

et al., 2022).

Aus dieser Kritik wurden differenziertere Ansätze entwickelt, beispielsweise die

qualitative Studie zu Szenariobeurteilungen von Klug et al. (2013). Hier ist das

Kompetenzmodell aufgeteilt in drei verschiedene Phasen der Diagnose: „preactional“,

„actional“ und „postactional“. In der Phase „preaction“ sollte das für die Diagnose

relevante Vorwissen aktiviert werden. Das diagnostische Urteil wird folgend in der

Phase „action“ systematisch erstellt und in der Phase „postaction“ werden

Rückmeldungen formuliert und weitere Förderplanungen vollzogen (Klug et al., 2013).

Dieses Modell betont dabei das fachdidaktische Wissen als Vorwissen und eine

anschließende Förderung.

Mithilfe des DiaCoM-Rahmenmodell (Abbildung 1) von Loibl und Kolleg:innen (2020)

lassen sich diagnostische Urteile von Lehrkräften als Informationsverarbeitungs-

prozesse erklären. Es konzeptualisiert die kognitiven Prozesse einer Lehrkraft beim

diagnostischen Beurteilen von Schüler:innen und deren Aufgabenbearbeitungen auf der

Grundlage der Informationen, die explizit oder implizit in einer diagnostischen Situation

vorhanden sind.

113

Abbildung 1: DiaCoM-Rahmenmodell (Loibl et al. 2020, S. 495)

Die zur Erhebung häufig durchgeführte Beobachtung von Unterrichtssituationen oder

die Analyse von Urteilsgenauigkeiten kann eine Herausforderung darstellen, da es

schwierig sein kann, den Einfluss von Kontextfaktoren auf die Diagnosekompetenz

angemessen zu berücksichtigen. Zugleich kann die Selbstbeurteilung der

Diagnosekompetenz durch Lehrkräfte problematisch sein, da es zu Verzerrungen

kommen kann, beispielsweise durch ein über- oder untertriebenes Selbstbild (Busch et

al., 2015). Mit dem DiaCoM-Rahmenmodell können Diagnosesituationen beschrieben

und Annahmen über die Entwicklungsprozesse überprüft werden. Allerdings ist die

Anwendung des DiaCoM-Rahmenmodells beschränkt auf die Prozesse und Produkte, die

mit der unmittelbaren Urteilsbildung nach der Präsentation einer diagnostischen

Situation verbunden sind (Loibl et al., 2020).

1.2. Förderkompetenz

Die Förderkompetenz von Lehrkräften umfasst die Fähigkeit, geeignete

Fördermaßnahmen zu planen und umzusetzen. Da die fördernden Lernangebote

möglichst gut auf die individuellen Lernvoraussetzungen abgestimmt sein sollten

(Corno, 2008), ist die Förderkompetenz eng mit der Diagnosekompetenz der Lehrkraft

verbunden. In den meisten Studien, die Förderkompetenz untersuchen, wird diese als

Teil der diagnostischen Kompetenz mit aufgefasst (Busch et al., 2015). Dieses

gemeinsame Denken von Diagnose und Förderung als Assessment zum Formieren des

Lernprozesses verdichtet sich in der internationalen Forschung zu dem Konzept

„Formatives Assessment“. Gemeint ist damit das Erfassen von Informationen, um

114

anschließend das Lernen zu verbessern, indem der Unterricht und andere weitere

Schritte nach der Diagnose „geformt“ werden (Bell & Cowie, 2001; Schütze et al., 2018).

Zur Förderung der individuellen Lernprozesse von Schüler:innen müssen Lehrkräfte in

der Lage sein, den Unterricht auf die unterschiedlichen Bedürfnisse der Lernenden

abzustimmen und dabei eine Vielzahl von Methoden und Materialien einzusetzen.

Hierbei spielt die Fähigkeit zur Differenzierung des Unterrichts und der Aufgaben eine

wichtige Rolle. Die Fähigkeit, den Unterricht so auf die individuellen Voraussetzungen

und Möglichkeiten der Lernenden anzupassen, dass möglichst günstige Bedingungen für

individuell verstehendes Lernen entstehen, wird auch als adaptive Lehrkompetenz

bezeichnet (Beck, 2008).

Im Rahmen des formativen Assessment als Zusammenspiel von Diagnose und

Förderung, können die Prozesse hinsichtlich ihres Planungs- und Formalitätsgrad

unterschieden werden (vgl. Heritage, 2007; Shavelson et al., 2008). „On-the-fly

assessments“ stellen den Prozess mit der geringsten Planung und Formalität dar. Dabei

handelt es sich um Situationen, in denen Lehrkräfte Fehlvorstellungen und

Verstehenslücken spontan im laufenden Unterricht identifizieren, Feedback geben und

den Inhalt entsprechend anpassen. „Planned-for-interaction“ bzw. „curriculum-

embedded assessments“ sind stärker formalisiert und unterscheiden sich zu spontaner

Förderung durch ihren erhöhten Planungsgrad und die Bindung an schulische

Strukturen wie bspw. Hausaufgaben oder Förderpläne. Bei der Trennung zwischen

spontanen und geplanten Anpassungen des Unterrichts wird auch zwischen Mikro- und

Makroadaptivität unterschieden, wobei eine Mischform der Mesoadaptivität nicht

ausgeschlossen wird (Klieme & Warwas, 2011; Leuders & Prediger, 2017).

In der Literatur finden sich unterschiedliche Ansätze bezüglich der verwendeten

Methoden zur Messung von Förderkompetenz (bspw. zur Erfassung mittels Vignetten;

von Aufschnaiter et al., 2017). Wie die diagnostischen Kompetenzen, sind auch die

Kompetenzen, die für effektive Förderung notwendig sind, sehr komplexe Fähigkeiten,

die nur schwierig zu erfassen und zu messen sind. Zudem gibt es auch in der Praxis

keine einheitlichen Standards für die Förderung individueller Lernprozesse, was die

Definition von Förderkompetenzen und die Entwicklung von Messverfahren zusätzlich

erschwert. Bisher gibt es daher nur wenige Verfahren zur Erfassung der

Förderkompetenz von Lehrkräften, die über Einzelstudien hinausgehen (Yan & Pastore,

2022). In der Regel werden Beobachtungen von Unterrichtssituationen oder die Analyse

von Bearbeitungen von Schüler:innen oder Vignetten herangezogen, um die Fähigkeit

der Lehrkraft zur gezielten Förderung der Schüler:innen zu beurteilen (Busch et al.,

2015).

115

2. SMART als Weg zur Professionalisierung

2.1. Perspektiven auf die Professionalisierung

Leuders und Kolleg:innen (2022) beschreiben in einem Rahmenmodell eine

Systematisierung von Forschungsperspektiven zum diagnostischen Denken und

Handeln. Bei der „Diagnosekompetenz“-Perspektive stehen die Beschreibung, Erklärung

und Vorhersage der Fähigkeiten von Lehrkräften zur Diagnose ihrer eigenen

Schüler:innen im Vordergrund. Untersucht werden entweder die nötigen Eigenschaften

für erfolgreiche Diagnosen oder das tatsächliche diagnostische Handeln kompetenter

Lehrkräfte (Leuders et al., 2022). Forschung aus der „Kognitiven Modellierungs“-

Perspektive versucht theoretisch zu beschreiben und empirisch zu erklären, wie

diagnostische Urteile auf der Grundlage der verschiedenen Charakteristika einer

Lehrkraft entstehen (vgl. DiaCoM-Rahmenmodell Loibl et al., 2020; Leuders et al., 2022).

Professionalisierungsforschung aus der Sicht der „Lehrkräftebildungs“-Perspektive

fokussiert vornehmlich, wie angehende Lehrkräfte oder Berufseinsteiger:innen in der

Entwicklung ihrer Diagnose- und Förderkompetenz unterstützt werden können

(Leuders et al., 2020). Forschung aus der „Formativen Assessment“-Perspektive

untersucht das diagnostische Handeln und damit assoziierte Unterrichtspraktiken (wie

bspw. Vorgehensweisen bei der Förderung). Ziel dieser Forschungsperspektive ist es,

das diagnostische Handeln zu beschreiben und zu erklären, wie mit dessen Hilfe die

Schüler:innen gefördert werden können (Leuders et al., 2022).

Insbesondere die „Formative Assessment“-Perspektive auf Lehrerprofessionalisierung

gewinnt durch zahlreiche Interventionsstudien an Bedeutung. Das Ziel der Intervention

besteht meistens in der Implementation von Diagnose- und Förderpraktiken und es

werden eher weniger alternative Wege der Professionalisierung verglichen (Lee et al.,

2020; Wiliam, 2019). Bei den Interventionen handelt es sich meistens um klassische

Lehrkräftefortbildungen (Wiliam et al., 2004) oder die Bereitstellung von

weiterführenden Materialien für den Unterricht (Burkhardt & Schoenfeld, 2019). Da Ziel

der Interventionen besteht meistens in einer Verbesserung des Unterrichts durch eine

konstante Umsetzung des formativen Assessments in der Unterrichtspraxis (Burkhardt

& Schoenfeld, 2019; Rakoczy et al., 2017) mit einem Schwerpunkt auf der Wirksamkeit

des formativen Assessments.

Besonders im Bezug zur Wirksamkeit von formativem Assessment gewinnen

Interventionsstudien zur Erfassung professioneller Kompetenz – allen voran die

Diagnosekompetenz – in den letzten Jahren an Bedeutung. Ein Beispiel ist das laufende

Projekt FÖDIMA (Eichholz et al., 2023). Hier soll mittels Vignetten und Fragebögen

untersucht werden, inwiefern sich die Diagnose- und Förderkompetenz von Lehrkräften

116

in Bezug auf das Stellenwert- und Operationsverständnis im Vergleich von zwei

Fortbildungsmodellen entwickeln. Lehrkräfte lernen auf Basis der Arbeit von Shavelson

und Kolleg:innen (2008) entweder Diagnoseansätze und Fördermaßnahmen selbst zu

entwickeln oder nach dem vorgegebene Ansätze einzusetzen. Zusätzlich werden das

fachdidaktische Wissen und die Akzeptanz der beiden Ansätze erhoben (Eichholz et al.,

2023). Ein weiteres Beispiel ist die Studie von Fischer und Sjuts (2013), die zur

Untersuchung der Wirksamkeit einer Fortbildung bei Referendar:innen

Selbsteinschätzungen zur Diagnose- und Förderkompetenz in einem Fragebogen

erfassten. Ein Ergebnis dieser Befragung war, dass die Lehrkräfte sich vornahmen, ihren

Mathematikunterricht durch den verstärkten Einsatz von Forschungs- und

Begründungsaufgaben zu optimieren. Allerdings ist seit Lipowsky (2014) bekannt, dass

für den Erfolg einer Fortbildung mehr Ebenen angesprochen werden müssen als nur der

selbstberichtete Lernerfolg und die gesteigerte Motivation und Akzeptanz der

Teilnehmenden. Vielmehr muss sich das Wissen, Denken und Handeln der Lehrkräfte

tatsächlich weiterentwickeln und sich im besten Fall in der Entwicklung der

Schüler:innen zeigen.

2.2. Technologiegestützte Diagnose und Förderung – SMART

Diagnose und Förderung stellen für Lehrkräfte in der konkreten Umsetzung im

Unterricht eine große Herausforderung dar. Besonders wenn eine tiefgehende Diagnose

angestrebt wird, die nicht nur auf richtigen und falschen Lösungen basiert, sondern das

konzeptuelle Verstehen und Fehlvorstellungen der Schüler:innen zutage fördern soll,

stehen Lehrkräfte in großen Lerngruppen vor einer Herausforderung. Noch größer wird

diese, wenn es gilt, eine auf individuelle Bedürfnisse abgestimmte Förderung zu

realisieren. Technologie hat das Potential, Lehrkräfte bei diesen Prozessen zu

unterstützen und gleichzeitig auch Diagnose- und Förderpraktiken zu verändern

(Stacey & Wiliam, 2013). Die Technologie kann nach Aldon et al. (angenommen) auf drei

verschiedene Ebenen Einfluss nehmen: Kommunizieren, Analysieren und Adaptieren.

Dabei stellt das Analysieren einen wesentlichen Bestandteil der Diagnose dar, während

das Adaptieren in den Bereich der Förderung einzuordnen ist und das Kommunizieren

in beiden Bereichen eine wichtige Rolle spielt.

Ein Beispiel für eine technologiegestützte Diagnose und Förderung ist das SMART-

System, welches eine schnelle und tiefgreifende Auswertung liefert (Stacey et al., 2018)

und dafür Antwortmuster zwischen einzelnen Diagnose-Items analysiert (Steinle et al.,

2009). SMART wird seit 2008 an der Universität von Melbourne forschungsbasiert

entwickelt und aktuell im Rahmen eines DZLM-Projekts für den Gebrauch in

Deutschland adaptiert. SMART ist für die Jahrgangsstufen 5 bis 9 konzipiert und

117

fokussiert meistens das grundlegende konzeptuelle Verständnis zentraler Inhalte, wobei

einige Tests auch prozedurale Fähigkeiten in den Blick nehmen (Price et al., 2013).

Nachdem die Schüler:innen einen 5- bis 10-minütigen Test ausgefüllt haben, erhalten

die Lehrkräfte eine automatische Diagnose für jede:n Schüler:in in Form von

Verstehensstufen und Fehlvorstellungen. Zusätzlich werden Erklärungen und

Unterrichtsvorschläge bereitgestellt, welche Vorschläge, allgemeine Hinweise zu

Ritualen, Einstellungen, Methoden und wünschenswerten Konzepten sowie konkrete

Aufgaben, die zur Unterstützung der Schüler:innen eingesetzt werden können, enthalten

(Klingbeil et al., 2022).

Zur Konkretisierung wird im Folgenden ein Test aus dem Bereich der Algebra

vorgestellt. Der Test „Bedeutung von Variablen erfassen“ überprüft, ob Schüler:innen

Variablen konsequent so interpretieren, dass sie für numerische Werte stehen und nicht

als eine Abkürzung für im Kontext vorkommende Objekte. Der Test umfasst sechs

Multiple-Choice-Items, deren falsche Antwortoptionen typische Fehlinterpretationen

widerspiegeln. So kann beispielsweise die zweite Antwortoption in Abbildung 2 als „In

einer Packung sind 3 Kugelschreiber“ verstanden werden, bei der die Variablen als

Abkürzung für Packung bzw. Kugelschreiber gedeutet werden. Diese Fehlvorstellung

„Variable als Objekt“ (VAO) kann die Ursache für Schwierigkeiten beim Aufstellen von

Termen sein.

Abbildung 2: Item aus dem SMART-Test „Bedeutung von Variablen erfassen“

Die auf den Antwortmustern der Schüler:innen basierende, automatische Diagnose wird

den Lehrkräften in Form von drei Verstehensstufen angezeigt. Wird zusätzlich die

118

Fehlvorstellung „Lösung als Koeffizient“ (LAK) diagnostiziert, welche eine Spezifizierung

der VAO-Fehlvorstellung ist, wird diese ebenfalls angezeigt (siehe Abbildung 3). Bei LAK

wird bereits eine mögliche Lösung für eine Gleichung gefunden und als Koeffizienten vor

die Variablen gestellt.

Abbildung 3: Verstehensstufen und zusätzliche Fehlvorstellung des SMART-Tests „Bedeutung von Variablen

erfassen“

Bei der Diagnose kann die Technologie zunächst einmal auf der Ebene der

„Kommunikation“ unterstützen. Beispielsweise können Diagnoseaufgaben inklusive

verschiedener Darstellungen mithilfe von Technologie präsentiert und an die

Schüler:innen übermittelt werden (Kommunikation „durch“ Technologie). Je nach

Technologie können Aufgabenformate dabei auch so gestaltet sein, dass eine Interaktion

zwischen Nutzer:in und Technologie ermöglicht wird, beispielsweise durch Eingaben

und technologieseitige Reaktionen darauf (Kommunikation „mit“ Technologie).

Schließlich kann Kommunikation auch „über“ Technologie stattfinden, wenn z. B. die

Technologie selbst als Impuls für Diskussionen dient (Aldon et al., angenommen).

SMART bietet hinsichtlich der Kommunikation die Möglichkeit einer einfachen

Bereitstellung von fertigen Diagnoseaufgaben auf einer Website, zu denen die

Schüler:innen ihre Antworten auch direkt dort digital eingeben können

(Kommunikation „durch“ und „mit“ Technologie).

Ein besonderes Potential von Technologie beim Diagnostizieren liegt allerdings in der

„Analyse“. Dazu zählt die Interpretation von Schüler:innen-Antworten und die

Auswertung von Prozessdaten. Dabei können drei Level der Analyse unterschieden

werden: Auf dem ersten Level liefert die Analyse lediglich einen Überblick über den

119

Arbeitsfortschritt, während Level 2 die Erfassung des Lernstandes im Sinne von

richtigen und falschen Antworten sowie in Anspruch genommenen Hilfen umfasst. Das

dritte Level entspricht dann einer erweiterten Analyse, die der Lehrkraft Einblicke in

das Denken ihrer Schüler:innen in Bezug auf das bereits entwickelte Verständnis sowie

noch vorhandene Fehlvorstellungen ermöglicht (Aldon et al., angenommen). Diese

erweiterte Analyse ist es, die auch SMART bietet. Hier wurden die Testitems auf der

Grundlage von Forschungsergebnissen zu typischen Fehlern und (Fehl-)Vorstellungen

konstruiert und in mehreren Forschungszyklen mit Erprobungen weiterentwickelt. Die

Antwortmuster werden automatisch ausgewertet und für jede:n Schüler:in eine

Diagnose in Form einer erreichten Verstehensstufe sowie, wenn vorhanden,

zusätzlichen Fehlvorstellungen erstellt (Steinle et al., 2009; siehe Abbildung 4).

Abbildung 4: Diagnoseergebnisse in der Klassenübersicht

Das Potential von Technologie im Bereich der Förderung liegt im „Adaptieren“, indem

Entscheidungen über die folgenden Lernschritte durch Technologie entweder

unterstützt oder gar übernommen werden. Weist die Technologie eine „passive“

Adaptivität auf, bietet sie zwar potentielle sinnvolle Aufgaben und Empfehlungen an, die

Lehrkraft muss aber noch selbst entscheiden, welcher Lernweg eingeschlagen werden

soll. Diese Entscheidung wird bei einer „aktiven“ Adaptivität von der Technologie

übernommen. Werden darüber hinaus Features von künstlicher Intelligenz genutzt, um

automatisch ein Lernendenprofil zu generieren, handelt es sich um „intelligente“

Adaptivität (Aldon et al., angenommen). Der Grad der technologischen Nutzung steht

dabei reziprok zum Grad des geforderten Lehrerhandelns. Bei einer intelligenten

120

Adaptivität bleibt für die Lehrkraft nur mehr die äußere Organisation, wohingegen bei

einer passiven Adaptivität die inhaltliche Gestaltung noch in der Hand der Lehrkraft

liegt. Letzteres ist bei SMART der Fall – das System stellt zwar zusätzlich zur Diagnose

Förderhinweise und passende Aufgabenvorschläge für die Lehrkraft zur Verfügung

(siehe Abbildung 5), aber über deren Einsatz und die konkrete Umsetzung entscheidet

die Lehrkraft. Eine automatische Rückmeldung an die Schüler:innen erfolgt nicht. Dies

ist von den Entwickler:innen ganz bewusst so entschieden, denn “we want teachers at

the centre of the diagnostic process, because we believe that substantial teacher input is

required to overcome most of the conceptual obstacles identified” (Stacey et al., 2018,

S. 9).

Abbildung 5: Beispiel für Förderhinweise (hier zu Stufe 1)

2.3. Potential von SMART auf die Lehrkräfteprofessionalisierung

Wie beschrieben kann der Einsatz von Technologie Lehrkräfte bei der Diagnose und

Förderung entlasten. Darüber hinaus ist aber auch davon auszugehen, dass Tools wie

SMART die Entwicklung der Diagnose- und Förderkompetenz der Lehrkräfte

unterstützen können. Freiwillige Rückmeldungen von australischen Lehrkräften, die

SMART verwendet haben, liefern bereits erste Hinweise auf einen solchen möglichen

Effekt (Stacey et al., 2018).

In vielen Klassen ist die Qualität der Förderung oft nur mittelmäßig und Lernende, die

Unterstützung brauchen, erhalten diese oft nicht konsequent (Pianta et al, 2007). Hier

121

kann SMART zunächst einmal sowohl als Diagnosetool selbst, als auch durch das zur

Verfügungstellen von Förderaufgaben (inklusive Erläuterung deren Potentials) das

Handlungsrepertoire von Lehrkräften in Bezug auf Diagnose und Förderung erweitern.

Darüber hinaus können Lehrkräfte mithilfe der Erläuterungen der Verstehensstufen und

Fehlvorstellungen sowie Förderhinweise ihr fachdidaktisches Wissen zu einem

bestimmten Fachinhalt erweitern. Die Lehrkraft lernt quasi anhand des Lernens der

eigenen Schüler:innen. Das Wissen über typische Fehler und Fehlvorstellungen kann

dabei den Blick der Lehrkraft für die Verstehenshürden der Schüler:innen schärfen, was

unter anderem Auswirkungen auf spontane Diagnosen oder gestaltete

Fördermaßnahmen haben kann. Wunsch der Entwickler:innen ist, dass SMART somit

irgendwann gewissermaßen redundant wird, da die Lehrkräfte Verstehensstufen und

Fehlvorstellungen ihrer Schüler:innen ohne Hilfe im Unterricht diagnostizieren und

fördern können. Die Erläuterungen der Verstehensstufen und die Förderhinweise bieten

zusätzlich auch einen Überblick über das zum jeweiligen Thema aufzubauende

konzeptuelle Wissen. Pianta et al. (2007) fanden heraus, dass Lehrkräfte oft nur

generisches Feedback zur Korrektheit von Aufgaben geben und dass der Unterricht oft

Schwächen im Hinblick auf die Qualität der Förderung aufweist. Sie fordern

entsprechende Unterstützungsmaßnahmen für Lehrkräfte, ihr Wissen über spezifische

Förderungsmöglichkeiten zu erweitern. Die Förderhinweise von SMART können

Lehrkräfte dabei unterstützen, Unterricht so zu gestalten, dass ein ausschließlicher

Fokus auf prozedurales Wissen sowie die Begünstigung von Fehlvorstellungen

vermieden werden. Schließlich kann der Einsatz von SMART (ggf. in Kombination mit

weiteren Fortbildungsaktivitäten) Lehrkräfte möglicherweise dabei unterstützen, den

Fokus von zu stark geprägtem summativem zu formativem Assessment zu verschieben

(Stacey et al., 2018).

3. Fragestellung

Die Entwicklung der Diagnose- und Förderkompetenz von Lehrkräften ist ein wichtiger

Bestandteil der Professionalisierung von Lehrkräften. Es besteht die Annahme, dass

SMART als digitales Tool zur Unterstützung der Diagnose und Förderung im Fach

Mathematik das Potential hat Lehrkräfte in diesen Kompetenzen zu stärken. Im Rahmen

dieses Beitrags soll aus der Perspektive des „Formativen Assessments“ nach Leuders

und Kolleg:innen (2022) untersucht werden, ob diese Annahme bestätigt werden kann.

Dazu gehen wir folgender Fragestellung nach: Inwiefern wird bei einer Analyse von

Fallbeispielen eine Professionalisierung von Lehrkräften durch den Einsatz von SMART

hinsichtlich der Diagnose- und Förderkompetenz anhand sichtbar?

122

4. Methode

4.1. Erfassung von Diagnose- und Förderkompetenz mittels Fallbeispielen

Aus dem Desiderat, dass sich bisher kein Instrument zur Erfassung diagnostischer

Kompetenz im Themenbereich „Funktionen“ eignete, um die Wirkungen von

Fortbildungen zu untersuchen, wurde von Busch et al. (2015) ein neues Instrument

generiert. Dabei sollen Lehrkräfte speziell designte Fallbeispiele von Schüler:innen

beurteilen. Das Instrument wurde auf Grundlage der Szenariobeurteilung erstellt (Klug

et al., 2013). In der Fallbeurteilung geht es vor allem um die Phasen der „action“ und

„postaction“, da nach einem Diagnoseurteil auch Förderansätze formuliert werden

sollen. Die Diagnoseurteile werden dabei nicht nur auf Basis ihrer Urteilsgenauigkeit

überprüft, sondern mithilfe verschiedener Merkmale (s. Tabelle 1 in 4.2), sodass auch

implizites diagnostisches Denken berücksichtigt wird. Die Fälle, die für das fallbasierte

Lernen verwendet werden, sind problemhaltige Darstellungen von Lehr- und

Lernsituationen. Sie stammen aus einer realistischen Unterrichtspraxis, bilden eine

Brücke zwischen praktischer Anwendung und theoretischem Wissen und dienen als

Hinweisreize für das diagnostische Denken (von Aufschnaiter et al., 2017). Die

Antworten zu den Fallbeispielen sind im Sinne des DiaCoM-Rahmenmodells als

externale Ergebnisindikatoren zu verstehen. Die Analyse dieser ermöglicht einen

Einblick in das diagnostische Handeln. Das Instrument von Klug und Kolleg:innen

(2013) wurde zur Erfassung von Wirksamkeiten einer konkreten Intervention (bspw.

Fortbildungen) sensitiviert und eignet sich daher ebenfalls zur Erfassung der

potenziellen Wirksamkeit von SMART (Busch et al., 2015).

4.2. Adaption und Weiterentwicklung des Testinstruments

Das Instrument von Busch et al. (2015) wurde zunächst für den Themenbereich

„Algebra“ adaptiert. Dazu wurden vier Fallbeispiele von Schüler:innenlösungen

generiert, welche die Lehrkräfte beurteilen sollen. Die Fallbeispiele stellen typische

Lösungen zu Aufgaben zum Variablenbegriff und dem Verständnis von Termen und

Gleichungen dar und beinhalten häufige Fehlvorstellungen. Abbildung 6 zeigt

exemplarisch eines der vier Fallbeispiele, bei der die verbreitete „Variable als

Abkürzung für ein Objekt”-Fehlvorstellung vorliegt (vgl. 2.2). Mit dem relevanten

fachdidaktischen Wissen kann erkannt werden, dass dieser Schüler die Variable nicht als

Platzhalter für einen numerischen Wert, sondern vielmehr als Abkürzung für ein Objekt

interpretiert („k“ steht für Kaugummis). Zusätzlich wird bereits eine mögliche Lösung in

den Term mit aufgenommen („Lösung als Koeffizient”-Fehlvorstellung, vgl. Abbildung 3)

123

und die Gleichung wird wie ein Lösungssatz gelesen („4 Kaugummis und 5 Bonbons

kosten zusammen 80 Cent”).

Abbildung 6: Fallbeispiel: Kiosk aus dem Prätest

Das ursprüngliche Instrument von Busch et al. (2015) fokussierte vor allem die

diagnostischen Aktivitäten. In einem nächsten Schritt werden zu den Fallbeispielen je

vier offene Fragen formuliert, um beide Kompetenzbereiche zu erfassen, indem sowohl

Details zur Diagnose als auch Ansätze zur spontanen und zur geplanten Förderung

adressiert werden (s. Abbildung 7).

Abbildung 7: Items bezüglich der Diagnose und Förderung von Lernenden

Die Items sind so formuliert, dass Gelegenheiten entstehen, relevante Aspekte des

fachdidaktischen Wissens bezüglich Diagnose und Förderung zu thematisieren. Bei Item

1 und 2 liegt dabei ein höherer Fokus auf der Diagnose: Item 1 ist bewusst so formuliert,

dass die Lehrkraft entscheiden muss, was sie unter „Beurteilen“ versteht, während Item

2 dann eine verstehensorientierte Sichtweise in den Vordergrund stellt. Item 3 und 4

fokussieren hingegen die Förderung mit jeweils unterschiedlichem Planungs- und

Formalitätsgrad (vgl. Heritage, 2007; Shavelson et al., 2008): Item 3 fragt nach einem

spontanen Tipp an einzelne Lernende, im Sinne des „on-the-fly assessments“. Auch

124

wenn in der Testsituation die Eingabe ohne Zeitbegrenzung erfolgte und die Bearbei-

tung von Fällen es ermöglicht, die Situation gezielt aus verschiedenen Perspektiven zu

betrachten, ohne dabei unter unmittelbarem Handlungsdruck zu stehen (vgl. Krammer

et al., 2012), soll dieser Prompt eine Antwort anregen, die einer spontanen Reaktion

möglichst nahe kommt. Item 4 hingegen erfragt bei der Lehrkraft, welches weitere

Vorgehen ihrer Meinung nach am besten zur Förderung geeignet wäre, im Sinne eines

„planned-for-interaction assessments“. Es ist nicht auszuschließen, dass Lehrkräfte beim

Beantworten der Fragen bei allen Items jeweils Aspekte zur Diagnose und/oder zur

Förderung nennen, weswegen in der Auswertung für beide Facetten alle Items

berücksichtigt werden.

Im Rahmen der Auswertung wurde eine qualitative Analyse durchgeführt. Für den

Aspekt der Diagnosekompetenz wurde anhand des Kategoriensystems und der

Merkmale von Busch et al. (2015) kodiert. Zur Kodierung der Förderkompetenz wurde

dieses Kategoriensystem für die Förderung adaptiert und ergänzt. In Tabelle 1 ist die

entwickelte Systematik in Kategorien mit dazugehörigen Merkmalen dargestellt.

Kategorie

Merkmal zur Diagnose

Merkmal zur Förderung

1. Aktivität

– Beschreibung

– Bewertung

– Korrektur

– Analyse

– Motivational

– Kalkülorientiert

– Verstehensorientiert

2. Fokus

– Konkreter Bezug zu Defiziten

– Planungs- und Formalitätsgrad

der Förderung

3. Qualitätsmerkmale

– Bezug zu Stärken

– Erklärung für Defizite

– Anwendung von

fachdidaktischem Wissen

– Bezug zur Diagnose

– Konkretheit

– Anwendung von

fachdidaktischem Wissen

4. Verständlichkeit

– Fehlerbehaftete Diagnose

– Unverständliche Diagnose

– Unverständliche Förderung

Tabelle 1: Kategorien und dazugehörige Merkmale zur Auswertung

4.3. Durchführung der Untersuchung

Nach der Adaption wurde ein webbasierter Fragebogen erstellt und die Items kamen

sowohl in einem Prä- als auch in einem Posttest zum Einsatz. Im Vergleich zur Arbeit

von Klug et al. (2013) wurden im Prä- und Posttest jeweils zwei Fallbeispiele integriert,

125

um ein Diagnose- und Förderverhalten über unterschiedliche Bearbeitungen

beobachten zu können.

Das entwickelte Instrument wurde an fünf Lehrkräften vor und nach dem Einsatz von

SMART eingesetzt. Dabei lag zwischen dem Einsatz der beiden Fragebögen ein Abstand

von ca. vier Wochen, in denen die Lehrkräfte jeweils zwei SMART-Tests mit ihren

eigenen Schüler:innen eingesetzt und eine Unterrichtsreihe zum Thema Variablen auf

Basis der Testergebnisse durchgeführt haben. Alle Teilnehmenden sind

Mathematiklehrkräfte an unterschiedlichen Gymnasien in Nordrhein-Westfalen (weitere

Informationen zur Stichprobe in Tabelle 2).

Tabelle 2: Stichprobe

Die Bearbeitungsdauer des Testinstruments lag bei ungefähr 15–20 Minuten. Es gab

keine zeitliche Begrenzung und räumliche Vorgabe für die Bearbeitung. Der Beginn der

Untersuchung und dementsprechend auch der erste Einsatz der SMART-Tests konnte

von den Lehrkräften flexibel gewählt werden, damit diese ihn möglichst gut in die eigene

Unterrichtsplanung integrieren konnten. Im Anschluss an die Erhebung wurden die

Antworten der Lehrkräfte mithilfe des weiterentwickelten Kodiersystems untersucht.

Jede Lehrkraft wurde vom ersten Autor hinsichtlich der Kategorien kodiert. Die

Kodierungen wurden von mindestens einer weiteren Person überprüft und etwaige

Unstimmigkeiten wurden geklärt.

5. Ergebnisse

Im Folgenden werden die Antworten von fünf Lehrkräften miteinander verglichen.

Dabei werden Lehrkraft 1 und 2 sowie 3 und 4 gemeinsam dargestellt, da diese ähnliche

Antwortmuster aufweisen und damit je einem Fallbeispiel zugeordnet werden.

Lehrkraft

Geschlecht

Alter

Berufserfahrung

Lehrkraft 1

männlich

30 bis 39

Weniger als 2 Jahre

Lehrkraft 2

weiblich

30 bis 39

2 bis 5 Jahre

Lehrkraft 3

weiblich

50 bis 59

Mehr als 10 Jahre

Lehrkraft 4

männlich

30 bis 39

6 bis 10 Jahre

Lehrkraft 5

männlich

30 bis 39

Mehr als 10 Jahre

126

5.1. Fallbeispiel 1: Steigerung der Förderkompetenz bei mittlerem Ausgangsniveau

Bei Lehrkraft 2 erfolgt eine Diagnose der Fehlvorstellungen im Prä- und Posttest auf

einer vorwiegend allgemeinen sprachlichen Ebene („Anton hat die Situation richtig

erfasst und in seiner Gleichung direkt die „Lösung“ eingebaut“). Die Fehlvorstellung LAK

wird erkannt, aber eher implizit benannt. Die Förderansätze sind im Prätest eher

oberflächlich und verharren auf einer motivationalen Ebene („Lies nochmal die Situation

und versuche die Situation genau so darzustellen wie sie geschildert wird“) oder

orientieren sich an allgemeinen Vorgehensweisen, bspw. Strategien zur Lösung von

Textaufgaben („Informationen aus dem Text markieren; Schritte für Textaufgaben

notieren“). Im Posttest fallen die Förderansätze bei gleicher, impliziter Diagnose

konkreter aus. Es werden Bezüge zur Variablenbedeutung gezogen und die Hinweise

rekurrieren auf die Aufgabe und die Lösung des Schülers. („Ich würde ihm sagen er soll

aufschreiben was b und t bedeutet und wenn b und t jeweils die Anzahl der

Tulpen/Blütenblätter sein soll dann würde ich sagen er soll mal überlegen, wie die

Werte bei 2 Tulpen/3 Tulpen usw. wären. Man multipliziert die Anzahl der Tulpen mit 6

und erhält dadurch die Anzahl der Blütenblätter b“).

Bei Lehrkraft 1 zeichnet sich ein ähnliches Bild ab, wobei bei der Diagnose und

Förderung im Prätest ein höheres Ausgangsniveau sichtbar wird. Die Diagnosen sind im

Prätest sprachlich präzise an den Fehlvorstellungen ausgerichtet („Für Anton scheint k

für das Objekt Kaugummi zu stehen und er denkt vermutlich an eine sprachliche Form

der Gleichung: ‚4 Kaugummis und 5 Bonbons kosten 80 Cent‘. Dabei hat er im Kopf

anscheinend bereits eine Lösung“), was sich dann auch im Posttest zeigt („Florian

verwechselt Variable mit dem Objekt selbst. Vermutlich eine direkte quasi wörtliche

Übersetzung: Jede t – Tulpe ergibt 6 b – Blätter“). Trotz präziser Förderansätze im

Prätest wird keine Fachsprache erkennbar, um den Lernstand konkret zu fassen

(„Bedeutung von Variablen klären. Fokus auf: steht für einen Zahlenwert. Klären: welche

Bedeutung hat die Zahl im Kontext? Sprachliche Übersetzung konterkarieren und

Strategien zum Überschlagen besprechen“). Im Zusammenhang mit dem Explizieren,

wofür die Variable steht, kann das Überschlagen durchaus eine gute Strategie sein,

allerdings sind die Ansätze eher vage und fokussieren nicht im Detail die

Fehlvorstellung. Im Posttest bezieht sich Lehrkraft 1 dann konkreter auf die

diagnostizierte Fehlvorstellung („Strategien entwickeln und üben, um die intuitive Falle

des wörtlichen Verstehens zu hinterfragen. Zum Beispiel indem einfache

Zahlenbeispiele verwendet werden und oft klarstellen lassen, was die Bedeutung von

Variablen ist – mit Fokus darauf, dass es um Anzahlen, Zahlenwerte etc. geht und nicht

um die Objekte selbst. Ich würde den Schüler fragen: Kannst du die Gleichung in Worte

fassen, wobei du zweimal das Wort Anzahl benutzt?“). Die Förderung wird in Bezug zur

127

Variablenbedeutung mit dem Fokus auf die Anzahlen deutlich verstehensorientierter

und den Kern des Problems treffend gestaltet.

Zusammenfassend lässt sich sagen, dass bei beiden Lehrkräften keine Veränderung

bezüglich der Diagnosen sichtbar wird. Allerdings werden die Schwierigkeiten des

Schülers ohnehin schon treffend beschrieben, wenn auch an manchen Stellen teilweise

implizit. Beide Lehrkräfte zeigen aber beim zweiten Test einen erkennbaren Zuwachs

der Förderkompetenz, was sich an einer präziseren Sprache und am Benennen

konkreter Ansätze zur Förderung widerspiegelt.

5.2. Fallbeispiel 2: Gleichbleibende Förderkompetenz bei hohem Ausgangsniveau

Lehrkraft 5 zeigt, ähnlich wie Lehrkraft 1 und 2, eine eher implizite Diagnose der

Fehlvorstellungen im Prä- und Posttest. Eine präzise Benennung der Fehlvorstellungen

bleibt damit aus („Florian hat die sprachlich dargestellte Aufgabenstellung „1 zu 1“ also

wörtlich in die mathematischen Symbole übersetzt.“). Allerdings zeigen die

Förderansätze bereits von Beginn an ein explizites fachdidaktisches Wissen. Im Prätest

wird die Variablenbedeutung direkt angesprochen („x und y (oder hier k und b) stehen

für "Unbekannte". Welche beiden Informationen sind in der Aufgabenstellung

unbekannt? Schreibe die Bedeutung deiner Variablen auch immer auf. (z. B. k = Anzahl

der Kaufgummis)“) und das Ziel besteht in der Förderung darin, genauer nachzuvoll-

ziehen, was sich der Schüler denken könnte („Grundsätzlich hat auch Anton verstanden,

wie er mit Unbekannten und Gleichungen umgeht. Ich würde ihn im nächsten Schritt

eine ähnliche Aufgabe bearbeiten lassen und sie mir von ihm erklären lassen und ihm

dabei genau zuhören und ggf. nachfragen.“). Diese Lehrkraft formuliert auch im Posttest

Förderansätze, welche auf ähnliche Weise das Verstehen des Schülers ansprechen, zum

Beispiel indem vor dem Lösen immer die Bedeutung der Variablen festgehalten und

nach dem Lösen Zahlenbeispiele in die Gleichung eingesetzt und Ergebnisse auf Logik

überprüft werden sollen. Bei dieser Lehrkraft wird keine Veränderung bezüglich der

Diagnosen sichtbar, ebenso wie bei der Förderung. Allerdings befanden sich die

Diagnosen bereits auf einem angemessenen und insbesondere die Förderansätze auf

einem hohen Niveau, so dass im Vergleich zu den anderen Lehrkräften kein Zuwachs

notwendig wäre.

5.3. Fallbeispiel 3: Steigerung der Förderkompetenz bei geringem Ausgangsniveau

Beide hier betrachteten Lehrkräfte (3 und 4) benennen weder im Prä- oder Posttest

Fehlvorstellungen oder stellen sogar fehlerhafte Diagnosen auf.

128

Sie erkennen beide zwar im Prätest, dass die Lösung nicht korrekt ist, interpretieren die

Variablen in Antons Gleichung allerdings nicht als Fehler dahingehend, dass die

Variablen als Objekte wahrgenommen werden, sondern als Preis eines Kaugummis bzw.

Bonbons statt Anzahl (Lehrkraft 4: „Die Gleichung ist nicht sinnvoll. Die Variablen

stehen hier für den Preis eines Kaugummis bzw. für den Preis eines Bonbons. Beides ist

jedoch bekannt“). Diese Art die Variablen zu verstehen ist nicht falsch, allerdings würde

durch diese Interpretation eine potenzielle Fehlvorstellung unentdeckt bleiben. Im

Zweifel wäre es dann wichtig, beim Schüler nachzufragen, wie die Variablen gemeint

sind. Allerdings stellt Lehrkraft 3 in der Förderung eher eine vage Rückfrage („Anton,

was wird in der Aufgabe gesucht?“) und formuliert eine unklare Förderung („Ich würde

mit Anton gemeinsam die Gleichung finden“).

Im Posttest bleiben die Diagnosen eher uneindeutig (Lehrkraft 3: „Florian hat Tulpen

und Blätter vertauscht“) oder sogar fehlerhaft (Lehrkraft 4: „Bei Florian soll t für die

Tulpenanzahl stehen, b für die Anzahl der Blätter. Dann wäre die Gleichung aber

falsch.“), denn in Florians Gleichung t = 6b stehen die Variablen gerade nicht für die

Anzahlen, sondern für die Objekte selbst. Ungeachtet dessen werden die Förderansätze

konkreter, indem bspw. Rückfragen zur Variablenbedeutung gestellt werden (Lehrkraft

3: „Sind es also nun mehr Tulpen als Blätter?“) oder sogar die Schwierigkeit von

Variablen mit gleichem Anfangsbuchstaben explizit aufgegriffen wird (Lehrkraft 4: „Ich

würde deutlich machen, dass die Variablen nicht den Anfangsbuchstaben der in einer

Aufgabe vorkommenden Begriffe entsprechen müssen. Vorher immer festlegen, wofür

welche Variable steht.“).

Beim Betrachten der beiden Fälle wurde keine Veränderung bezüglich der Diagnosen

sichtbar. Allerdings weisen die Förderansätze im zweiten Test weniger allgemeine und

mehr konkrete Hinweise auf, die sich an den Fehlvorstellungen orientieren.

6. Diskussion

Diese Studie hatte das Ziel zu untersuchen, welches Potential der Einsatz von SMART auf

die Professionalisierung von Mathematiklehrkräften haben kann. Dazu wurde die

Entwicklung der Diagnose- und Förderkompetenz mit Hilfe von Fallbeispielen vor und

nach dem Einsatz von SMART im Bereich elementarer Algebra untersucht.

In den Prätests konnten bezüglich der diagnostischen Aktivitäten die Antworten der

Lehrkräfte oft über die Ebenen der „Beschreibung“ und „Korrektur“ hinaus als „Analyse“

der Schüler:innen-Lösungen kodiert werden. Dieses Ergebnis weist darauf hin, dass die

meisten Lehrkräfte auch ohne Intervention in der Lage waren, eine angemessene

Diagnose der Schüler:innen zu geben. Allerdings wurde auch festgestellt, dass die

129

Lehrkräfte dabei hinsichtlich der Qualitätsmerkmale (vgl. Tabelle 1 in 4.2) besonders

selten fachdidaktisches Wissen anwendeten, um die Fehlvorstellungen der

Schüler:innen zu diagnostizieren und explizit zu benennen. Stattdessen umschreiben

Lehrkräfte bspw. Fehlvorstellungen mit eigenen Worten, was dazu führen kann, dass die

Präzision der Diagnose eingeschränkt und wichtige Aspekte oft nicht benannt werden.

Diese gewonnene Erkenntnis deckt sich mit den Ergebnissen der Studie von Busch und

Kolleg:innen (2015).

Dass dieses Nicht-Benennen offenbar auf einem Nicht-Erkennen fundiert, zeigt sich in

den angegebenen Fördermöglichkeiten der Lehrkräfte. Diese werden dann meistens

unpräzise formuliert und richten sich häufig an motivationale oder Rechenstrategien

und weniger an Verstehensorientierung. Im Allgemeinen konnte bezogen auf die

Förderaktivität festgestellt werden, dass Lehrkräfte, die kein fachdidaktisches Wissen in

der Diagnose anwenden, öfters vielmehr kalkülorientierte oder motivationale

Förderhinweise geben. Auch das deckt sich mit den Ergebnissen bisheriger Studien, dass

Lehrkräfte mit geringem fachdidaktischem Wissen in der Förderung häufig auf einer

oberflächlichen und motivationalen Ebene bleiben (vgl. Busch et al., 2015; Laschke et al.,

2022).

Zu der Wirksamkeit von SMART zur Entwicklung von Diagnose- und

Förderkompetenzen bei Lehrkräften zeigen die vorgestellten Fallbeispiele bereits

vielversprechende Ergebnisse. Während sich nur wenige Unterschiede in der Diagnose

gezeigt haben, zeigten alle Lehrkräfte eine präzisere und stärker an den konkreten

Fehlern bzw. Fehlvorstellungen orientierte Förderung im Posttest. Wenn die Lehrkräfte

bereits im Prätest schon verstehensorientierte Förderansätze zeigten, dann wurde die

anschließende Förderung präziser und unter Verwendung von konkreteren Begriffen

gestaltet (siehe Fallbeispiel 1). Lehrkräfte, deren genannte Fördermaßnahmen noch auf

einem eher allgemeinen und oberflächlichen Niveau waren, wiesen im Posttest

zumindest eine stärkere Orientierung an der Variablenbedeutung und direkte Bezüge

zur Aufgabe auf (Fallbeispiel 3). Wenn eine Lehrkraft bereits vorher ausführliche

Förderansätze formuliert hat, dann konnte sie dies auch im Posttest demonstrieren

(Fallbeispiel 2). Diese Ergebnisse decken sich mit der Erwartung, dass die

Förderhinweise von SMART Lehrkräfte dabei unterstützen können, Unterricht so zu

gestalten, dass ein ausschließlicher Fokus auf prozedurales Wissen vermieden wird. Bei

den untersuchten Fällen werden bereits Unterschiede in der Qualität der Förderung

zwischen Prä- und Posttest sehr deutlich. Insbesondere das von den Lehrkräften in den

Posttests angewendete stoffdidaktische Wissen, das sich sehr spezifisch auf den in den

Tests adressierten, mathematischen Kern bezieht und die daraus resultierende klare

130

Benennung von Fehlvorstellungen zeigen augenscheinlich das erweiterte Wissen der

Lehrkräfte.

Diese Veränderung insbesondere auf Seiten der Förderung könnte damit erklärt

werden, dass der besondere Kern von SMART als technologiegestütztes Formatives

Assessment (s. Kapitel 2.2) die Aufgabe der „Analyse“ ist. Der Prozess der Diagnose liegt

als erweiterte Analyse vor allem beim SMART System. In Bezug auf das „Adaptieren“

übernimmt SMART eher eine passive Rolle und lässt die inhaltliche Gestaltung der

Förderung in der Hand der Lehrkraft. Dementsprechend ist eine Entwicklung stärker im

Bereich der Förderung zu erwarten gewesen.

Die Ergebnisse dieser Studie sollen unter anderem in einer Gesamtstudie zur

Wirksamkeit von SMART angewendet werden, bei der noch weitere Aspekte

professioneller Kompetenz, wie Personencharakteristika über standardisierte

Fragebögen ermittelt werden (bspw. die Selbstwirksamkeitsüberzeugungen unter

anderem zum Einsatz digitaler formativer Assessment Werkzeuge). Des Weiteren wird

eine größere Zahl an Lehrkräften untersucht und neben dem Einsatz von SMART auch

mit einer Gruppe an Lehrkräften verglichen, die an einer klassischen

Lehrkräftefortbildung teilgenommen haben. Wenn sich die Entwicklungspotentiale von

SMART weiterhin bestätigen lassen, wäre es eine ökonomische und leicht skalierbare

Unterstützungsmaßnahme für Lehrkräfte, ihr Wissen über spezifische

Förderungsmöglichkeiten zu erweitern – wie es bereits von Pianta und Kolleg:innen

(2007) gefordert wurde. Zudem soll das Zusammenwirken der Erkenntnisse der

Kompetenzentwicklung auf Lehrkräfteebene mit der Entwicklung des Lernstandes auf

Schüler:innenebene näher synthetisch betrachtet werden.

Literaturverzeichnis

Aldon, G., Barzel, B., Cusi, A. & Olsher, S. (angenommen). The functionalities of technology when teachers

realize technology-enhanced formative assessment. In B. Pepin, G. Gueudet & J. Choppin (Hrsg.),

Handbook of Digital Resources in Mathematics Education. Springer Nature.

Bell, B. & Cowie, B. (2001). The characteristics of formative assessment in science education. Science

Education, 85(5), 536–553.

Burkhardt, H. & Schoenfeld, A. (2019). Formative assessment in mathematics. In H.L. Andrade, R.E.

Bennett & G.J. Cizek (Eds.), Handbook of formative assessment in the disciplines (S. 35–67). Routledge.

Busch, J., Barzel, B. & Leuders, T. (2015). Die Entwicklung eines Instruments zur kategorialen Beurteilung

der Entwicklung diagnostischer Kompetenzen von Lehrkräften im Bereich Funktionen. Journal für

Mathematik-Didaktik, 36(2), 315–338.

Corno, L. (2008). On teaching adaptively. Educational Psychologist, 43(3), 161–173.

Eichholz, L., Linker, C. & Schiffer, J. (2023). Födima – Förderorientierte Diagnostik im (inklusiven)

mathematischen Anfangsunterricht. In IDMI-Primar Goethe-Universität Frankfurt (Hrsg.), Beiträge

zum Mathematikunterricht 2022. 56. Jahrestagung der Gesellschaft für Didaktik der Mathematik. WTM.

131

Fischer, A. & Sjuts, J. (2013). Wie wirksam ist forschendes Lernen zum Aufbau diagnostischer Fähigkeiten?

In G. Greefrath, F. Käpnick & M. Stein (Hrsg.), Beiträge zum Mathematikunterricht 2013. Vorträge auf

der 47. Tagung für Didaktik der Mathematik vom 04.03.2013 bis 08.03.2013 in Münster, (S. 312–315).

Helmke, A. (2012). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesserung

des Unterrichts (4. Aufl.). Klett-Kallmeyer.

Heritage, M. (2007). Formative Assessment: What Do Teachers Need to Know and Do? Phi Delta Kappan,

89(2), 140–145.

Klug, J., Bruder, S., Kelava, A., Spiel, C. & Schmitz, B. (2013). Diagnostic competence of teachers: A process

model that accounts for diagnosing learning behavior tested by means of a case scenario. Teaching and

Teacher Education, 30, 38–46.

Klieme, E. & Warwas, J. (2011): Konzepte der Individuellen Förderung. Zeitschrift für Pädagogik, 57(6),

805–818.

Klingbeil, K., Rösken, F., Barzel, B., Schacht, F., Thurm, D. & Kortenkamp, U. (2022). Verstehensorienterte

Online-Diagnostik – Ein SMARTer Weg. In F. Reinhold & F. Schacht (Hrsg.), Digitales Lernen in Distanz

und Präsenz: Herbsttagung 2021 des Arbeitskreises Mathematikunterricht und digitale Werkzeuge in der

Gesellschaft für Didaktik der Mathematik am 24.09.2021, (S. 65–71).

Krammer, K., Lipowsky, F., Pauli, C., Schnetzler, C. & Reusser, K. (2012). Unterrichtsvideos als Medium zur

Professionalisierung und als Instrument der Kompetenzerfassung von Lehrpersonen. In M. Kobarg, C.

Fischer, I. Dalehefe, F. Trepke & M. Menk (Hrsg.), Lehrerprofessionalisierung wissenschaftlich begleiten –

Strategien und Methoden (S. 69–86). Waxmann.

Laschke, C, Jenßen, L. & Rösken-Winter, B. (2022). Dimensions of pre-service teachers‘ diagnostic

judgments of student solutions. In C. Fernández, S. Llinares, Á. Gutiérrez & N. Planas (Eds.), Proceedings

of the 45th conference of the international group for the psychology of mathematics education (Vol. 3,

S. 115–122). PME.

Lee, H., Chung, H.Q., Zhang, Y., Abedi, J. & Warschauer, M. (2020). The effectiveness and features of

formative assessment in US K-12 education: a systematic review. Applied Measurement in Education,

33(2), 124–140.

Leuders, T., Loibl, K., Sommerhoff, D., Herppich, S. & Praetorius, A.-K. (2022) Toward an Overarching

Framework for Systematizing Research Perspectives on Diagnostic Thinking and Practice. Journal für

Mathematik-Didaktik 43, 13–38.

Leuders, T. & Prediger, S. (2017): Flexibel differenzieren erfordert fachdidaktische Kategorien. In J.

Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht

umgehen lernen (S. 3–16). Springer Spektrum.

Lipowsky, F. (2014). Theoretische Perspektiven und empirische Befunde zur Wirksamkeit von Lehrerfort-

und -weiterbildung. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum

Lehrerberuf (2., überarb. Aufl., S. 511–541). Waxmann.

Loibl, K., Leuders, T. & Dörfler, T. (2020). Diagnostische Urteile von Lehrkräften erklären – Ein

Rahmenmodell für kognitive Modellierungen und deren experimentelle Prüfung.

Unterrichtswissenschaft, 48, 493–502.

Pianta, R. C., Belsky, J., Houts, R. & Morrison, F. (2007). Opportunities to learn in America’s elementary

classrooms. Science, 315(5820), 1795–1796.

Rakoczy, K., Klieme, E., Leiss, D. & Blum, W. (2017). Formative assessment in mathematics instruction:

theoretical considerations and empirical results of the Co2CA project. In D. Leutner, J. Fleischer, J.

Grünkorn & E. Klieme (Hrsg.), Competence assessment in education: research, models, and instruments

(S. 447–467). Berlin: Springer.

Schütze, B., Souvignier, E. & Hasselhorn, M. (2018). Stichwort: Formatives Assessment.

Zeitschrift für Erziehungswissenschaft, 21(4), 697–715.

Shavelson, R. J., Young, D. B., Ayala, C. C., Brandon, P. R., Furtak, E. M., Ruiz-Primo, M. A., Tomita, M. K. & Yin,

Y. (2008). On the Impact of Curriculum-Embedded Formative Assessment on Learning: A Collaboration

between Curriculum and Assessment Developers. Applied Measurement in Education, 21, 295–314.

Stacey, K., Steinle, V., Price, B. & Gvozdenko, E. (2018). Specific mathematics assessments that reveal

thinking: An online tool to build teachers’ diagnostic competence and support teaching. In T. Leuders, J.

Leuders, K. Philipp & T. Dörfler (Eds.), Diagnostic competence of mathematics teachers – Unpacking a

complex construct in teacher education and teacher practice (S. 241–263). Springer.

132

Stacey, K. & Wiliam, D. (2013). Technology and assessment in mathematics. In M. A. K. Clements, A. J.

Bishop, C. Keitel, J. Kilpatrick & F. K. S. Leung (Hrsg.), Third international handbook of mathematics

education (S. 721–751). Springer.

Steinle, V., Gvozdenko, E., Price, B., Stacey, K. & Pierce, R. (2009). Investigating students’ numerical

misconceptions in algebra. In R. Hunter, B. Bicknell & T. Burgess (Hrsg.), Crossing divides – Proceedings

of the 32nd Annual Conference of the Mathematics Education Research Group of Australasia (Vol. 2)

(S. 491–498). MERGA.

Südkamp, A., Kaiser, J. & Möller, J. (2012). Accuracy of teachers’ judgements of students’ academic

achievement: a meta-analysis. Journal of Educational Psychology, 104(3), 743–762.

Von Aufschnaiter, C., Selter, C. & Michaelis, J. (2017). Nutzung von Vignetten zur Entwicklung von

Diagnose- und Förderkompetenzen – Konzeptionelle Überlegungen und Beispiele aus der MINT-

Lehrerbildung. In C. Selter, S. Hußmann, C. Hößle, C. Knipping, K. Lengnink & J. Michaelis (Hrsg.),

Diagnose und Förderung heterogener Lerngruppen. Theorien, Konzepte und Beispiele aus der MINT-

Lehrerbildung (S. 85–105). Waxmann.

Wiliam, D. (2019). Conclusion: why formative assessment is always both domain-general and domain-

specific and what matters is the balance between the two. In H. L. Andrade, R. E. Bennett & G. J. Cizek

(Eds.), Handbook of formative assessment in the disciplines (S. 243–264). Routledge.

Wiliam, D., Lee, C., Harrison, C. & Black, P. (2004). Teachers developing assessment for learning: impact on

student achievement. Assessment in Education: Principles, Policy and Practice, 11(1), 49–65.

Yan, Z. & Pastore, S. (2022): Assessing Teachers’ Strategies in Formative Assessment: The Teacher

Formative Assessment Practice Scale, Journal of Psychoeducational Assessment, 1–13.

Autor:innen

Fabian Rösken promoviert nach dem Abschluss des Studiums für Lehramt an Grundschulen an der

Universität Duisburg-Essen als wissenschaftlicher Mitarbeiter am Institut für Didaktik der Mathematik.

Seine Forschungsschwerpunkte umfassen die Entwicklung des formativem Assessment Tools „SMART“

und die Professionalisierung von Lehrkräften.

Katrin Klingbeil ist Studienrätin für die Fächer Mathematik und Musik an Gymnasien und Gesamtschulen

und promoviert derzeit als abgeordnete Lehrerin am Institut für Didaktik der Mathematik der Universität

Duisburg-Essen. Ihre Forschungsschwerpunkte liegen auf formativem Assessment und dem Lernen von

Algebra.

Bärbel Barzel, Prof. Dr., ist Professorin für Didaktik der Mathematik und Vorstandsvorsitzende des

interdisziplinären Zentrums für Bildungsforschung an der Universität Duisburg-Essen. Ihre

Forschungsschwerpunkte liegen im Einsatz von Medien, Professionalisierung von Lehrkräften und

formativen Assessment in der Mathematik.

Florian Schacht, Prof. Dr., ist Professor für Didaktik der Mathematik und wissenschaftlicher Leiter des

Zentrums für Lehrkräftebildung an der Universität Duisburg-Essen. Seine Forschungsschwerpunkte sind

Lehr-Lernforschung im Fach Mathematik, Professionalisierungsforschung und hochschuldidaktische

Fragen, insbesondere zum Einsatz digitaler Medien.