Rösken, F., Klingbeil, K., Barzel, B. & Schacht, F. (2024). Fallbasierte Er-
fassung von Diagnose- und Förderkompetenz: Eine Untersuchung des
Potentials des verstehensorientierten Online-Tools SMART mit Blick auf
Professionalisierung von Lehrkräften. In T. Mayer, L. Meyer-Jenßen, D.
Töpper & N. Uhlendorf (Hrsg.), Interdisziplinäre Beiträge zur Bildungsfor-
schung 2024 (S.111–132). Berlin Universities Publishing.
https://doi.org/10.14279/depositonce-20132
Dieser Beitrag ist unter der Creative Commons Lizenz CC BY 4.0 lizen-
ziert.
Dies gilt nicht für anderweitig gekennzeichnete Inhalte.
https://creativecommons.org/licenses/by/4.0
20
24
INTER
DISZIPLINÄRE
BEITRÄGE
ZUR
BILDUNGS
FORSCHUNG
111
Fabian Rösken, Katrin Klingbeil, Bärbel Barzel & Florian Schacht
Fallbasierte Erfassung von Diagnose- und Förderkompetenz: Eine Untersuchung
des Potentials des verstehensorientierten Online-Tools SMART
mit Blick auf Professionalisierung von Lehrkräften
Zusammenfassung: Verstehensorientierte digitale Diagnose-Tools wie SMART („Specific Mathematics
Assessments that Reveal Thinking“) können Lehrkräfte beim formativen Assessment im
Mathematikunterricht unterstützen. SMART stellt nicht nur Diagnoseaufgaben in einer Online-Umgebung
bereit, sondern insbesondere auch eine erweiterte Analyse der Antwortmuster. Dadurch erhalten
Lehrkräfte im direkten Anschluss an die Testdurchführung Hinweise auf vorhandene Fehlvorstellungen
ihrer Schüler:innen. Ergänzend können konkrete Förderhinweise und Unterrichtsvorschläge den
Lehrkräften bei der anschließenden Adaption des Unterrichts helfen. Insofern kann SMART nicht nur
Auswirkungen auf die Unterrichtsgestaltung und das Verständnis der Schüler:innen haben, sondern auch
auf die Lehrkräfteprofessionalisierung, da Lehrkräfte sich mit der Diagnose und Förderung ihrer eigenen
Schüler:innen forschungsbasiert auseinandersetzen können. Um diese Professionalisierung sichtbar zu
machen, untersucht dieser Beitrag die Entwicklung der Diagnose- und Förderkompetenz von
Mathematiklehrkräften mit Hilfe von Fallbeispielen vor und nach dem Einsatz von SMART im Bereich
elementarer Algebra. Dazu wird ein bestehendes Verfahren zur Erfassung von Diagnosekompetenz für
den Bereich Algebra adaptiert und um die Komponente der Förderkompetenz erweitert. Erste Ergebnisse
in der Untersuchung von fünf Lehrkräften legen nahe, dass eine qualitative Erfassung der Diagnose- und
Förderkompetenz möglich ist und dass sich die Wirksamkeit von SMART vor allem im Bereich der
Förderkompetenz nachzeichnen lassen.
Schlüsselwörter: professionelle Kompetenzen, Lehrkräfteprofessionalisierung, technologiegestützte
Diagnose und Förderung
Abstract: Understanding-oriented digital diagnostic tools such as SMART (“Specific Mathematics
Assessments that Reveal Thinking”) can support teachers in formative assessment in mathematics
teaching. SMART not only provides diagnostic tasks in an online environment, but also, and in particular,
an extended analysis of response patterns. This provides teachers with information about the
misconceptions of their students. In addition, concrete teaching suggestions can help teachers in the
subsequent adaptation of their lessons. In this respect, SMART can not only have an impact on lesson
design and student understanding, but also on teacher professionalisation, as teachers can deal with the
diagnosis and support of their own students in a research-based way. In order to make this
professionalisation visible, this paper investigates the development of mathematics teachers' diagnostic
and support competence with the help of case studies before and after the use of SMART in the area of
elementary algebra. For this, an existing procedure for recording diagnostic competence is adapted for the
area of algebra and extended to include the component of support competence. Initial results from the
study of five teachers suggest that a qualitative assessment of diagnostic and support competence is
possible and that the effectiveness of SMART can be traced.
Keywords: professional competences, teacher professionalisation, technology-supported formative
assessment
1. Diagnostizieren und Fördern als professionelle Kompetenz
1.1. Diagnosekompetenz
Die Diagnosekompetenz von Lehrkräften gilt als zentrale Voraussetzung für
erfolgreiches Lernen der Schüler:innen (Helmke, 2012). Dabei umfassen Diagnosen viele
112
zusammenhängende Aufgabenbereiche, wie die Anwendung und Auswertung von
Testinstrumenten sowie die Beobachtung und Bewertung des Denkens der
Schüler:innen während des Lernens (Leuders et al., 2022). Das Hauptziel besteht darin,
Informationen über die Schüler:innen, den Lernprozess selbst und die erzielten
Lernergebnisse für anschließende Adaptionen im unterrichtlichen Handeln zu sammeln.
Unter Berücksichtigung dieser unterschiedlichen Aufgaben empfehlen Leuders und
Kolleg:innen (2022) eine Differenzierung des Begriffs der „Diagnose“ in die Bereiche des
„diagnostischen Denkens“ und „diagnostischen Handelns“. „Diagnostisches Denken“
wird dabei als die internale Verarbeitung von diagnostischen Informationen aufgefasst,
während diagnostisches Handeln über konkrete externale Indikatoren (wie bspw. die
Verschriftlichung der Gedanken) sichtbar wird (vgl. Loibl et al., 2020, Abbildung 1).
In bisherigen Studien wurden in gleichem Maße diagnostisches Denken und
diagnostisches Handeln untersucht, wobei informelle Diagnosen im Unterrichtskontext
besonders im Fokus der Forschung zur diagnostischen Kompetenz standen (Leuders et
al., 2022). Häufig wird zudem ausschließlich auf die Messung der Urteilsgenauigkeit als
Indikator für diagnostische Kompetenz zurückgegriffen (Südkamp et al., 2012). Dieser
Ansatz kann allerdings dahingehend kritisiert werden, dass die Urteilsgenauigkeit nur
einen kleinen Aspekt der diagnostischen Kompetenz ausmacht und hinterfragt werden
kann, ob diese überhaupt ein Maß für das Verhalten von Lehrkräften sein sollte (Leuders
et al., 2022).
Aus dieser Kritik wurden differenziertere Ansätze entwickelt, beispielsweise die
qualitative Studie zu Szenariobeurteilungen von Klug et al. (2013). Hier ist das
Kompetenzmodell aufgeteilt in drei verschiedene Phasen der Diagnose: „preactional“,
„actional“ und „postactional“. In der Phase „preaction“ sollte das für die Diagnose
relevante Vorwissen aktiviert werden. Das diagnostische Urteil wird folgend in der
Phase „action“ systematisch erstellt und in der Phase „postaction“ werden
Rückmeldungen formuliert und weitere Förderplanungen vollzogen (Klug et al., 2013).
Dieses Modell betont dabei das fachdidaktische Wissen als Vorwissen und eine
anschließende Förderung.
Mithilfe des DiaCoM-Rahmenmodell (Abbildung 1) von Loibl und Kolleg:innen (2020)
lassen sich diagnostische Urteile von Lehrkräften als Informationsverarbeitungs-
prozesse erklären. Es konzeptualisiert die kognitiven Prozesse einer Lehrkraft beim
diagnostischen Beurteilen von Schüler:innen und deren Aufgabenbearbeitungen auf der
Grundlage der Informationen, die explizit oder implizit in einer diagnostischen Situation
vorhanden sind.
113
Abbildung 1: DiaCoM-Rahmenmodell (Loibl et al. 2020, S. 495)
Die zur Erhebung häufig durchgeführte Beobachtung von Unterrichtssituationen oder
die Analyse von Urteilsgenauigkeiten kann eine Herausforderung darstellen, da es
schwierig sein kann, den Einfluss von Kontextfaktoren auf die Diagnosekompetenz
angemessen zu berücksichtigen. Zugleich kann die Selbstbeurteilung der
Diagnosekompetenz durch Lehrkräfte problematisch sein, da es zu Verzerrungen
kommen kann, beispielsweise durch ein über- oder untertriebenes Selbstbild (Busch et
al., 2015). Mit dem DiaCoM-Rahmenmodell können Diagnosesituationen beschrieben
und Annahmen über die Entwicklungsprozesse überprüft werden. Allerdings ist die
Anwendung des DiaCoM-Rahmenmodells beschränkt auf die Prozesse und Produkte, die
mit der unmittelbaren Urteilsbildung nach der Präsentation einer diagnostischen
Situation verbunden sind (Loibl et al., 2020).
1.2. Förderkompetenz
Die Förderkompetenz von Lehrkräften umfasst die Fähigkeit, geeignete
Fördermaßnahmen zu planen und umzusetzen. Da die fördernden Lernangebote
möglichst gut auf die individuellen Lernvoraussetzungen abgestimmt sein sollten
(Corno, 2008), ist die Förderkompetenz eng mit der Diagnosekompetenz der Lehrkraft
verbunden. In den meisten Studien, die Förderkompetenz untersuchen, wird diese als
Teil der diagnostischen Kompetenz mit aufgefasst (Busch et al., 2015). Dieses
gemeinsame Denken von Diagnose und Förderung als Assessment zum Formieren des
Lernprozesses verdichtet sich in der internationalen Forschung zu dem Konzept
„Formatives Assessment“. Gemeint ist damit das Erfassen von Informationen, um
114
anschließend das Lernen zu verbessern, indem der Unterricht und andere weitere
Schritte nach der Diagnose „geformt“ werden (Bell & Cowie, 2001; Schütze et al., 2018).
Zur Förderung der individuellen Lernprozesse von Schüler:innen müssen Lehrkräfte in
der Lage sein, den Unterricht auf die unterschiedlichen Bedürfnisse der Lernenden
abzustimmen und dabei eine Vielzahl von Methoden und Materialien einzusetzen.
Hierbei spielt die Fähigkeit zur Differenzierung des Unterrichts und der Aufgaben eine
wichtige Rolle. Die Fähigkeit, den Unterricht so auf die individuellen Voraussetzungen
und Möglichkeiten der Lernenden anzupassen, dass möglichst günstige Bedingungen für
individuell verstehendes Lernen entstehen, wird auch als adaptive Lehrkompetenz
bezeichnet (Beck, 2008).
Im Rahmen des formativen Assessment als Zusammenspiel von Diagnose und
Förderung, können die Prozesse hinsichtlich ihres Planungs- und Formalitätsgrad
unterschieden werden (vgl. Heritage, 2007; Shavelson et al., 2008). „On-the-fly
assessments“ stellen den Prozess mit der geringsten Planung und Formalität dar. Dabei
handelt es sich um Situationen, in denen Lehrkräfte Fehlvorstellungen und
Verstehenslücken spontan im laufenden Unterricht identifizieren, Feedback geben und
den Inhalt entsprechend anpassen. „Planned-for-interaction“ bzw. „curriculum-
embedded assessments“ sind stärker formalisiert und unterscheiden sich zu spontaner
Förderung durch ihren erhöhten Planungsgrad und die Bindung an schulische
Strukturen wie bspw. Hausaufgaben oder Förderpläne. Bei der Trennung zwischen
spontanen und geplanten Anpassungen des Unterrichts wird auch zwischen Mikro- und
Makroadaptivität unterschieden, wobei eine Mischform der Mesoadaptivität nicht
ausgeschlossen wird (Klieme & Warwas, 2011; Leuders & Prediger, 2017).
In der Literatur finden sich unterschiedliche Ansätze bezüglich der verwendeten
Methoden zur Messung von Förderkompetenz (bspw. zur Erfassung mittels Vignetten;
von Aufschnaiter et al., 2017). Wie die diagnostischen Kompetenzen, sind auch die
Kompetenzen, die für effektive Förderung notwendig sind, sehr komplexe Fähigkeiten,
die nur schwierig zu erfassen und zu messen sind. Zudem gibt es auch in der Praxis
keine einheitlichen Standards für die Förderung individueller Lernprozesse, was die
Definition von Förderkompetenzen und die Entwicklung von Messverfahren zusätzlich
erschwert. Bisher gibt es daher nur wenige Verfahren zur Erfassung der
Förderkompetenz von Lehrkräften, die über Einzelstudien hinausgehen (Yan & Pastore,
2022). In der Regel werden Beobachtungen von Unterrichtssituationen oder die Analyse
von Bearbeitungen von Schüler:innen oder Vignetten herangezogen, um die Fähigkeit
der Lehrkraft zur gezielten Förderung der Schüler:innen zu beurteilen (Busch et al.,
2015).
115
2. SMART als Weg zur Professionalisierung
2.1. Perspektiven auf die Professionalisierung
Leuders und Kolleg:innen (2022) beschreiben in einem Rahmenmodell eine
Systematisierung von Forschungsperspektiven zum diagnostischen Denken und
Handeln. Bei der „Diagnosekompetenz“-Perspektive stehen die Beschreibung, Erklärung
und Vorhersage der Fähigkeiten von Lehrkräften zur Diagnose ihrer eigenen
Schüler:innen im Vordergrund. Untersucht werden entweder die nötigen Eigenschaften
für erfolgreiche Diagnosen oder das tatsächliche diagnostische Handeln kompetenter
Lehrkräfte (Leuders et al., 2022). Forschung aus der „Kognitiven Modellierungs“-
Perspektive versucht theoretisch zu beschreiben und empirisch zu erklären, wie
diagnostische Urteile auf der Grundlage der verschiedenen Charakteristika einer
Lehrkraft entstehen (vgl. DiaCoM-Rahmenmodell Loibl et al., 2020; Leuders et al., 2022).
Professionalisierungsforschung aus der Sicht der „Lehrkräftebildungs“-Perspektive
fokussiert vornehmlich, wie angehende Lehrkräfte oder Berufseinsteiger:innen in der
Entwicklung ihrer Diagnose- und Förderkompetenz unterstützt werden können
(Leuders et al., 2020). Forschung aus der „Formativen Assessment“-Perspektive
untersucht das diagnostische Handeln und damit assoziierte Unterrichtspraktiken (wie
bspw. Vorgehensweisen bei der Förderung). Ziel dieser Forschungsperspektive ist es,
das diagnostische Handeln zu beschreiben und zu erklären, wie mit dessen Hilfe die
Schüler:innen gefördert werden können (Leuders et al., 2022).
Insbesondere die „Formative Assessment“-Perspektive auf Lehrerprofessionalisierung
gewinnt durch zahlreiche Interventionsstudien an Bedeutung. Das Ziel der Intervention
besteht meistens in der Implementation von Diagnose- und Förderpraktiken und es
werden eher weniger alternative Wege der Professionalisierung verglichen (Lee et al.,
2020; Wiliam, 2019). Bei den Interventionen handelt es sich meistens um klassische
Lehrkräftefortbildungen (Wiliam et al., 2004) oder die Bereitstellung von
weiterführenden Materialien für den Unterricht (Burkhardt & Schoenfeld, 2019). Da Ziel
der Interventionen besteht meistens in einer Verbesserung des Unterrichts durch eine
konstante Umsetzung des formativen Assessments in der Unterrichtspraxis (Burkhardt
& Schoenfeld, 2019; Rakoczy et al., 2017) mit einem Schwerpunkt auf der Wirksamkeit
des formativen Assessments.
Besonders im Bezug zur Wirksamkeit von formativem Assessment gewinnen
Interventionsstudien zur Erfassung professioneller Kompetenz – allen voran die
Diagnosekompetenz – in den letzten Jahren an Bedeutung. Ein Beispiel ist das laufende
Projekt FÖDIMA (Eichholz et al., 2023). Hier soll mittels Vignetten und Fragebögen
untersucht werden, inwiefern sich die Diagnose- und Förderkompetenz von Lehrkräften
116
in Bezug auf das Stellenwert- und Operationsverständnis im Vergleich von zwei
Fortbildungsmodellen entwickeln. Lehrkräfte lernen auf Basis der Arbeit von Shavelson
und Kolleg:innen (2008) entweder Diagnoseansätze und Fördermaßnahmen selbst zu
entwickeln oder nach dem vorgegebene Ansätze einzusetzen. Zusätzlich werden das
fachdidaktische Wissen und die Akzeptanz der beiden Ansätze erhoben (Eichholz et al.,
2023). Ein weiteres Beispiel ist die Studie von Fischer und Sjuts (2013), die zur
Untersuchung der Wirksamkeit einer Fortbildung bei Referendar:innen
Selbsteinschätzungen zur Diagnose- und Förderkompetenz in einem Fragebogen
erfassten. Ein Ergebnis dieser Befragung war, dass die Lehrkräfte sich vornahmen, ihren
Mathematikunterricht durch den verstärkten Einsatz von Forschungs- und
Begründungsaufgaben zu optimieren. Allerdings ist seit Lipowsky (2014) bekannt, dass
für den Erfolg einer Fortbildung mehr Ebenen angesprochen werden müssen als nur der
selbstberichtete Lernerfolg und die gesteigerte Motivation und Akzeptanz der
Teilnehmenden. Vielmehr muss sich das Wissen, Denken und Handeln der Lehrkräfte
tatsächlich weiterentwickeln und sich im besten Fall in der Entwicklung der
Schüler:innen zeigen.
2.2. Technologiegestützte Diagnose und Förderung – SMART
Diagnose und Förderung stellen für Lehrkräfte in der konkreten Umsetzung im
Unterricht eine große Herausforderung dar. Besonders wenn eine tiefgehende Diagnose
angestrebt wird, die nicht nur auf richtigen und falschen Lösungen basiert, sondern das
konzeptuelle Verstehen und Fehlvorstellungen der Schüler:innen zutage fördern soll,
stehen Lehrkräfte in großen Lerngruppen vor einer Herausforderung. Noch größer wird
diese, wenn es gilt, eine auf individuelle Bedürfnisse abgestimmte Förderung zu
realisieren. Technologie hat das Potential, Lehrkräfte bei diesen Prozessen zu
unterstützen und gleichzeitig auch Diagnose- und Förderpraktiken zu verändern
(Stacey & Wiliam, 2013). Die Technologie kann nach Aldon et al. (angenommen) auf drei
verschiedene Ebenen Einfluss nehmen: Kommunizieren, Analysieren und Adaptieren.
Dabei stellt das Analysieren einen wesentlichen Bestandteil der Diagnose dar, während
das Adaptieren in den Bereich der Förderung einzuordnen ist und das Kommunizieren
in beiden Bereichen eine wichtige Rolle spielt.
Ein Beispiel für eine technologiegestützte Diagnose und Förderung ist das SMART-
System, welches eine schnelle und tiefgreifende Auswertung liefert (Stacey et al., 2018)
und dafür Antwortmuster zwischen einzelnen Diagnose-Items analysiert (Steinle et al.,
2009). SMART wird seit 2008 an der Universität von Melbourne forschungsbasiert
entwickelt und aktuell im Rahmen eines DZLM-Projekts für den Gebrauch in
Deutschland adaptiert. SMART ist für die Jahrgangsstufen 5 bis 9 konzipiert und
117
fokussiert meistens das grundlegende konzeptuelle Verständnis zentraler Inhalte, wobei
einige Tests auch prozedurale Fähigkeiten in den Blick nehmen (Price et al., 2013).
Nachdem die Schüler:innen einen 5- bis 10-minütigen Test ausgefüllt haben, erhalten
die Lehrkräfte eine automatische Diagnose für jede:n Schüler:in in Form von
Verstehensstufen und Fehlvorstellungen. Zusätzlich werden Erklärungen und
Unterrichtsvorschläge bereitgestellt, welche Vorschläge, allgemeine Hinweise zu
Ritualen, Einstellungen, Methoden und wünschenswerten Konzepten sowie konkrete
Aufgaben, die zur Unterstützung der Schüler:innen eingesetzt werden können, enthalten
(Klingbeil et al., 2022).
Zur Konkretisierung wird im Folgenden ein Test aus dem Bereich der Algebra
vorgestellt. Der Test „Bedeutung von Variablen erfassen“ überprüft, ob Schüler:innen
Variablen konsequent so interpretieren, dass sie für numerische Werte stehen und nicht
als eine Abkürzung für im Kontext vorkommende Objekte. Der Test umfasst sechs
Multiple-Choice-Items, deren falsche Antwortoptionen typische Fehlinterpretationen
widerspiegeln. So kann beispielsweise die zweite Antwortoption in Abbildung 2 als „In
einer Packung sind 3 Kugelschreiber“ verstanden werden, bei der die Variablen als
Abkürzung für Packung bzw. Kugelschreiber gedeutet werden. Diese Fehlvorstellung
„Variable als Objekt“ (VAO) kann die Ursache für Schwierigkeiten beim Aufstellen von
Termen sein.
Abbildung 2: Item aus dem SMART-Test „Bedeutung von Variablen erfassen“
Die auf den Antwortmustern der Schüler:innen basierende, automatische Diagnose wird
den Lehrkräften in Form von drei Verstehensstufen angezeigt. Wird zusätzlich die
118
Fehlvorstellung „Lösung als Koeffizient“ (LAK) diagnostiziert, welche eine Spezifizierung
der VAO-Fehlvorstellung ist, wird diese ebenfalls angezeigt (siehe Abbildung 3). Bei LAK
wird bereits eine mögliche Lösung für eine Gleichung gefunden und als Koeffizienten vor
die Variablen gestellt.
Abbildung 3: Verstehensstufen und zusätzliche Fehlvorstellung des SMART-Tests „Bedeutung von Variablen
erfassen“
Bei der Diagnose kann die Technologie zunächst einmal auf der Ebene der
„Kommunikation“ unterstützen. Beispielsweise können Diagnoseaufgaben inklusive
verschiedener Darstellungen mithilfe von Technologie präsentiert und an die
Schüler:innen übermittelt werden (Kommunikation „durch“ Technologie). Je nach
Technologie können Aufgabenformate dabei auch so gestaltet sein, dass eine Interaktion
zwischen Nutzer:in und Technologie ermöglicht wird, beispielsweise durch Eingaben
und technologieseitige Reaktionen darauf (Kommunikation „mit“ Technologie).
Schließlich kann Kommunikation auch „über“ Technologie stattfinden, wenn z. B. die
Technologie selbst als Impuls für Diskussionen dient (Aldon et al., angenommen).
SMART bietet hinsichtlich der Kommunikation die Möglichkeit einer einfachen
Bereitstellung von fertigen Diagnoseaufgaben auf einer Website, zu denen die
Schüler:innen ihre Antworten auch direkt dort digital eingeben können
(Kommunikation „durch“ und „mit“ Technologie).
Ein besonderes Potential von Technologie beim Diagnostizieren liegt allerdings in der
„Analyse“. Dazu zählt die Interpretation von Schüler:innen-Antworten und die
Auswertung von Prozessdaten. Dabei können drei Level der Analyse unterschieden
werden: Auf dem ersten Level liefert die Analyse lediglich einen Überblick über den
119
Arbeitsfortschritt, während Level 2 die Erfassung des Lernstandes im Sinne von
richtigen und falschen Antworten sowie in Anspruch genommenen Hilfen umfasst. Das
dritte Level entspricht dann einer erweiterten Analyse, die der Lehrkraft Einblicke in
das Denken ihrer Schüler:innen in Bezug auf das bereits entwickelte Verständnis sowie
noch vorhandene Fehlvorstellungen ermöglicht (Aldon et al., angenommen). Diese
erweiterte Analyse ist es, die auch SMART bietet. Hier wurden die Testitems auf der
Grundlage von Forschungsergebnissen zu typischen Fehlern und (Fehl-)Vorstellungen
konstruiert und in mehreren Forschungszyklen mit Erprobungen weiterentwickelt. Die
Antwortmuster werden automatisch ausgewertet und für jede:n Schüler:in eine
Diagnose in Form einer erreichten Verstehensstufe sowie, wenn vorhanden,
zusätzlichen Fehlvorstellungen erstellt (Steinle et al., 2009; siehe Abbildung 4).
Abbildung 4: Diagnoseergebnisse in der Klassenübersicht
Das Potential von Technologie im Bereich der Förderung liegt im „Adaptieren“, indem
Entscheidungen über die folgenden Lernschritte durch Technologie entweder
unterstützt oder gar übernommen werden. Weist die Technologie eine „passive“
Adaptivität auf, bietet sie zwar potentielle sinnvolle Aufgaben und Empfehlungen an, die
Lehrkraft muss aber noch selbst entscheiden, welcher Lernweg eingeschlagen werden
soll. Diese Entscheidung wird bei einer „aktiven“ Adaptivität von der Technologie
übernommen. Werden darüber hinaus Features von künstlicher Intelligenz genutzt, um
automatisch ein Lernendenprofil zu generieren, handelt es sich um „intelligente“
Adaptivität (Aldon et al., angenommen). Der Grad der technologischen Nutzung steht
dabei reziprok zum Grad des geforderten Lehrerhandelns. Bei einer intelligenten
120
Adaptivität bleibt für die Lehrkraft nur mehr die äußere Organisation, wohingegen bei
einer passiven Adaptivität die inhaltliche Gestaltung noch in der Hand der Lehrkraft
liegt. Letzteres ist bei SMART der Fall – das System stellt zwar zusätzlich zur Diagnose
Förderhinweise und passende Aufgabenvorschläge für die Lehrkraft zur Verfügung
(siehe Abbildung 5), aber über deren Einsatz und die konkrete Umsetzung entscheidet
die Lehrkraft. Eine automatische Rückmeldung an die Schüler:innen erfolgt nicht. Dies
ist von den Entwickler:innen ganz bewusst so entschieden, denn “we want teachers at
the centre of the diagnostic process, because we believe that substantial teacher input is
required to overcome most of the conceptual obstacles identified” (Stacey et al., 2018,
S. 9).
Abbildung 5: Beispiel für Förderhinweise (hier zu Stufe 1)
2.3. Potential von SMART auf die Lehrkräfteprofessionalisierung
Wie beschrieben kann der Einsatz von Technologie Lehrkräfte bei der Diagnose und
Förderung entlasten. Darüber hinaus ist aber auch davon auszugehen, dass Tools wie
SMART die Entwicklung der Diagnose- und Förderkompetenz der Lehrkräfte
unterstützen können. Freiwillige Rückmeldungen von australischen Lehrkräften, die
SMART verwendet haben, liefern bereits erste Hinweise auf einen solchen möglichen
Effekt (Stacey et al., 2018).
In vielen Klassen ist die Qualität der Förderung oft nur mittelmäßig und Lernende, die
Unterstützung brauchen, erhalten diese oft nicht konsequent (Pianta et al, 2007). Hier
121
kann SMART zunächst einmal sowohl als Diagnosetool selbst, als auch durch das zur
Verfügungstellen von Förderaufgaben (inklusive Erläuterung deren Potentials) das
Handlungsrepertoire von Lehrkräften in Bezug auf Diagnose und Förderung erweitern.
Darüber hinaus können Lehrkräfte mithilfe der Erläuterungen der Verstehensstufen und
Fehlvorstellungen sowie Förderhinweise ihr fachdidaktisches Wissen zu einem
bestimmten Fachinhalt erweitern. Die Lehrkraft lernt quasi anhand des Lernens der
eigenen Schüler:innen. Das Wissen über typische Fehler und Fehlvorstellungen kann
dabei den Blick der Lehrkraft für die Verstehenshürden der Schüler:innen schärfen, was
unter anderem Auswirkungen auf spontane Diagnosen oder gestaltete
Fördermaßnahmen haben kann. Wunsch der Entwickler:innen ist, dass SMART somit
irgendwann gewissermaßen redundant wird, da die Lehrkräfte Verstehensstufen und
Fehlvorstellungen ihrer Schüler:innen ohne Hilfe im Unterricht diagnostizieren und
fördern können. Die Erläuterungen der Verstehensstufen und die Förderhinweise bieten
zusätzlich auch einen Überblick über das zum jeweiligen Thema aufzubauende
konzeptuelle Wissen. Pianta et al. (2007) fanden heraus, dass Lehrkräfte oft nur
generisches Feedback zur Korrektheit von Aufgaben geben und dass der Unterricht oft
Schwächen im Hinblick auf die Qualität der Förderung aufweist. Sie fordern
entsprechende Unterstützungsmaßnahmen für Lehrkräfte, ihr Wissen über spezifische
Förderungsmöglichkeiten zu erweitern. Die Förderhinweise von SMART können
Lehrkräfte dabei unterstützen, Unterricht so zu gestalten, dass ein ausschließlicher
Fokus auf prozedurales Wissen sowie die Begünstigung von Fehlvorstellungen
vermieden werden. Schließlich kann der Einsatz von SMART (ggf. in Kombination mit
weiteren Fortbildungsaktivitäten) Lehrkräfte möglicherweise dabei unterstützen, den
Fokus von zu stark geprägtem summativem zu formativem Assessment zu verschieben
(Stacey et al., 2018).
3. Fragestellung
Die Entwicklung der Diagnose- und Förderkompetenz von Lehrkräften ist ein wichtiger
Bestandteil der Professionalisierung von Lehrkräften. Es besteht die Annahme, dass
SMART als digitales Tool zur Unterstützung der Diagnose und Förderung im Fach
Mathematik das Potential hat Lehrkräfte in diesen Kompetenzen zu stärken. Im Rahmen
dieses Beitrags soll aus der Perspektive des „Formativen Assessments“ nach Leuders
und Kolleg:innen (2022) untersucht werden, ob diese Annahme bestätigt werden kann.
Dazu gehen wir folgender Fragestellung nach: Inwiefern wird bei einer Analyse von
Fallbeispielen eine Professionalisierung von Lehrkräften durch den Einsatz von SMART
hinsichtlich der Diagnose- und Förderkompetenz anhand sichtbar?
122
4. Methode
4.1. Erfassung von Diagnose- und Förderkompetenz mittels Fallbeispielen
Aus dem Desiderat, dass sich bisher kein Instrument zur Erfassung diagnostischer
Kompetenz im Themenbereich „Funktionen“ eignete, um die Wirkungen von
Fortbildungen zu untersuchen, wurde von Busch et al. (2015) ein neues Instrument
generiert. Dabei sollen Lehrkräfte speziell designte Fallbeispiele von Schüler:innen
beurteilen. Das Instrument wurde auf Grundlage der Szenariobeurteilung erstellt (Klug
et al., 2013). In der Fallbeurteilung geht es vor allem um die Phasen der „action“ und
„postaction“, da nach einem Diagnoseurteil auch Förderansätze formuliert werden
sollen. Die Diagnoseurteile werden dabei nicht nur auf Basis ihrer Urteilsgenauigkeit
überprüft, sondern mithilfe verschiedener Merkmale (s. Tabelle 1 in 4.2), sodass auch
implizites diagnostisches Denken berücksichtigt wird. Die Fälle, die für das fallbasierte
Lernen verwendet werden, sind problemhaltige Darstellungen von Lehr- und
Lernsituationen. Sie stammen aus einer realistischen Unterrichtspraxis, bilden eine
Brücke zwischen praktischer Anwendung und theoretischem Wissen und dienen als
Hinweisreize für das diagnostische Denken (von Aufschnaiter et al., 2017). Die
Antworten zu den Fallbeispielen sind im Sinne des DiaCoM-Rahmenmodells als
externale Ergebnisindikatoren zu verstehen. Die Analyse dieser ermöglicht einen
Einblick in das diagnostische Handeln. Das Instrument von Klug und Kolleg:innen
(2013) wurde zur Erfassung von Wirksamkeiten einer konkreten Intervention (bspw.
Fortbildungen) sensitiviert und eignet sich daher ebenfalls zur Erfassung der
potenziellen Wirksamkeit von SMART (Busch et al., 2015).
4.2. Adaption und Weiterentwicklung des Testinstruments
Das Instrument von Busch et al. (2015) wurde zunächst für den Themenbereich
„Algebra“ adaptiert. Dazu wurden vier Fallbeispiele von Schüler:innenlösungen
generiert, welche die Lehrkräfte beurteilen sollen. Die Fallbeispiele stellen typische
Lösungen zu Aufgaben zum Variablenbegriff und dem Verständnis von Termen und
Gleichungen dar und beinhalten häufige Fehlvorstellungen. Abbildung 6 zeigt
exemplarisch eines der vier Fallbeispiele, bei der die verbreitete „Variable als
Abkürzung für ein Objekt”-Fehlvorstellung vorliegt (vgl. 2.2). Mit dem relevanten
fachdidaktischen Wissen kann erkannt werden, dass dieser Schüler die Variable nicht als
Platzhalter für einen numerischen Wert, sondern vielmehr als Abkürzung für ein Objekt
interpretiert („k“ steht für Kaugummis). Zusätzlich wird bereits eine mögliche Lösung in
den Term mit aufgenommen („Lösung als Koeffizient”-Fehlvorstellung, vgl. Abbildung 3)
123
und die Gleichung wird wie ein Lösungssatz gelesen („4 Kaugummis und 5 Bonbons
kosten zusammen 80 Cent”).
Abbildung 6: Fallbeispiel: Kiosk aus dem Prätest
Das ursprüngliche Instrument von Busch et al. (2015) fokussierte vor allem die
diagnostischen Aktivitäten. In einem nächsten Schritt werden zu den Fallbeispielen je
vier offene Fragen formuliert, um beide Kompetenzbereiche zu erfassen, indem sowohl
Details zur Diagnose als auch Ansätze zur spontanen und zur geplanten Förderung
adressiert werden (s. Abbildung 7).
Abbildung 7: Items bezüglich der Diagnose und Förderung von Lernenden
Die Items sind so formuliert, dass Gelegenheiten entstehen, relevante Aspekte des
fachdidaktischen Wissens bezüglich Diagnose und Förderung zu thematisieren. Bei Item
1 und 2 liegt dabei ein höherer Fokus auf der Diagnose: Item 1 ist bewusst so formuliert,
dass die Lehrkraft entscheiden muss, was sie unter „Beurteilen“ versteht, während Item
2 dann eine verstehensorientierte Sichtweise in den Vordergrund stellt. Item 3 und 4
fokussieren hingegen die Förderung mit jeweils unterschiedlichem Planungs- und
Formalitätsgrad (vgl. Heritage, 2007; Shavelson et al., 2008): Item 3 fragt nach einem
spontanen Tipp an einzelne Lernende, im Sinne des „on-the-fly assessments“. Auch
124
wenn in der Testsituation die Eingabe ohne Zeitbegrenzung erfolgte und die Bearbei-
tung von Fällen es ermöglicht, die Situation gezielt aus verschiedenen Perspektiven zu
betrachten, ohne dabei unter unmittelbarem Handlungsdruck zu stehen (vgl. Krammer
et al., 2012), soll dieser Prompt eine Antwort anregen, die einer spontanen Reaktion
möglichst nahe kommt. Item 4 hingegen erfragt bei der Lehrkraft, welches weitere
Vorgehen ihrer Meinung nach am besten zur Förderung geeignet wäre, im Sinne eines
„planned-for-interaction assessments“. Es ist nicht auszuschließen, dass Lehrkräfte beim
Beantworten der Fragen bei allen Items jeweils Aspekte zur Diagnose und/oder zur
Förderung nennen, weswegen in der Auswertung für beide Facetten alle Items
berücksichtigt werden.
Im Rahmen der Auswertung wurde eine qualitative Analyse durchgeführt. Für den
Aspekt der Diagnosekompetenz wurde anhand des Kategoriensystems und der
Merkmale von Busch et al. (2015) kodiert. Zur Kodierung der Förderkompetenz wurde
dieses Kategoriensystem für die Förderung adaptiert und ergänzt. In Tabelle 1 ist die
entwickelte Systematik in Kategorien mit dazugehörigen Merkmalen dargestellt.
Kategorie
Merkmal zur Diagnose
Merkmal zur Förderung
1. Aktivität
– Beschreibung
– Bewertung
– Korrektur
– Analyse
– Motivational
– Kalkülorientiert
– Verstehensorientiert
2. Fokus
– Konkreter Bezug zu Defiziten
– Planungs- und Formalitätsgrad
der Förderung
3. Qualitätsmerkmale
– Bezug zu Stärken
– Erklärung für Defizite
– Anwendung von
fachdidaktischem Wissen
– Bezug zur Diagnose
– Konkretheit
– Anwendung von
fachdidaktischem Wissen
4. Verständlichkeit
– Fehlerbehaftete Diagnose
– Unverständliche Diagnose
– Unverständliche Förderung
Tabelle 1: Kategorien und dazugehörige Merkmale zur Auswertung
4.3. Durchführung der Untersuchung
Nach der Adaption wurde ein webbasierter Fragebogen erstellt und die Items kamen
sowohl in einem Prä- als auch in einem Posttest zum Einsatz. Im Vergleich zur Arbeit
von Klug et al. (2013) wurden im Prä- und Posttest jeweils zwei Fallbeispiele integriert,
125
um ein Diagnose- und Förderverhalten über unterschiedliche Bearbeitungen
beobachten zu können.
Das entwickelte Instrument wurde an fünf Lehrkräften vor und nach dem Einsatz von
SMART eingesetzt. Dabei lag zwischen dem Einsatz der beiden Fragebögen ein Abstand
von ca. vier Wochen, in denen die Lehrkräfte jeweils zwei SMART-Tests mit ihren
eigenen Schüler:innen eingesetzt und eine Unterrichtsreihe zum Thema Variablen auf
Basis der Testergebnisse durchgeführt haben. Alle Teilnehmenden sind
Mathematiklehrkräfte an unterschiedlichen Gymnasien in Nordrhein-Westfalen (weitere
Informationen zur Stichprobe in Tabelle 2).
Tabelle 2: Stichprobe
Die Bearbeitungsdauer des Testinstruments lag bei ungefähr 15–20 Minuten. Es gab
keine zeitliche Begrenzung und räumliche Vorgabe für die Bearbeitung. Der Beginn der
Untersuchung und dementsprechend auch der erste Einsatz der SMART-Tests konnte
von den Lehrkräften flexibel gewählt werden, damit diese ihn möglichst gut in die eigene
Unterrichtsplanung integrieren konnten. Im Anschluss an die Erhebung wurden die
Antworten der Lehrkräfte mithilfe des weiterentwickelten Kodiersystems untersucht.
Jede Lehrkraft wurde vom ersten Autor hinsichtlich der Kategorien kodiert. Die
Kodierungen wurden von mindestens einer weiteren Person überprüft und etwaige
Unstimmigkeiten wurden geklärt.
5. Ergebnisse
Im Folgenden werden die Antworten von fünf Lehrkräften miteinander verglichen.
Dabei werden Lehrkraft 1 und 2 sowie 3 und 4 gemeinsam dargestellt, da diese ähnliche
Antwortmuster aufweisen und damit je einem Fallbeispiel zugeordnet werden.
Lehrkraft
Geschlecht
Alter
Berufserfahrung
Lehrkraft 1
männlich
30 bis 39
Weniger als 2 Jahre
Lehrkraft 2
weiblich
30 bis 39
2 bis 5 Jahre
Lehrkraft 3
weiblich
50 bis 59
Mehr als 10 Jahre
Lehrkraft 4
männlich
30 bis 39
6 bis 10 Jahre
Lehrkraft 5
männlich
30 bis 39
Mehr als 10 Jahre
126
5.1. Fallbeispiel 1: Steigerung der Förderkompetenz bei mittlerem Ausgangsniveau
Bei Lehrkraft 2 erfolgt eine Diagnose der Fehlvorstellungen im Prä- und Posttest auf
einer vorwiegend allgemeinen sprachlichen Ebene („Anton hat die Situation richtig
erfasst und in seiner Gleichung direkt die „Lösung“ eingebaut“). Die Fehlvorstellung LAK
wird erkannt, aber eher implizit benannt. Die Förderansätze sind im Prätest eher
oberflächlich und verharren auf einer motivationalen Ebene („Lies nochmal die Situation
und versuche die Situation genau so darzustellen wie sie geschildert wird“) oder
orientieren sich an allgemeinen Vorgehensweisen, bspw. Strategien zur Lösung von
Textaufgaben („Informationen aus dem Text markieren; Schritte für Textaufgaben
notieren“). Im Posttest fallen die Förderansätze bei gleicher, impliziter Diagnose
konkreter aus. Es werden Bezüge zur Variablenbedeutung gezogen und die Hinweise
rekurrieren auf die Aufgabe und die Lösung des Schülers. („Ich würde ihm sagen er soll
aufschreiben was b und t bedeutet und wenn b und t jeweils die Anzahl der
Tulpen/Blütenblätter sein soll dann würde ich sagen er soll mal überlegen, wie die
Werte bei 2 Tulpen/3 Tulpen usw. wären. Man multipliziert die Anzahl der Tulpen mit 6
und erhält dadurch die Anzahl der Blütenblätter b“).
Bei Lehrkraft 1 zeichnet sich ein ähnliches Bild ab, wobei bei der Diagnose und
Förderung im Prätest ein höheres Ausgangsniveau sichtbar wird. Die Diagnosen sind im
Prätest sprachlich präzise an den Fehlvorstellungen ausgerichtet („Für Anton scheint k
für das Objekt Kaugummi zu stehen und er denkt vermutlich an eine sprachliche Form
der Gleichung: ‚4 Kaugummis und 5 Bonbons kosten 80 Cent‘. Dabei hat er im Kopf
anscheinend bereits eine Lösung“), was sich dann auch im Posttest zeigt („Florian
verwechselt Variable mit dem Objekt selbst. Vermutlich eine direkte quasi wörtliche
Übersetzung: Jede t – Tulpe ergibt 6 b – Blätter“). Trotz präziser Förderansätze im
Prätest wird keine Fachsprache erkennbar, um den Lernstand konkret zu fassen
(„Bedeutung von Variablen klären. Fokus auf: steht für einen Zahlenwert. Klären: welche
Bedeutung hat die Zahl im Kontext? Sprachliche Übersetzung konterkarieren und
Strategien zum Überschlagen besprechen“). Im Zusammenhang mit dem Explizieren,
wofür die Variable steht, kann das Überschlagen durchaus eine gute Strategie sein,
allerdings sind die Ansätze eher vage und fokussieren nicht im Detail die
Fehlvorstellung. Im Posttest bezieht sich Lehrkraft 1 dann konkreter auf die
diagnostizierte Fehlvorstellung („Strategien entwickeln und üben, um die intuitive Falle
des wörtlichen Verstehens zu hinterfragen. Zum Beispiel indem einfache
Zahlenbeispiele verwendet werden und oft klarstellen lassen, was die Bedeutung von
Variablen ist – mit Fokus darauf, dass es um Anzahlen, Zahlenwerte etc. geht und nicht
um die Objekte selbst. Ich würde den Schüler fragen: Kannst du die Gleichung in Worte
fassen, wobei du zweimal das Wort Anzahl benutzt?“). Die Förderung wird in Bezug zur
127
Variablenbedeutung mit dem Fokus auf die Anzahlen deutlich verstehensorientierter
und den Kern des Problems treffend gestaltet.
Zusammenfassend lässt sich sagen, dass bei beiden Lehrkräften keine Veränderung
bezüglich der Diagnosen sichtbar wird. Allerdings werden die Schwierigkeiten des
Schülers ohnehin schon treffend beschrieben, wenn auch an manchen Stellen teilweise
implizit. Beide Lehrkräfte zeigen aber beim zweiten Test einen erkennbaren Zuwachs
der Förderkompetenz, was sich an einer präziseren Sprache und am Benennen
konkreter Ansätze zur Förderung widerspiegelt.
5.2. Fallbeispiel 2: Gleichbleibende Förderkompetenz bei hohem Ausgangsniveau
Lehrkraft 5 zeigt, ähnlich wie Lehrkraft 1 und 2, eine eher implizite Diagnose der
Fehlvorstellungen im Prä- und Posttest. Eine präzise Benennung der Fehlvorstellungen
bleibt damit aus („Florian hat die sprachlich dargestellte Aufgabenstellung „1 zu 1“ also
wörtlich in die mathematischen Symbole übersetzt.“). Allerdings zeigen die
Förderansätze bereits von Beginn an ein explizites fachdidaktisches Wissen. Im Prätest
wird die Variablenbedeutung direkt angesprochen („x und y (oder hier k und b) stehen
für "Unbekannte". Welche beiden Informationen sind in der Aufgabenstellung
unbekannt? Schreibe die Bedeutung deiner Variablen auch immer auf. (z. B. k = Anzahl
der Kaufgummis)“) und das Ziel besteht in der Förderung darin, genauer nachzuvoll-
ziehen, was sich der Schüler denken könnte („Grundsätzlich hat auch Anton verstanden,
wie er mit Unbekannten und Gleichungen umgeht. Ich würde ihn im nächsten Schritt
eine ähnliche Aufgabe bearbeiten lassen und sie mir von ihm erklären lassen und ihm
dabei genau zuhören und ggf. nachfragen.“). Diese Lehrkraft formuliert auch im Posttest
Förderansätze, welche auf ähnliche Weise das Verstehen des Schülers ansprechen, zum
Beispiel indem vor dem Lösen immer die Bedeutung der Variablen festgehalten und
nach dem Lösen Zahlenbeispiele in die Gleichung eingesetzt und Ergebnisse auf Logik
überprüft werden sollen. Bei dieser Lehrkraft wird keine Veränderung bezüglich der
Diagnosen sichtbar, ebenso wie bei der Förderung. Allerdings befanden sich die
Diagnosen bereits auf einem angemessenen und insbesondere die Förderansätze auf
einem hohen Niveau, so dass im Vergleich zu den anderen Lehrkräften kein Zuwachs
notwendig wäre.
5.3. Fallbeispiel 3: Steigerung der Förderkompetenz bei geringem Ausgangsniveau
Beide hier betrachteten Lehrkräfte (3 und 4) benennen weder im Prä- oder Posttest
Fehlvorstellungen oder stellen sogar fehlerhafte Diagnosen auf.
128
Sie erkennen beide zwar im Prätest, dass die Lösung nicht korrekt ist, interpretieren die
Variablen in Antons Gleichung allerdings nicht als Fehler dahingehend, dass die
Variablen als Objekte wahrgenommen werden, sondern als Preis eines Kaugummis bzw.
Bonbons statt Anzahl (Lehrkraft 4: „Die Gleichung ist nicht sinnvoll. Die Variablen
stehen hier für den Preis eines Kaugummis bzw. für den Preis eines Bonbons. Beides ist
jedoch bekannt“). Diese Art die Variablen zu verstehen ist nicht falsch, allerdings würde
durch diese Interpretation eine potenzielle Fehlvorstellung unentdeckt bleiben. Im
Zweifel wäre es dann wichtig, beim Schüler nachzufragen, wie die Variablen gemeint
sind. Allerdings stellt Lehrkraft 3 in der Förderung eher eine vage Rückfrage („Anton,
was wird in der Aufgabe gesucht?“) und formuliert eine unklare Förderung („Ich würde
mit Anton gemeinsam die Gleichung finden“).
Im Posttest bleiben die Diagnosen eher uneindeutig (Lehrkraft 3: „Florian hat Tulpen
und Blätter vertauscht“) oder sogar fehlerhaft (Lehrkraft 4: „Bei Florian soll t für die
Tulpenanzahl stehen, b für die Anzahl der Blätter. Dann wäre die Gleichung aber
falsch.“), denn in Florians Gleichung t = 6b stehen die Variablen gerade nicht für die
Anzahlen, sondern für die Objekte selbst. Ungeachtet dessen werden die Förderansätze
konkreter, indem bspw. Rückfragen zur Variablenbedeutung gestellt werden (Lehrkraft
3: „Sind es also nun mehr Tulpen als Blätter?“) oder sogar die Schwierigkeit von
Variablen mit gleichem Anfangsbuchstaben explizit aufgegriffen wird (Lehrkraft 4: „Ich
würde deutlich machen, dass die Variablen nicht den Anfangsbuchstaben der in einer
Aufgabe vorkommenden Begriffe entsprechen müssen. Vorher immer festlegen, wofür
welche Variable steht.“).
Beim Betrachten der beiden Fälle wurde keine Veränderung bezüglich der Diagnosen
sichtbar. Allerdings weisen die Förderansätze im zweiten Test weniger allgemeine und
mehr konkrete Hinweise auf, die sich an den Fehlvorstellungen orientieren.
6. Diskussion
Diese Studie hatte das Ziel zu untersuchen, welches Potential der Einsatz von SMART auf
die Professionalisierung von Mathematiklehrkräften haben kann. Dazu wurde die
Entwicklung der Diagnose- und Förderkompetenz mit Hilfe von Fallbeispielen vor und
nach dem Einsatz von SMART im Bereich elementarer Algebra untersucht.
In den Prätests konnten bezüglich der diagnostischen Aktivitäten die Antworten der
Lehrkräfte oft über die Ebenen der „Beschreibung“ und „Korrektur“ hinaus als „Analyse“
der Schüler:innen-Lösungen kodiert werden. Dieses Ergebnis weist darauf hin, dass die
meisten Lehrkräfte auch ohne Intervention in der Lage waren, eine angemessene
Diagnose der Schüler:innen zu geben. Allerdings wurde auch festgestellt, dass die
129
Lehrkräfte dabei hinsichtlich der Qualitätsmerkmale (vgl. Tabelle 1 in 4.2) besonders
selten fachdidaktisches Wissen anwendeten, um die Fehlvorstellungen der
Schüler:innen zu diagnostizieren und explizit zu benennen. Stattdessen umschreiben
Lehrkräfte bspw. Fehlvorstellungen mit eigenen Worten, was dazu führen kann, dass die
Präzision der Diagnose eingeschränkt und wichtige Aspekte oft nicht benannt werden.
Diese gewonnene Erkenntnis deckt sich mit den Ergebnissen der Studie von Busch und
Kolleg:innen (2015).
Dass dieses Nicht-Benennen offenbar auf einem Nicht-Erkennen fundiert, zeigt sich in
den angegebenen Fördermöglichkeiten der Lehrkräfte. Diese werden dann meistens
unpräzise formuliert und richten sich häufig an motivationale oder Rechenstrategien
und weniger an Verstehensorientierung. Im Allgemeinen konnte bezogen auf die
Förderaktivität festgestellt werden, dass Lehrkräfte, die kein fachdidaktisches Wissen in
der Diagnose anwenden, öfters vielmehr kalkülorientierte oder motivationale
Förderhinweise geben. Auch das deckt sich mit den Ergebnissen bisheriger Studien, dass
Lehrkräfte mit geringem fachdidaktischem Wissen in der Förderung häufig auf einer
oberflächlichen und motivationalen Ebene bleiben (vgl. Busch et al., 2015; Laschke et al.,
2022).
Zu der Wirksamkeit von SMART zur Entwicklung von Diagnose- und
Förderkompetenzen bei Lehrkräften zeigen die vorgestellten Fallbeispiele bereits
vielversprechende Ergebnisse. Während sich nur wenige Unterschiede in der Diagnose
gezeigt haben, zeigten alle Lehrkräfte eine präzisere und stärker an den konkreten
Fehlern bzw. Fehlvorstellungen orientierte Förderung im Posttest. Wenn die Lehrkräfte
bereits im Prätest schon verstehensorientierte Förderansätze zeigten, dann wurde die
anschließende Förderung präziser und unter Verwendung von konkreteren Begriffen
gestaltet (siehe Fallbeispiel 1). Lehrkräfte, deren genannte Fördermaßnahmen noch auf
einem eher allgemeinen und oberflächlichen Niveau waren, wiesen im Posttest
zumindest eine stärkere Orientierung an der Variablenbedeutung und direkte Bezüge
zur Aufgabe auf (Fallbeispiel 3). Wenn eine Lehrkraft bereits vorher ausführliche
Förderansätze formuliert hat, dann konnte sie dies auch im Posttest demonstrieren
(Fallbeispiel 2). Diese Ergebnisse decken sich mit der Erwartung, dass die
Förderhinweise von SMART Lehrkräfte dabei unterstützen können, Unterricht so zu
gestalten, dass ein ausschließlicher Fokus auf prozedurales Wissen vermieden wird. Bei
den untersuchten Fällen werden bereits Unterschiede in der Qualität der Förderung
zwischen Prä- und Posttest sehr deutlich. Insbesondere das von den Lehrkräften in den
Posttests angewendete stoffdidaktische Wissen, das sich sehr spezifisch auf den in den
Tests adressierten, mathematischen Kern bezieht und die daraus resultierende klare
130
Benennung von Fehlvorstellungen zeigen augenscheinlich das erweiterte Wissen der
Lehrkräfte.
Diese Veränderung insbesondere auf Seiten der Förderung könnte damit erklärt
werden, dass der besondere Kern von SMART als technologiegestütztes Formatives
Assessment (s. Kapitel 2.2) die Aufgabe der „Analyse“ ist. Der Prozess der Diagnose liegt
als erweiterte Analyse vor allem beim SMART System. In Bezug auf das „Adaptieren“
übernimmt SMART eher eine passive Rolle und lässt die inhaltliche Gestaltung der
Förderung in der Hand der Lehrkraft. Dementsprechend ist eine Entwicklung stärker im
Bereich der Förderung zu erwarten gewesen.
Die Ergebnisse dieser Studie sollen unter anderem in einer Gesamtstudie zur
Wirksamkeit von SMART angewendet werden, bei der noch weitere Aspekte
professioneller Kompetenz, wie Personencharakteristika über standardisierte
Fragebögen ermittelt werden (bspw. die Selbstwirksamkeitsüberzeugungen unter
anderem zum Einsatz digitaler formativer Assessment Werkzeuge). Des Weiteren wird
eine größere Zahl an Lehrkräften untersucht und neben dem Einsatz von SMART auch
mit einer Gruppe an Lehrkräften verglichen, die an einer klassischen
Lehrkräftefortbildung teilgenommen haben. Wenn sich die Entwicklungspotentiale von
SMART weiterhin bestätigen lassen, wäre es eine ökonomische und leicht skalierbare
Unterstützungsmaßnahme für Lehrkräfte, ihr Wissen über spezifische
Förderungsmöglichkeiten zu erweitern – wie es bereits von Pianta und Kolleg:innen
(2007) gefordert wurde. Zudem soll das Zusammenwirken der Erkenntnisse der
Kompetenzentwicklung auf Lehrkräfteebene mit der Entwicklung des Lernstandes auf
Schüler:innenebene näher synthetisch betrachtet werden.
Literaturverzeichnis
Aldon, G., Barzel, B., Cusi, A. & Olsher, S. (angenommen). The functionalities of technology when teachers
realize technology-enhanced formative assessment. In B. Pepin, G. Gueudet & J. Choppin (Hrsg.),
Handbook of Digital Resources in Mathematics Education. Springer Nature.
Bell, B. & Cowie, B. (2001). The characteristics of formative assessment in science education. Science
Education, 85(5), 536–553.
Burkhardt, H. & Schoenfeld, A. (2019). Formative assessment in mathematics. In H.L. Andrade, R.E.
Bennett & G.J. Cizek (Eds.), Handbook of formative assessment in the disciplines (S. 35–67). Routledge.
Busch, J., Barzel, B. & Leuders, T. (2015). Die Entwicklung eines Instruments zur kategorialen Beurteilung
der Entwicklung diagnostischer Kompetenzen von Lehrkräften im Bereich Funktionen. Journal für
Mathematik-Didaktik, 36(2), 315–338.
Corno, L. (2008). On teaching adaptively. Educational Psychologist, 43(3), 161–173.
Eichholz, L., Linker, C. & Schiffer, J. (2023). Födima – Förderorientierte Diagnostik im (inklusiven)
mathematischen Anfangsunterricht. In IDMI-Primar Goethe-Universität Frankfurt (Hrsg.), Beiträge
zum Mathematikunterricht 2022. 56. Jahrestagung der Gesellschaft für Didaktik der Mathematik. WTM.
131
Fischer, A. & Sjuts, J. (2013). Wie wirksam ist forschendes Lernen zum Aufbau diagnostischer Fähigkeiten?
In G. Greefrath, F. Käpnick & M. Stein (Hrsg.), Beiträge zum Mathematikunterricht 2013. Vorträge auf
der 47. Tagung für Didaktik der Mathematik vom 04.03.2013 bis 08.03.2013 in Münster, (S. 312–315).
Helmke, A. (2012). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesserung
des Unterrichts (4. Aufl.). Klett-Kallmeyer.
Heritage, M. (2007). Formative Assessment: What Do Teachers Need to Know and Do? Phi Delta Kappan,
89(2), 140–145.
Klug, J., Bruder, S., Kelava, A., Spiel, C. & Schmitz, B. (2013). Diagnostic competence of teachers: A process
model that accounts for diagnosing learning behavior tested by means of a case scenario. Teaching and
Teacher Education, 30, 38–46.
Klieme, E. & Warwas, J. (2011): Konzepte der Individuellen Förderung. Zeitschrift für Pädagogik, 57(6),
805–818.
Klingbeil, K., Rösken, F., Barzel, B., Schacht, F., Thurm, D. & Kortenkamp, U. (2022). Verstehensorienterte
Online-Diagnostik – Ein SMARTer Weg. In F. Reinhold & F. Schacht (Hrsg.), Digitales Lernen in Distanz
und Präsenz: Herbsttagung 2021 des Arbeitskreises Mathematikunterricht und digitale Werkzeuge in der
Gesellschaft für Didaktik der Mathematik am 24.09.2021, (S. 65–71).
Krammer, K., Lipowsky, F., Pauli, C., Schnetzler, C. & Reusser, K. (2012). Unterrichtsvideos als Medium zur
Professionalisierung und als Instrument der Kompetenzerfassung von Lehrpersonen. In M. Kobarg, C.
Fischer, I. Dalehefe, F. Trepke & M. Menk (Hrsg.), Lehrerprofessionalisierung wissenschaftlich begleiten –
Strategien und Methoden (S. 69–86). Waxmann.
Laschke, C, Jenßen, L. & Rösken-Winter, B. (2022). Dimensions of pre-service teachers‘ diagnostic
judgments of student solutions. In C. Fernández, S. Llinares, Á. Gutiérrez & N. Planas (Eds.), Proceedings
of the 45th conference of the international group for the psychology of mathematics education (Vol. 3,
S. 115–122). PME.
Lee, H., Chung, H.Q., Zhang, Y., Abedi, J. & Warschauer, M. (2020). The effectiveness and features of
formative assessment in US K-12 education: a systematic review. Applied Measurement in Education,
33(2), 124–140.
Leuders, T., Loibl, K., Sommerhoff, D., Herppich, S. & Praetorius, A.-K. (2022) Toward an Overarching
Framework for Systematizing Research Perspectives on Diagnostic Thinking and Practice. Journal für
Mathematik-Didaktik 43, 13–38.
Leuders, T. & Prediger, S. (2017): Flexibel differenzieren erfordert fachdidaktische Kategorien. In J.
Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht
umgehen lernen (S. 3–16). Springer Spektrum.
Lipowsky, F. (2014). Theoretische Perspektiven und empirische Befunde zur Wirksamkeit von Lehrerfort-
und -weiterbildung. In E. Terhart, H. Bennewitz & M. Rothland (Hrsg.), Handbuch der Forschung zum
Lehrerberuf (2., überarb. Aufl., S. 511–541). Waxmann.
Loibl, K., Leuders, T. & Dörfler, T. (2020). Diagnostische Urteile von Lehrkräften erklären – Ein
Rahmenmodell für kognitive Modellierungen und deren experimentelle Prüfung.
Unterrichtswissenschaft, 48, 493–502.
Pianta, R. C., Belsky, J., Houts, R. & Morrison, F. (2007). Opportunities to learn in America’s elementary
classrooms. Science, 315(5820), 1795–1796.
Rakoczy, K., Klieme, E., Leiss, D. & Blum, W. (2017). Formative assessment in mathematics instruction:
theoretical considerations and empirical results of the Co2CA project. In D. Leutner, J. Fleischer, J.
Grünkorn & E. Klieme (Hrsg.), Competence assessment in education: research, models, and instruments
(S. 447–467). Berlin: Springer.
Schütze, B., Souvignier, E. & Hasselhorn, M. (2018). Stichwort: Formatives Assessment.
Zeitschrift für Erziehungswissenschaft, 21(4), 697–715.
Shavelson, R. J., Young, D. B., Ayala, C. C., Brandon, P. R., Furtak, E. M., Ruiz-Primo, M. A., Tomita, M. K. & Yin,
Y. (2008). On the Impact of Curriculum-Embedded Formative Assessment on Learning: A Collaboration
between Curriculum and Assessment Developers. Applied Measurement in Education, 21, 295–314.
Stacey, K., Steinle, V., Price, B. & Gvozdenko, E. (2018). Specific mathematics assessments that reveal
thinking: An online tool to build teachers’ diagnostic competence and support teaching. In T. Leuders, J.
Leuders, K. Philipp & T. Dörfler (Eds.), Diagnostic competence of mathematics teachers – Unpacking a
complex construct in teacher education and teacher practice (S. 241–263). Springer.
132
Stacey, K. & Wiliam, D. (2013). Technology and assessment in mathematics. In M. A. K. Clements, A. J.
Bishop, C. Keitel, J. Kilpatrick & F. K. S. Leung (Hrsg.), Third international handbook of mathematics
education (S. 721–751). Springer.
Steinle, V., Gvozdenko, E., Price, B., Stacey, K. & Pierce, R. (2009). Investigating students’ numerical
misconceptions in algebra. In R. Hunter, B. Bicknell & T. Burgess (Hrsg.), Crossing divides – Proceedings
of the 32nd Annual Conference of the Mathematics Education Research Group of Australasia (Vol. 2)
(S. 491–498). MERGA.
Südkamp, A., Kaiser, J. & Möller, J. (2012). Accuracy of teachers’ judgements of students’ academic
achievement: a meta-analysis. Journal of Educational Psychology, 104(3), 743–762.
Von Aufschnaiter, C., Selter, C. & Michaelis, J. (2017). Nutzung von Vignetten zur Entwicklung von
Diagnose- und Förderkompetenzen – Konzeptionelle Überlegungen und Beispiele aus der MINT-
Lehrerbildung. In C. Selter, S. Hußmann, C. Hößle, C. Knipping, K. Lengnink & J. Michaelis (Hrsg.),
Diagnose und Förderung heterogener Lerngruppen. Theorien, Konzepte und Beispiele aus der MINT-
Lehrerbildung (S. 85–105). Waxmann.
Wiliam, D. (2019). Conclusion: why formative assessment is always both domain-general and domain-
specific and what matters is the balance between the two. In H. L. Andrade, R. E. Bennett & G. J. Cizek
(Eds.), Handbook of formative assessment in the disciplines (S. 243–264). Routledge.
Wiliam, D., Lee, C., Harrison, C. & Black, P. (2004). Teachers developing assessment for learning: impact on
student achievement. Assessment in Education: Principles, Policy and Practice, 11(1), 49–65.
Yan, Z. & Pastore, S. (2022): Assessing Teachers’ Strategies in Formative Assessment: The Teacher
Formative Assessment Practice Scale, Journal of Psychoeducational Assessment, 1–13.
Autor:innen
Fabian Rösken promoviert nach dem Abschluss des Studiums für Lehramt an Grundschulen an der
Universität Duisburg-Essen als wissenschaftlicher Mitarbeiter am Institut für Didaktik der Mathematik.
Seine Forschungsschwerpunkte umfassen die Entwicklung des formativem Assessment Tools „SMART“
und die Professionalisierung von Lehrkräften.
Katrin Klingbeil ist Studienrätin für die Fächer Mathematik und Musik an Gymnasien und Gesamtschulen
und promoviert derzeit als abgeordnete Lehrerin am Institut für Didaktik der Mathematik der Universität
Duisburg-Essen. Ihre Forschungsschwerpunkte liegen auf formativem Assessment und dem Lernen von
Algebra.
Bärbel Barzel, Prof. Dr., ist Professorin für Didaktik der Mathematik und Vorstandsvorsitzende des
interdisziplinären Zentrums für Bildungsforschung an der Universität Duisburg-Essen. Ihre
Forschungsschwerpunkte liegen im Einsatz von Medien, Professionalisierung von Lehrkräften und
formativen Assessment in der Mathematik.
Florian Schacht, Prof. Dr., ist Professor für Didaktik der Mathematik und wissenschaftlicher Leiter des
Zentrums für Lehrkräftebildung an der Universität Duisburg-Essen. Seine Forschungsschwerpunkte sind
Lehr-Lernforschung im Fach Mathematik, Professionalisierungsforschung und hochschuldidaktische
Fragen, insbesondere zum Einsatz digitaler Medien.