In dieser Rubrik berichten wir über Studien und Projekte, von denen wir erst nach der Publikation des WIT-2 erfahren haben und die aus diesem Grunde nicht in den Verfahrenshinweisen zum WIT-2 berücksichtigt sind. Ein grundsätzliches Problem im Testbereich besteht darin, dass die Verfahrenshinweise oft über viele Jahre aus verlagsseitigen Gründen (da die aktuelle Auflage nicht ausverkauft ist) nicht aktualisiert werden, so dass Anwender über aktuelle Entwicklungen nicht informiert sind. Hier schafft die vorliegende Website für den WIT-2 Abhilfe. Darüber hinaus wird auf dieser Website auf Rezensionen zum WIT-2 hingewiesen. Falls notwendig würde an dieser Stelle außerdem darüber informiert, dass bestimmte Verfahrensanwendungen nicht mehr gerechtfertigt sind.

Wenn Sie eine Studie mit dem WIT-2 durchgeführt haben, können wir über diese Website auf die Studienergebnisse aufmerksam machen. Gerne stellen wir auch Ihre konkreten Praxisprojekte vor, in denen der WIT-2 eine bedeutsame Rolle spielt. Wenn Sie Daten mit dem WIT-2 erhoben haben, die Sie für die Testpflege und Normierung zur Verfügung stellen wollen, oder im Zusammenhang mit den vorher genannten Aspekten mit uns Kontakt aufnehmen wollen, senden Sie uns eine Email.

Rezensionen zum WIT-2:

Diagnostikkommission des Schweizerisches Dienstleistungszentrum Berufsbildung | Berufs-, Studien- und Laufbahnberatung (2010). Label zu: Kersting, M., Althoff, K. & Jäger, A.O. (2008). WIT-2. Wilde-Intelligenz-Test 2. Siehe: http://www.diagnostik.sdbb.ch/labels (pdf)

Koch, H. (2008). WIT-2 – Testbesprechung. Zeitschrift für Entwicklungspsychologie und Püdagogische Psychologie, 40, 208-212. (pdf)

Kreuzpointner, L. (2009). Kersting, M., Althoff, K. & Jäger, A.O. (2008). WIT-2. Wilde-Intelligenz-Test 2 [Testbesprechung]. PSYNDEX Test-Dokument des Leibniz-Zentrums für Psychologische Information und Dokumentation (ZPID). (pdf)

Aktuelle Studien

Lang, J. W. B, Kersting, M., Hülsheger, U. R. & Lang, J. (2010). General mental ability, narrower cognitive abilities, and job performance: The perspective of the nested-factors model of cognitive abilities. Personnel Psychology, 63, 595-640. (pdf)

Von besonderer Bedeutung für den Nachweis der Kriteriumsvalidität des Wilde-Intelligenztest ist eine Studie von Lang, Kersting, Hülsheger und Lang (2010), da es sich nicht um Daten aus einer Einzelstudie, sondern um eine metaanalytische Integration der Daten von mehreren Tausend Personen aus insgesamt 54 Einzelstudien zur Kriteriumsvalidität handelt. Dabei wurden 30 verschiedene Jobs aus neun verschiedenen Job-Kategorien berücksichtigt. Da die Studien aus mehreren Jahrzehnten zusammengetragen wurden, handelt es sich um Daten zum WIT-1 Test. Die Erkenntnisse können allerdings grundsätzlich auf den WIT-2 übertragen werden, da WIT-1 und WIT-2 zum Teil typgleiche Aufgaben nutzen (die WIT-2 Aufgaben stellen zum Teil Überarbeitungen der WIT-1 Aufgaben dar) und da die gleichen Intelligenzdimensionen (entsprechend des Thurstone Modells) erfasst werden. Da die technische Qualität der WIT-2 Subtests deutlich höher ist als die der WIT-1 Subtests, ist allerdings davon auszugehen, dass der WIT-2 die in der Studie von Lang et al. (2010) berichteten Kriteriumsvaliditäten des WIT-1 noch übertrifft. Die in der Studie von Lang et al. (2010) ermittelten Kriteriumsvaliditäten des Wilde Test für die Intelligenzdimensionen nach Thurstone sowie die allgemeine Intelligenz lagen im Bereich .21 bis .44.

Die Studie zielte vor allem darauf ab einen Beitrag zu der theoretisch wie praktisch bedeutsamen Frage nach der relativen Bedeutung genereller und spezifischer Intelligenzfaktoren zu leisten. Bisherige Untersuchungen der so genannten spezifischen Fähigkeitstheorie haben in der Regel kaum Belege für die Validität spezifischer Intelligenzfaktoren finden können ("Not much more than g", Ree et al., 1994, p. 518). Die Studie von Lang et al. (2010) zeigt, dass dieses Ergebnis nicht methodeninvariant ist, die Antwort auf die Frage also von der jeweils eingesetzten Methode abhängt. Nimmt man eine herkömmliche Analyse der inkrementellen Validität mit dem Generalfaktor (g-Faktor) als erstem Prädiktor vor, so erklärt der Generalfaktor rund 83 Prozent der aufgeklärten Varianz – die Analyse würde die bisherige g-zentrische Auffassung stärken. Wendet man hingegen – wie für die spezifische Fähigkeitstheorie erstmals bei Lang et al. (2010) – die Relative-importance-Analyse an, so ist der Generalfaktor nicht einmal mehr der beste Einzelprädiktor, d.h. es zeigt sich keine Überlegenheit des g-Faktors, sondern eine hohe Bedeutsamkeit der spezifischen Faktoren.

Für weitere Analysen wurde der Datensatz in Berufe mit geringer und mit hoher Komplexität aufgeteilt, dabei zeigte sich nicht nur (wie bereits in anderen Studien), dass Intelligenz insbesondere für komplexe Berufe ein wichtiger Prädiktor ist, sondern auch, dass die spezifischen Fähigkeiten gerade bei Berufen mit geringer Komplexität – die durch Intelligenz weniger gut vorhersagbar sind – deutlich gegenüber dem g-Faktor an Bedeutung gewinnen.

++

Schulmann, C., Witsch, E., Klein, S., Arling, V. & Spijkers, W. (2010a). Praxis des RehaAssessments aus psychologischer Sicht. In: Deutsche Rentenversicherung (Hrsg.), 19. Rehabilitationswissenschaftliches Kolloquium. DRV-Schriften, Band 88, S. 290-291.

Nach einer Befragung von Schulmann, Witsch, Klein, Arling und Spijkers (2010) stand der Wilde Test (WIT) im Jahre 2009 auf Platz 3 der am häufigsten eingesetzten Intelligenztests bei den 17 befragten Berufsförderungswerken (Platz 1: IST, Platz 2: FRT). Die befragten Personen sollten zusätzlich zur Beantwortung der Frage nach der Einsatzhäufigkeit auch die Eignung des Tests anhand der Schulnotenskala beurteilen. Die besten Noten erhielt der IST-2000-R (1,9) und der Wilde Test (2,0) sowie Ravels Standard Progressive Matrices (2,0) gefolgt vom Figure Reasoning Test (2,3) und dem Intelligenz-Struktur-Test-2000 (2,3). Bezüglich des Wilde Tests wurde in der Befragung nicht zwischen den beiden verschiedenen Versionen des Wilde Tests unterschieden. Da der WIT-2 erst 2008 publiziert wurde, die Erhebung aber aus 2009 datiert, ist es möglich, dass in den berichteten Wert sowohl Werte für den WIT-1 als auch für den WIT-2 eingehen. Aktuelle Testversionen sind aber in der Regel deutlich besser geeignet, dies zeigt sich am IST, für den die Daten pro Version separiert erhoben wurden. Während die Eignung des IST-2000-R mit 1,9 beurteilt wurde, kommt die Vorgänger Version IST-2000 auf den Wert 2,3 und der IST-70 (der hinsichtlich der Aktualität mit dem "alten" WIT-1 vergleichbar ist) auf eine Schunote von 3,3.

++

Hartweg, V. (2010). Mechanisch-technisches Verständnis als Konstrukt in der testbasierten Studienberatung. Dissertation. Aachen: Rheinisch-Westfälische Technischen Hochschule Aachen. (pdf)

Hartweg (2010) entwickelte und validierte im Rahmen ihrer Dissertation einen Test zum mechanisch-technisches Verständnis (MeTeV), der als Self-Assessment für Studieninteressierte für technische Studiengänge genutzt wird. Zur Konstruktvalidierung des neu entwickelten Verfahrens nutzte sie u. a. die WIT-2 Module schlussfolgerndes und räumliches Denken sowie den Mannheimer Test zur Erfassung des physikalisch-technischen Problemlösers (MTP, Conrad, Baumann & Mohr, 1980). In einer Studie mit 289 Personen betrug die unkorrigierte Korrelation zwischen dem neuen Test MeTeV und dem WIT-Modul Schlussfolgerndes Denken r=0.46, sodass die Autorin von einem großen Effekt spricht. Der Zusammenhang des MeTeV zum visuell-räumlichen Bereich (WIT-Abwicklungen) war mit r=0,51 am engsten.

Die Verbindung zwischen den WIT-2 Abwicklungen und dem neuen Test MeTeV konnte auch in einer zweiten Studie mit N=112 mit r=.56 bestätigt werden (konvergente Validität). In dieser Studie wurde zur diskriminanten Validierung auch der WIT-2 Subtest Spiegelbilder eingesetzt, erwartungsgemäß fiel der Zusammenhang zwischen dem MeTeV und den Spiegelbildern mit r=0,16 deutlich niedriger und nicht signifikant aus. In gleicher Richtung fiel der Zusammenhang zwischen den beiden WIT-2 Subtests und dem MTP aus: Ein substantieller Zusammenhang in Höhe von r=.43 zwischen MTP und den Abwicklungen einerseits und kein Zusammenhang (r=.07) zwischen MTP und den Spiegelbildern andererseits.

Anhand der zuerst genannten Studie mit 289 Personen überprüfte Frau Hartweg auch die Akzeptanz der Testaufgaben. Dazu wurde der Akzept-Fragebogen verwendet (weitere Informationen finden Sie hier). Auf einer Skala von "1" (keine / geringe Akzeptanz) bis "6" (hohe Akzeptanz) fand der WIT-2 Subtest Abwicklungen in allen drei eingesetzten Akzeptanz-Skalen (Messqualität, Augenscheinvalidität und Belastungsfreiheit) mit Werten von 3,5; 3,6 und 4.0 eine positive Resonanz bei den getesteten Personen.

++

Krumm, S., Hüffmeier, J., Dietz, F., Findeisen, A., & Dries, C. (2011). Towards Positive Test Takes' Reactions to Kognitive Ability Assessments: Development and Initial Valvation of the Reasoning Ability at Work Test. Journal of Business and Media Psychology, 2, 11-18. (pdf)

Krumm, Hüffmeier, Dietz, Findeisen und Dries (2011) entwickelten einen Intelligenztest mit einer attraktiven Oberfläche, in dem die Aufgaben des Tests konkret in den Arbeitskontext eingebettet waren (Reasoning Ability at Work Test, RAWT). Zur Untersuchung der Augenscheinvalidität wurde der neue Test (RAWT) gemeinsam mit dem WIT-2 Modul schlussfolgerndes Denken bei einer Gruppe von 89 Personen eingesetzt. Zur Erfassung der sozialen Validität wurde der Akzept-Fragebogen verwendet (weitere Informationen finden Sie hier). Auf einer Skala von "1" (keine / geringe Akzeptanz) bis "6" (hohe Akzeptanz) wurde dem WIT-2 Modul schlussfolgerndes Denken in allen vier eingesetzten Skalen (Messqualität, Augenscheinvalidität, Kontrollierbarkeit und Belastungsfreiheit) mit Werten von 3,9; 3,2; 5,5 und 4.1 eine hohe Akzeptanz zugesprochen. Die Autoren hatten ihrer Studie die These zugrunde gelegt, dass ihr neuer Test RAWT (mit einer attraktiven / semantisch konzeptualisierten Oberfläche) eine höhere Akzeptanz finden würde als der WIT-2. Diese Hypothese ließ sich nicht bestätigen, im Gegenteil blieben die Akzeptanzwerte des neuen Verfahrens mit 3,5; 3,2, 4,7 und 3,6 in allen Dimensionen nominell hinter den Akzeptanzwerten des WIT-2 zurück.

Cronbach's alpha für das WIT-2 Modul schlussfolgerndes Denken betrug in dieser Studie .81. Das Kriterium Mathematiknote konnte durch das WIT-2 Modul zu r=.32 vorhergesagt werden.

++

Schröder, P. (2011). Kriterienbezogene Evaluation des Reha-Assessments des Berufsförderungswerk Oberhausen. Diplomarbeit. Düsseldorf: Heinrich Heine Universität Düsseldorf.

Schröder (2011) prüfte mit seiner Diplomarbeit die Aussagekraft des WIT-2 im Rahmen des Reha-Assessments des Berufsförderungswerks Oberhausen. Als Kriterien lagen die Abschlussnote der Umschulung (N = 36) sowie der Erfolg in der beruflichen Qualifizierungsmaßnahme (bestanden vs. nicht-bestanden) vor (N = 71) vor.

Die eingesetzten WIT-2 Module korrelieren zwischen r= .31 und .71 substantiell mit dem ebenfalls eingesetzten Figure Reasoning Test (FRT) (N=1921).

Anhand der Kriterien konnte die Validität des WIT-2 aufgezeigt werden. Das Modul sprachliches Denken korreliert zu r=.39 mit der Abschlussnote (N=36). (Während der FRT nur in Höhe von r=.22 mit dieser Abschlussnote korreliert). Auch bezogen auf das Kriterium "Bestehen der Qualifizierungsmaßnahme" ist der Zusammenhang des FRT (r=.09) mit dem Kriterium nominell kleiner als der entsprechende Zusammenhang aller genutzten Module des Wilde-Intelligenz-Test 2. (Beispiel: Der Zusammenhang zwischen WIT-2 sprachliches Denken und dem Kriterium "Bestehen der Qualifizierungsmaßnahme" betrug r=.38).


Für Hinweise auf weitere Rezensionen zum WIT-2 sowie für jede Art von Tipps zur Verbesserung des WIT-2 sind wir sehr dankbar. Bitte wenden Sie sich damit einfach via Email an Martin Kersting