Autor(in) und Thema:


*   Die Ergebnisse dieser Diplomarbeit wurden auf einem wissenschaftlichen Kongress vorgestellt
**  Diese Diplomarbeit ist auch als Buch publiziert
*** Mit einem Förderpreis ausgezeichnete Arbeit


Becker, Sabine

Konstruktvalidität - Evaluation zweier Development Center

20. August 2002

Die Arbeit beschäftigt sich mit der Evaluation zweier in der deutschen Wirtschaft ange­­wandter Development Center (DC), im Folgenden als DC-A und DC-B bezeichnet. Neben der Überprüfung auf die allgemeine Konstruktvalidität in den DCs, wird der Einfluss der Dimensionsanzahl, des Peer-Ratings und zweier Lei­stungstests auf die konvergente Validität betrachtet. Die Daten wurden in 3 ½ tägigen DC-Veranstal­tungen an 94 Teilnehmern (89 m, 5 w) für DC-A und an 44 Teil­nehmern (40 m, 4 w) für DC-B erhoben. Die Teilnehmergruppen setzten sich aus Per­sonen, die Potential für eine angehende Führungskraft besitzen, zusammen. Die Altersspanne lag zwischen 28 – 45 Jahren. Jeder Teilnehmer wurde über mehrere Übungen anhand mehrerer Anforderungsdimensionen beobachtet und beurteilt. Zusätzlich wurde von den Teilnehmern ein Peer-Rating erhoben. Die so gewonnenen Daten wurden einer Multitrait-Multimethod-Analyse und einer explorativen Faktoren­ana­lyse unterzogen. Die Überprüfung auf signifikanten Unterschied erfolgte mit dem Test auf Unterschiede zweier Korrelationskoeffizienten. Die Ergebnisse zeigen, dass Konstruktvalidität in beiden Development Centern nicht gegeben und der Einfluss der Dimensionsanzahl, des Peer-Ratings und der Leistungstests nicht signifikant ist. Verbesserungsvorschläge zur Erhöhung der Konstruktvalidität werden abschließend diskutiert.

Birk, Matthias

Zur Validität der Anforderungsanalyse. Eine theoretische und empirische Exploration

9. September 2004

Wie valide lassen sich Stellen- und Ausbildungsanforderungen mittels eines standardisierten Fragebogens erfassen? Zur Untersuchung dieser Frage wurden Stelleninhaber (N=108) und Vorgesetzte (N=121) aus der Kommunalverwaltung sowie Laien (N=71) anhand eines Anforderungsanalyseverfahrens befragt. Die Grundidee der Arbeit ist es, die Validität der Anforderungsanalyse indirekt, nämlich über die Prüfung der Kriteriumsvalidität einer aufgrund der Ergebnisse der Anforderungs­­analyse gewichteten Testbatterie, zu untersuchen (N=140). Die Validität der derart ge­wichteten Testbatterie wird mit der Validität verglichen, die erzielt wird, wenn die Gewichtung der Testbatterie aufgrund der Ergebnisse der mit Laien durch­geführten Anforderungsanalyse vorgenommen wird. Außerdem wurden die Test­komponenten von einer Expertengruppe direkt (ohne den Umweg über eine Anforderungs­analyse) gewichtet oder aber alle Testkomponenten wurden einfach gleich­gewichtet. Auch die bei diesen Gewichtungen erzielten Validitätskoeffizienten sollen mit den Validitäts­koeffizienten verglichen werden, die bei einer Gewichtung auf­grund der Ergebnisse der Anforderungsanalyse erzielt werden. Weitere Fragestellungen thematisieren die Urteilstendenzen. So wird beispielsweise gefragt, ob Stellen­inhaber bei der Bearbeitung von anforderungsanalytischen Fragebogen stärker sozial erwünscht ant­worten als deren Vorgesetzte.

Die Validität im Sinne der Übereinstimmung der Anforderungsanalyse-Beurteilungen mit Experten fällt hoch aus. Hingegen eignen sich die Anforderungsanalyse-Beurteilungen wenig für die Gewichtung von Testkomponenten, verglichen mit der direkten Gewichtung durch Experten und der gleichmäßigen Gewichtung aller Kompo­nenten. Es zeigen sich Urteilstendenzen der Art, dass Stelleninhaber ihre eigenen Anforderungen höher beurteilen als deren Vorgesetzte; die Anforderungs-Beur­teilungen beider korrelieren hoch mit der sozialen Erwünschtheit der Merkmale.

Laien erbringen vergleichbar valide Anforderungs-Beurteilungen wie Stellenexperten.

Busen, Bernd

Zum Zusammenhang zwischen Persönlichkeitsmerkmalen der Geführten und ihren Vorstellungen von idealen Führungskräften

30. März 2007

Führung ist ein komplexer Prozess, bei dem die Interaktion zwischen der Führungskraft und den Geführten eine zentrale Rolle spielt. Häufig steht jedoch die Führungskraft einseitig im Vordergrund der Forschung. Die vorliegende Arbeit fokussiert hingegen die geführten Personen und untersucht, ob die Vorstellungen über eine ideale Führungskraft in Abhängigkeit von den Persönlichkeitsmerkmalen der Geführten variieren. Bevorzugen Geführte eher solche Eigenschaften einer Führungskraft, die auch bei ihnen selber hoch ausgeprägt sind (Ähnlichkeitshypothese) oder bevorzugen sie eher solche Eigenschaften einer Führungskraft, die bei ihnen selber nur schwach ausgeprägt sind (Hypothese der komplementären Bedürfnisse)? Diese Thesen, sowie weitere Fragestellungen, werden in der Arbeit für alle Persönlichkeitsmerkmale des Fünf Faktoren Modells geprüft.

Im Ergebnis zeigten sich insgesamt nur schwache Zusammenhänge zwischen den Persönlichkeitsmerkmalen der Geführten und ihren Führungspräferenzen. Die Ähnlichkeitshypothese konnte für die globalen Big Five Persönlichkeitsmerkmale Extraversion, Verträglichkeit und Gewissenhaftigkeit insgesamt bestätigt werden. Beim Persönlichkeitsmerkmal Neurotizismus variierten die Ergebnisse in Abhängigkeit von der jeweiligen Ausprägung des Merkmals. Bei Geführten mit geringen Neurotizismuswerten galt die Ähnlichkeitshypothese, bei Geführten mit hohen Neurotizismuswerten die Hypothese komplementärer Bedürfnisse. Durch eine spezifischere Operationalisierung sowie durch die Herstellung von Symmetrie hinsichtlich des Generalitätsniveaus zwischen den zu vergleichenden Variablen ließen sich teils statistisch bedeutsam prägnantere Zusammenhänge aufzeigen. (english abstract)

Dlugosch, Simone

Prognosekraft, geschlechtsspezifische Validität und Fairness des Auswahlverfahrens einer privaten Hochschule

22. Juli 2004

Die Arbeit evaluiert das Auswahlverfahren einer privaten Hochschule für Rechtswissenschaft – der Bucerius Law School – hinsichtlich dessen Prognosekraft, ge­schlechts­spezifischer Validität und Fairness. Grundlage hierfür sind die Daten von 154 Personen aus den Durchführungsjahren 2000 und 2001.

Das Auswahlverfahren ist sequentiell angelegt: Anhand der Abiturdurchschnittsnote und dem Ergebnis aus einem spezifischen Studierfähigkeitstest werden in einem ersten Schritt ca. 200 von etwa 400 Studienplatzbewerbern ausgewählt. Diese durchlaufen ein eintägiges mündliches Verfahren, dessen Ergebnis mit dem Ergebnis aus dem ersten Auswahlschritt im Verhältnis 4:1 gewichtet wird. Auf Basis dieses Ge­samt­wertes werden schließlich ca. 100 Studienplätze pro Jahr vergeben. Als Kriterien stehen für den Jahrgang 2000 die Abschlussnote des Bachelor-Examens, für die Kohorte 2001 die bisher erbrachten Prüfungsergebnisse zur Verfügung.

Hinsichtlich der Prognosekraft erwies sich die Abiturdurchschnittsnote als aussagekräftigster Einzelprädiktor, gefolgt vom Studierfähigkeitstest. Das mündliche Verfahren kann in keinem Jahr signifikante Werte erzielen. Durch dessen hohe Gewichtung ergeben sich zwischen dem Gesamtergebnis des Verfahrens und dem Studienerfolg nur noch geringe Korrelationen.

Die geschlechtsspezifische Prognosekraft entspricht dagegen den Erwartungen: es zeigen sich keine unterschiedlichen Werte für Männer und Frauen. Fairness im Sinne des Modells nach Cleary (1968) kann dem Verfahren aber auf Basis der vorliegenden Ergebnisse nicht zugesprochen werden. Durch die Abiturdurchschnittsnote und den Studierfähigkeitstest wird die Leistung der Frauen im Studium systematisch unter­schätzt. Weiterhin wurde für das mündliche Verfahren untersucht, ob die männ­lichen Beobachter gleich- und gegengeschlechtliche Teilnehmer unterschiedlich beurteilen: Hier zeigt sich ein signifikanter Effekt im Gesamtergebnis des mündlichen Verfahrens zu Gunsten der Frauen.

Abschließend werden verschiedene Gründe für die mangelnde prognostische Validität sowie die Ergebnisse zu den geschlechtsspezifischen Aspekten diskutiert. Hieraus werden Optimierungsvorschläge für das Verfahren abgeleitet sowie Ansatzpunkte für zukünftige Evaluation aufgezeigt.

Diese Diplomarbeit wurde im Shaker Verlag publiziert:

Dlugosch, S. (2005). Prognose von Studienerfolg - dargestellt am Beispiel des Auswahlverfahrens der Bucerius Law School. 217 Seiten, 30 Abb., 32,50 EUR. ISBN 3-8322-4557-X
-> Bestellen bei Amazon.de

Dütschke, Elisabeth

Über die Kombination von Leistungs- und Persönlichkeitstests zur Erhöhung der prädiktiven Validität bei der Auswahl von Call-Center-Agenten

16. Februar 2004

Die Diplomarbeit geht anhand eines Datensatzes aus der Wirtschaftspraxis der Frage nach, ob durch Kombination von Leistungs- und Persönlichkeitstests in der Personalauswahl die prädiktive Validität gesteigert werden kann. Da Messungen von Konstrukten mit den beiden Testkategorien nicht oder nur wenig interkorreliert sind, ist anzunehmen, dass in der kombinierten Anwendung ein bedeutendes Potential steckt, um Vorhersagen zu verbessern. Literaturanalysen zeigen, dass es bisher nur wenige Studien gibt, die speziell auf diese Thematik ausgerichtet sind.

Die empirische Prüfung der Fragestellung erfolgte mit Daten aus der Rekrutierung von Call-Center-Agenten für das Inhouse-Call-Center einer Direktbank. Der Rekrutierungsprozess war bereits vor Beginn der Arbeit abgeschlossen, so dass die Studie evaluativen Charakter hat. Zur Personalauswahl hatte die Bank drei Messungen aus dem Leistungsbereich (SPM, Skala Kombinationsfähigkeit aus der ISA, COG) und drei aus dem Persönlichkeitsbereich (SKASUK-Leistungsmotiv und –Dominanzstreben, Skala Anspruchsniveau aus den AH) verwendet. Als Kriterien standen die Personalbeurteilung und der Verkaufserfolg der Agenten zur Verfügung.

Keines der Testverfahren erwies sich als vorhersagekräftig. Die Kombination führte in der Folge auch nicht zu prädiktiver Validität. Die Ursachen für die fehlende Vorhersagekraft können nicht eindeutig festgemacht werden. Es ergaben sich Hinweise auf psychometrische Mängel bei den Persönlichkeitstests und den Kriterien. Möglicherweise waren auch nicht erfasste Störvariablen wirksam, oder die Korrespondenz von Prädiktoren und Kriterien ist unzureichend.

Explorativ ist der Zusammenhang zwischen Testergebnissen und dem Kriterium Kündigung betrachtet worden. Hier deutet sich an, dass Agenten, die das Unternehmen schon nach wenigen Monaten wieder verlassen, in ISA und COG schlechtere Leistungen zeigen.

Enninga, Imko

Prüfung der Leistungsdifferenzierungshypothese der Intelligenz

29. November 2004

Gegenstand der Arbeit ist eine Prüfung der Leistungsdifferenzierungshypothese der Intelligenz (LDH). Diese Hypothese besagt, dass bei höher in­telligenten Individuen der Generalfaktor eine geringere Bedeutsamkeit bei der Er­klärung von kognitiven Leistungen besitzt als bei niedriger intelligenten Personen. Anders betrachtet, nimmt mit zunehmender Leistungshöhe die Bedeutung der spe­zi­fi­schen Varianz der einzelnen Subtests zu. Auf Spearman (1927) zurückgehend, wurde die LDH in den 1950er und 1960er Jahren in Deutschland untersucht (z.B. Wewetzer, 1958) und gewann durch Studien in den USA in jüngerer Zeit wieder hohe Aktualität (z. B. Jensen, 2003).

Ein Schwerpunkt der Darstellung liegt auf dem Einfluss der Unter­­suchungs- bzw. Ana­lyse­methoden auf die Befunde zur LDH. Ziel der Arbeit ist es, die methodischen Pro­bleme bisheriger Publikationen zu überwinden und notwendige Bedingungen der Hypo­thesenprüfung umfassend zu kontrollieren. Die häufig eingesetzten globalen Ana­lyseverfahren wurden durch weitere Verfahren, z.B. konfirmatorische Faktorenana­lysen ergänzt, um eine genauere Prüfung auf Unterschiede der Faktorenstruktur zu ermöglichen. Im Rahmen von Untersuchungen zur Konstruktvalidität des WILDE In­telligenztest R (WIT-R; Kersting, Althoff & Jäger, in Vorbereitung) wurden 650 Pro­ban­den mit ins­ge­samt 18 Aufgabengruppen untersucht. Ein in der Gesamtgruppe identi­fiziertes, von 13 Variablen konstituiertes Faktorenmodell wurde auf Unter­schiede in hoch- und niedrig leistungsfähigen Subgruppen getestet. Im Rahmen ver­schiedener Varianten der Subgruppenselektion wurden zumeist die übrigen fünf Auf­gaben­gruppen als unabhängige Selektionsvariablen genutzt.

Es ergaben sich der LDH diametral entgegenstehende Befunde, d.h. für niedriger leistungsfähige Probanden wurde tendenziell eine höhere Differenziertheit der Intelligenzstruktur festgestellt. Anschließende Betrachtungen der Subtestverteilungen deuteten an, dass die gefundenen Differenzen zumindest teilweise auf Variabilitätsunter­schiede in den einzelnen Tests zurückzuführen sind. Insgesamt sprechen die Befunde deshalb für invariante Intelligenzstrukturen bei unterschiedlich leistungs­fähigen Personen. Weitere Vergleiche von Männern und Frauen sowie Probanden unter­schiedlichen Bildungsniveaus ergaben keine Hinweise auf kognitive Strukturunterschiede. Dies galt auch für den Vergleich zweier Teilstichproben aus Schülern und Rehabilitanden.

Gehring, Frank

Universitary Citizenship Behavior. Entwicklung und Validierung eines Fragebogens zu umfeldbezogener Leistung an Hochschulen

22. August 2006

Arbeitgeber fordern zunehmend, dass (Fach-)Hochschulabsolventen über soft skills verfügen sollen. Ungeachtet dessen orientiert sich die Diagnostik zur Beratung und Auswahl von Studierenden einseitig an den akademischen Kriterien Studiendauer und -note. Diese Kriterien sind Indikatoren der aufgabenbezogenen Leistung (task performance). Demgegenüber steht die umfeldbezogene Leistung (organizational citizenship behavior, OCB). Bislang wurde diese im Arbeitskontext übliche Unterscheidung noch nicht auf das Studium übertragen.

Gegenstand der Diplomarbeit ist die Konstruktion und Validierung eines Fragebogens zu OCB bei Studierenden. Zunächst wurde mit 101 Personen unter Einsatz der >critical incident technique< eine Anforderungsanalyse zu umfeldbezogener Leistung an Universitäten durchgeführt. Auf dieser Basis wurde der neue Fragebogen UCB (universitary citizenship behavior) entwickelt, der in einer Studie mit 397 Studierenden eingesetzt wurde. Die so entstandene Fragebogen-Endform wurde in einer weiteren Studie mit 282 Studierenden validiert.

Dabei wurden auf Seiten der Prädiktoren wie auf Seiten der Kriterien sowohl kognitiv- als auch persönlichkeits-orientierte Variablen berücksichtigt. Zur Vorhersage der aufgabenbezogenen Leistung (Abitur- und Vordiplomnote) wurde mit Hilfe des Mehrfachwahl-Wortschatztests (MWT-B, Lehrl, 1976) die verbale Intelligenz gemessen. Zur Vorhersage der umfeldbezogenen Leistung (UCB) wurden das Big Five Inventar (BFI, Rammstedt & John, 2005) sowie ein neuartiger berufsbezogener Persönlichkeitstest (Start-P, Kersting & Beauducel, in Vorbereitung) eingesetzt.

Vier der fünf intendierten Dimensionen des neuen Fragebogens ließen sich bestätigen: Hilfsbereitschaft, Gewissenhaftigkeit, Unkompliziertheit und Eigeninitiative. Für die Skala Rücksichtnahme fand sich, wie bereits in anderen Studien zu OCB, keine empirische Evidenz. Als Nachweis für die konvergente und diskriminante Validität konnte mit korrelations- und regressionsanalytischen Techniken gezeigt werden, dass sich die mit dem neuen Fragebogen erfasste umfeldbezogene Leistung durch Persönlichkeitsmerkmale vorhersagen lässt, wohingegen die Intelligenz als kognitiver Prädiktor lediglich zur Vorhersage der aufgabenbezogenen Leistung beiträgt. Ein hoher Zusammenhang zeigt sich auch zwischen dem mit dem Fragebogen erfassten und dem über (selbstberichtete) biografische Daten erhobenen UCB. (english abstract)

Jacobs, Sonja

Postkorbverfahren in der Personalauswahl - eine Evaluationsstudie

28. November 2002

Das Ziel der Arbeit ist die Evaluation des unveröffentlichten Postkorbs der Deutschen Ge­­sellschaft für Personalwesen (DGP). Grundlage für die Evaluation ist eine empirische Untersuchung an einer studentischen Stichprobe (N = 91). Neben dem DGP-Postkorb wurden noch ein weiterer Postkorb, ein Intelligenztest, ein Aufmerksamkeitstest und ein Selbsteinschätzungsbogen eingesetzt. Auf der Basis dieser Daten erfolgt eine psychometrische Analyse der Testkennwerte, eine Überprüfung der Gütekriterien sowie eine qualitative Analyse der Items und des Postkorbmaterials. Die psychometrische Qualität der Items des DGP-Postkorbs erweist sich als unzureichend. Ebenso ist die Reliabilität als nicht zufriedenstellend zu bewerten. Im Rahmen einer Konstruktvalidierung ergibt sich zum einen ein korrela­tiver Zusammenhang zwischen der DGP-Postkorbleistung und der Intelligenztestleistung und zum anderen ein Zusammenhang zwischen der DGP-Postkorbleistung und der Aufmerksamkeitstestleistung. Es wird gezeigt, dass diese Zusammenhänge durch den gemeinsamen Anteil an notwendiger Konzentration für die Bearbeitung des Postkorbs erklärt werden können. Im Zusammenhang mit den anderen eingesetzten Verfahren waren keine nennenswerten Zusammenhänge aufzufinden. Auf der Basis der qualitativen Analyse wird gezeigt, dass die mangelnde psycho­me­trische Qualität auf die unzureichende Konstruktion des Postkorbs und den ent­sprechenden Items zurückzuführen sein könnte. Abschließend werden Vorschläge für eine Revision des Postkorbs gegeben.

Klotz, Julia

Konstruktvalidierung von Tests, die durch Simulation von Büroaufgaben Arbeitseffizienz erfassen

9. Dezember 2005

Fast ein Drittel aller in Deutschland Erwerbstätigen geht sogenannten Bürotätigkeiten nach. Zur Personalauswahl werden häufig sogenannte Büroarbeitstests eingesetzt. Dabei handelt es sich um Tests, die durch Simulationen von Büroaufgaben Arbeitseffizienz erfassen wollen. Prominente Beispiele für diese Art von Tests sind der ABAT-R (Lienert & Schuler, 1994) oder die Testaufgabe "E-Mails Bearbeiten", die Bestandteil des neuen Wilde Tests (WIT-2, Kersting, Althoff und Jäger, 2006) ist. Solche Tests zeichnen sich durch eine gute Kriteriumsvalidität aus und erfreuen sich einer hohen sozialen Akzeptanz, ihre Konstruktvalidität ist aber weitgehend ungeklärt. Die Diplomarbeit setzt sich mit den kognitiven Anforderungen auseinander, die bei sogenannten "Büroaufgaben" zu bewältigen sind. Aufgrund theoretischer Annahmen wird erwartet, dass zur Bewältigung von Aufgaben zur Simulation von Bürotätigkeiten (1) Konzentration, (2) schlussfolgerndes Denken und (3) eine hohe Arbeitsgedächtniskapazität notwendig sind. Diese Annahmen wurde an einer Gruppe von N = 111 Personen erfolgreich geprüft, die einerseits sechs Bürotests und andererseits eine umfassenden Testbatterie zu den drei genannten Konstrukten bearbeitet haben.

Knebelau, Maren

Evaluation des WILDE-Intelligenztests (WIT) und seiner Funktion als eignungsdiagnostisches Instrument

6. März 2002

Gegenstand der Arbeit ist die Evaluation des WILDE-Intelligenz-Tests (WIT, Jäger & Althoff, 1983, 1994). Fokussiert werden die Eigenschaften, die der Test aktuell beim Ein­satz im eignungsdiagnostischen Kontext zeitigt. Die Evaluation erfolgt durch Analyse der Testmaterialien und Literatur sowie mittels einer empirischen Untersuchung. Die zugrundegelegten Testergebnisse stammen von 382 Bewerbern für eine Fach­hoch­­schulausbildung, die im Rahmen der Eignungsuntersuchung eine Testbatterie mit sieben WIT-Subtests bearbeiteten. Auf Basis der Testergebnisse wurde zunächst die psychometrische Qualität der Items, Subtests und parallelen Testformen unter­sucht. Dabei zeigten sich für sechs der sieben Subtests Defizite entweder in Form un­regelmäßiger und asymmetrischer Rohwertverteilungen, inadäquater Item­schwierigkeiten oder unzureichender Itemtrennschärfenkoeffizienten sowie Re­liabilitäts­mängel und Mittelwertunterschiede zwischen den Testformen. Im zweiten Schritt wurde eine Konstruktvalidierung der Testbatterie durchgeführt. Es ergab sich, dass die Subtests die intendierten Fähigkeitsbereiche nicht erfassen und daraus Schwierigkeiten bei der Interpretation der gemessenen Fähigkeiten resultieren. Zudem wurde die prognostische Validität der Testbatterie zur Vorhersage des Studien­­erfolgs, operationalisiert durch die Zwischenprüfungsnote, an 122 zugelassenen Bewerbern bestimmt. Die WIT-Subtests weisen eine Kriteriumsvalidität in zu­­friedenstellender Höhe auf. Abschließend wird der WIT auf der Grundlage der Be­funde hinsichtlich seiner Stärken und Schwächen bewertet und daraus Ansatzpunkte für eine Revision abgeleitet.

Kohlrautz, Sarah

Der Einfluss der Persönlichkeit bei Leistungstests

19. Juni 2006

Intelligenz und Persönlichkeit stehen häufig gemeinsam im Interesse der Berufseignungsdiagnostik, werden aber zumeist separat konzeptualisiert und untersucht. Die Diplomarbeit widmet sich auf theoretischer Ebene dem Zusammenspiel der beiden Konstrukte und auf empirischer Ebene der Korrelation zwischen Testleistungen, die den beiden Konstrukten zugeordnet werden können. Grundlegende Annahme ist, dass es Personen mit bestimmten Persönlichkeitsmerkmalen sind, die bei so genannten Arbeitsproben (z. B. zur Simulation von Büroroutinetätigkeiten) besonders gut abschneiden. Der Bereich der Intelligenz wird in der Diplomarbeit durch die drei Dimensionen (1) Schlussfolgerndes Denken, (2) Bearbeitungsgeschwindigkeit und (3) Arbeitseffizienz repräsentiert. Aus dem Bereich der Persönlichkeit werden die Konstrukte Gewissenhaftigkeit und Perfektionismus untersucht. Dabei wird davon ausgegangen, dass sich ein Einfluss der Persönlichkeit nur bei Testaufgaben zeigt, die einerseits eine gewisse Bearbeitungsdauer in Anspruch nehmen (also nicht bei den kurzen Aufgaben zur Bearbeitungsgeschwindigkeit) und deren Lösung andererseits nicht wesentlich durch die Fähigkeit zum logischen Denken bestimmt ist (wie bei den Aufgaben zum schlussfolgernden Denken).

Zur Prüfung der Annahmen wurde eine Studie mit 111 Personen durchgeführt. Als zentrales Ergebnis kann festgehalten werden, dass es einen (schwachen) Zusammenhang zwischen den Intelligenz- und den Persönlichkeitsindikatoren gibt. Wie erwartet stehen Gewissenhaftigkeit und Perfektionismus nominell enger mit den Leistungen in den Aufgaben zur Arbeitseffizienz in Zusammenhang als mit den Leistungen in Aufgaben zur Bearbeitungsgeschwindigkeit und zum schlussfolgernden Denken. Der Unterschied in den Korrelationshöhen verfehlt aber die statistische Signifikanz. Bei der Vorhersage der Leistungen in der Arbeitseffizienz kann nur die Facette Kompetenz gegenüber der Bearbeitungsgeschwindigkeit und dem schlussfolgerndem Denken inkrementell zur Varianzaufklärung beitragen, nicht aber, wie erwartet, die Gewissenhaftigkeit oder der Perfektionismus. (english abstract)

Labusga, Andrea

Bedingungen der Übereinstimmung von Selbst- und Fremdurteilen bei berufsbezogenen Persönlichkeitstests

19. Juni 2006

In der Arbeits- und Organisationspsychologie herrscht ein lang anhaltender Trend zur Nutzung berufsbezogener Persönlichkeitstests. Eine zentrale Fragestellung in diesem Kontext ist die Übereinstimmung von Selbst- und Fremdurteilen. Häufig wird das Ausmaß dieser Übereinstimmung als Validitätsindikator des Verfahrens interpretiert. Die Diplomarbeit reflektiert theoretisch und empirisch die Bedingungen, unter denen geringere oder höhere Übereinstimmungen der Selbst- und Fremdurteile zu erwarten sind. Dabei geht es zunächst um (1) die Beziehung zwischen Selbst- und Fremdbeurteiler. In einem zweiten Schritt soll dann geklärt werden, ob (2) die Art der zu beurteilenden Eigenschaft die Übereinstimmung zwischen Selbst- und Fremdurteil moderiert. Die grundlegende Annahme lautet hier, dass die Übereinstimmung umso höher ausfällt, desto beobachtbarer die zu beurteilenden Eigenschaften sind. Mit der dritten Fragestellung wird (3) der Einfluss der verwendeten Befragungsmethode geprüft. Der vierte und letzte Untersuchungsaspekt widmet sich der Frage, ob (4) die Übereinstimmung von Selbst- und Fremdurteil in Abhängigkeit von bestimmten Fähigkeiten der Fremdbeurteiler variiert. Um die Fragestellungen drei und vier untersuchen zu können, wurden den Fremdbeurteilern drei Arten von Urteilen abverlangt. Zunächst hatten die Personen sich selbst mit Hilfe von Persönlichkeitsfragebogen hinsichtlich zweier fragestellungsrelevanter Dimensionen (Empathie und soziale Intelligenz) zu beurteilen. Außerdem wurde ihre verbale Intelligenz mit einem Test geprüft und ihre Tendenz, sozial erwünscht zu antworten, kontrolliert. Bei der Fremdbeurteilung wurden die Personen sowohl gefragt, wie sie persönlich die Zielperson einschätzen, sie sollten aber auch angeben, wie sich die Person ihrer Meinung nach selbst eingeschätzt hat.

In der Diplomarbeit werden die (teilweise online erhobenen) Daten von 142 Personen (71 "Paaren" von Selbst- und Fremdbeurteilern) analysiert. Die Items der eingesetzten Persönlichkeitsfragebogen werden danach unterteilt, ob sie eher auf internal oder external beeinflusstes Erleben und Verhalten zielen. Die in den internalen Items thematisierten Sachverhalte sind, so die These, leichter zu beobachten. Tatsächlich ist die Übereinstimmung zwischen Selbst- und Fremdurteil bei diesen Items höher als bei den externalen Items. Auch zeigt sich für die internalen Items, dass die Übereinstimmung zwischen Selbst- und Fremdbeurteilung mit wachsender Vertrautheit zwischen Selbst- und Fremdbeurteiler steigt. (english abstract)

Leimbach, Nicole

Versuch einer Integration von Rechtschreibleistungen in die Intelligenzstrukturforschung

30. September 2005

Für die Diagnose von Rechtschreibleistungen stehen unterschiedliche diagnostische Verfahren zur Verfügung. Entweder müssen vorgegebene Wörter hinsichtlich der Korrektheit der Schreibweise beurteilt werden ("Richtig-Falsch Format" sowie "Multiple-Choice Format") oder aber Wörter müssen aktiv geschrieben werden ("vollständiges Diktat" oder "Lückendiktat"). Die zuerst genannte Erhebungsform unterscheidet sich wesentlich vom Diktat, da die relevante Information hier gelesen und nicht, wie beim Diktat, gehört wird. Die Methode des Diktats kommt der Alltagsanforderung des fehlerlosen Schreibens von Texten am nächsten, da auch im Alltag häufiger die Lösungsfindung selbsttätig erfolgen muss und - anders als bei dem Richtig-Falsch-Format und beim Multiple-Choice Format - nicht auf Vorgaben aufgebaut werden kann. Praktiker stehen dem Multiple-Choice Format als Methode der Diagnostik von Rechtschreibleistungen daher skeptisch gegenüber. Allerdings ist die Diktatform weniger auswertungsobjektiv und testökonomisch als das Multiple-Choice Format. In der im Rahmen der Diplomarbeit ausgewerteten empirische Studie mit 200 Personen wird die Methode zur Diagnostik der Rechtschreibleistungen systematisch variiert und kontrolliert, indem ein und dieselben Anforderungen an die Rechtschreibung einmal in Form eines Lückendiktats und einmal in Form eines Multiple-Choice Test gestellt werden, wobei die Darbietungsabfolge kontrolliert wird. Bei dem eingesetzten Multiple-Choice Test handelt es sich, und das ist der "Pfiff" der Untersuchung, um eine isomorphe Variante des Lückendiktats: Mit beiden Methoden wird die Beherrschung der Rechtschreibung anhand der gleichen Wörter überprüft. Dies bedeutet, dass die beiden diagnostischen Verfahren inhaltlich identisch sind und sich nur hinsichtlich des Itemformats unterscheiden. Beim parallelen Einsatz der Verfahren können so Effekte der Darbietungsform überprüft werden. Als zentraler Befund der Diplomarbeit kann festgehalten werden, dass die Formatvariation sich nicht wesentlich auf die Kriteriums- und Konstruktvalidität auswirkt (operationalisiert über die Beziehungen zu Schulnoten sowie zu verschiedenen Intelligenzfacetten).

Lochner, Katharina

Führungs-Charisma bei Jugendlichen und jungen Erwachsenen

08. Juli 2005

Neben der fachlichen Kompetenz wird der Persönlichkeit eine zunehmend wichtigere Rolle für den beruflichen Erfolg zugeschrieben. Die Diplomarbeit thematisiert diese aktuelle Entwicklung, indem sie diejenigen Persönlichkeitsmerkmale untersucht, die eine gute Führungskraft auszeichnen und sich der Frage widmet, ob solche Persönlichkeitsmerkmale bereits bei Jugendlichen und jungen Erwachsenen diagnostizierbar sind. Theoretischer Ausgangspunkt der Arbeit ist der (behaviorale) Ansatz der charismatischen Führung, insbesondere die erweiterte Perspektive des sogenannten Conger und Kanungo Modells. Insgesamt werden die Daten von 561 Personen aus drei Untersuchungen analysiert. Zunächst wird geprüft, ob das Modell und seine Strukturannahmen auch bei - in diesem Zusammenhang bislang nicht untersuchten - Jugendlichen und jungen Erwachsen Geltung besitzt. Dies ist der Fall. In einem zweiten Schritt wird dann geklärt, ob in dieser Stichprobe ein spezifisch auf Jugendliche und junge Erwachsene zugeschnittener Fragebogen besser zur Erfassung von Führungs-Charisma geeignet ist als ein altersunspezifisch formulierter Fragebogen. Dies ist nicht der Fall. Schließlich geht es darum, mit Hilfe von Referenzinstrumenten der (berufsbezogenen) Persönlichkeitsforschung Korrelate von Aspekten des Führungs-Charismas aufzuzeigen. Hierzu wurden das Inventar zur berufsbezogenen Persönlichkeitsbeschreibung (BIP), das Leistungsmotivationsinventar (LMI) sowie die revidierte Fassung des NEO-Persönlichkeitsinventars (NEO-PI-R) eingesetzt.

Diese Diplomarbeit wurde im Vdm Verlag publiziert:

Lochner, K. (2008). Führungs-Charisma bei jungen Erwachsenen. 104 Seiten. Verlag: Vdm Verlag. 49.- Euro.
ISBN Nummer: 9783836456845; ISBN-10: 3836456842



Oppe, Maike

Arbeitsproben und Leistungstests in der Personalauswahl von Call Center Agents

24. Mai 2004

Gegenstand der Diplomarbeit ist die Evaluation dreier Arbeitsproben (computerbasierter Trainierbarkeitstest, Rollenspiel, Gruppendiskussion) sowie dreier Leistungstests (SPM, Subtest "Beziehungen erschließen", Cognitrone) die im Rahmen eines Personalauswahlverfahrens von Call Center Agents bei einer deutschen Direktbank appliziert wurden. Der Fokus der Arbeit liegt in der Bestimmung der prädiktiven Validität der verschiedenen Verfahrensarten, wobei speziell der Frage nachgegangen wird, ob sich im vorliegenden Untersuchungskontext die Arbeitsproben als Vertreter des Sample-Ansatzes oder die Leistungstests als Repräsentanten des Sign-Ansatzes in der Vorhersagevalidität bezogen auf Kriterien des beruflichen Erfolgs als überlegen erweisen. Der Feldstudie standen Prädiktordaten von 302 Bewerbern zur Verfügung, welche das Assessment Center der Direktbank durchliefen. Für die Kriteriumsvalidierung waren sowohl eine Leistungsbeurteilung (N=124) als auch Vertriebsergebnisse (N=102) der Telefonagenten erhältlich.  Lediglich die SPM und die Gruppendiskussion erwiesen sich mit spezifischen Einschränkungen als prognostisch valide. Ansonsten erzielten  weder die einzelnen Personalauswahlbausteine noch verschiedene Aggregationen der Verfahren einen bedeutsamen Zusammenhang mit den Kriterien. In der Konsequenz blieb die Frage nach der Überlegenheit einer der beiden Verfahrensgruppen unbeantwortet. Abschließend diskutiert die Arbeit verschiedene Möglichkeiten, die für die mangelnde prognostische Validität verantwortlich sein könnten. Aus der Diskussion werden einerseits Modifikationsvorschläge konkret bezogen auf die Verfahren abgeleitet und andererseits Ansatzpunkte für die weitere Forschung im eignungsdiagnostischen Kontext von Call Centern aufgezeigt.

Schröder, Philipp

Kriterienbezogene Evaluation des Reha-Assessments des Berufsförderungswerk Oberhausen

27. Juni 2011

Herr Schröder prüfte im Rahmen seiner Diplomarbeit die Aussagekraft des WIT-2 im Rahmen des Reha-Assessments des Berufsförderungswerks Oberhausen. Als Kriterien lagen die Abschlussnote der Umschulung (N = 36) sowie der Erfolg in der beruflichen Qualifizierungs¬Maßnahme (bestanden vs. nicht-bestanden) vor (N = 71) vor.

Die eingesetzten WIT-2 Module korrelieren zwischen r= .31 und .71 substantiell mit dem ebenfalls eingesetzten Figure Reasoning Test (FRT) (N=1921).

Anhand der Kriterien konnte die Validität des WIT-2 aufgezeigt werden. Das Modul sprachliches Denken korreliert zu r=.39 mit der Abschlussnote (N=36). (Während der FRT nur in Höhe von r=.22 mit dieser Abschlussnote korreliert). Auch bezogen auf das Kriterium „Bestehen der Qualifizierungsmaßnahme“ ist der Zusammenhang des FRT (r=.09) mit dem Kriterium nominell kleiner als der entsprechende Zusammenhang aller genutzten Module des Wilde-Intelligenz-Test 2 (WIT-2 sprachliches Denken und „Kriterium „Bestehen der Qualifizierungsmaßnahme: r=.38).

Schröder, P. (2011). Kriterienbezogene Evaluation des Reha-Assessments des Berufsförderungswerk Oberhausen. Diplomarbeit. Düsseldorf: Heinrich Heine Universität Düsseldorf.

Schulze Versmar, Karoline

Auswirkungen der Transparenz eines Assessment Centers auf die Leistung sowie auf das Urteil der Bewerber über die soziale Akzeptanz des Verfahrens

30. März 2007

In der Diplomarbeit wird die Auswirkungen zweier Formen der Transparenz eines Assessment Centers (AC) auf die Leistung der Bewerber einerseits sowie auf deren Urteil über die soziale Akzeptanz des Verfahrens anderseits unter realen Auswahlbedingungen untersucht. Neben der transparenten Gestaltung des AC durch die Offenlegung der in den Übungen beurteilten Kriterien, wird als zweite Form der Transparenz die Fähigkeit der Bewerber angesehen, die relevanten Anforderungen des Verfahrens richtig zu erkennen. Diese kognitive Fähigkeit wird als "ability to identify criteria" (ATIC) bezeichnet (König, Melchers, Kleinmann, Richter & Klehe, 2006a, b). Für die Umsetzung der Studie "im Feld" konnte ein großes Unternehmen gewonnen werden, welches jährlich zahlreiche AC-Verfahren durchführt. In der ersten Studie mit 101 Bewerbern fand eine experimentelle Manipulation der Verfahrensgestaltung statt. Die varianzanalytischen Auswertungen zeigten eine positive Auswirkung der transparenten Gestaltung auf die Wahrnehmung der Augenscheinvalidität sowie tendenziell auf das Gesamtakzeptanzurteil über das Verfahren. Darüber hinaus konnte gezeigt werden, dass die Transparenz nicht zu einer Leistungsverbesserung führt, womit ein zentraler Einwand vieler Praktiker gegen die transparente Gestaltung von Auswahlverfahren entkräftigt wird. Die soziale Akzeptanz wurde über den Akzept!-AC von Kersting (2003) erfasst. In der zweiten Studie mit weiteren 101 Bewerbern zeigten sich wider Erwarten keine substantiellen Zusammenhänge der Ausprägung der ATIC-Fähigkeit mit der Leistung der Bewerber im AC. Die varianzanalytischen Auswertungen zeigten aber, dass die Selbsteinschätzung der ATIC-Fähigkeit mit dem Akzeptanzurteil (insbesondere mit der Wahrnehmung der Kontrollierbarkeit des AC) kovariierte. Schließlich konnten in beiden Studien Einflüsse der eigenen Leistung sowie der subjektiven Einschätzung der Fakingmöglichkeit im AC auf das Akzeptanzurteil der Bewerber über das AC-Verfahren nachgewiesen werden. (english abstract)

Seidel, Kristin

Büroarbeitsverhalten. Theoretische und empirische Exploration in Verbindung mit der Konstruktion und Evaluation eines eignungs­dia­gnostischen Tests

25. Februar 2003

Gegenstand der Arbeit ist die theoretische und empirische Exploration des Konzepts Büro­arbeitsverhalten (BAV) in Verbindung mit der Konstruktion und Evaluation eines eignungsdiagnostischen Tests. Der auf einer literaturbasierten Anforderungsanalyse be­gründete Test bedient sich sowohl dem konstruktorientierten als auch dem simulationsorientierten Ansatz. Als theoretische Grundlage dient das Berliner Intelligenstrukturmodell (BIS). Zwei nach rationalen Prinzipien entwickelte Testaufgaben der verbalen und numerischen Inhaltsklasse streben hinsichtlich der Ope­ra­tions­klassen Bearbeitungsgeschwindigkeit und Verarbeitungskapazität eine kombi­nierte Messung an.

Die neu entwickelten BAV-Testaufgaben wurden an zwei Stichproben mit N=245 sowie N=133 Bewerbern im Rahmen von eignungsdiagnostischen Untersuchungen durch die Deutsche Gesellschaft für Personalwesen (DGP) erprobt. Zur Evaluation des Tests wurden im Rahmen der Überprüfungen auf die Güte der Umsetzung des Kon­struktionsrationals Itemanalysen durchgeführt, Kennwerte zu Speed- und Power sowie zur Geschwindigkeit und Genauigkeit berechnet. Erste Erkenntnisse über die Art der entwickelten Items sowie die Testmerkmale weisen auf eine Passung mit den a priori aufgestellten Konstruktionsprinzipien hin. Darüber hinaus dienten empirische Analysen dazu, Anhaltspunkte über die Grundlagen des Konzepts BAV zu erlangen. Dazu wurde BAV zu Dimensionen des BIS, die durch einen zusätzliche eingesetzten con­fidential Test der DGP operationalisiert wurden, in Beziehung gesetzt. Die Er­geb­nisse faktoren- und regressionsanalytischer Techniken deuten darauf hin, dass mit den BAV-Aufgaben systematische Varianz erfasst werden kann, die nicht vollständig durch die Dimensionen des BIS erklärbar ist. Einen weiteren Beitrag zur Konstruktaufklärung leisten subgruppenspezifische Befunde zu Alter, Geschlecht und kogni­tiver Leistungsfähigkeit. Weitere Untersuchungen sind notwendig, um festzustellen, ob es sich bei BAV um eine neue Dimension intelligenten Verhaltens handelt und ob diese einen inkrementellen Beitrag zur Prognose von Ausbildungs- und Berufs­erfolg in Büroberufen leisten kann.

Die Diplomarbeit wurde mit dem Nachwuchsförderpreis des Arbeitskreis Assessment Center e.V. ausgezeichnet.

Des weiteren wurde diese Diplomarbeit im Vdm Verlag publiziert:

Seidel, Kristin. (2006). Arbeitseffizienz im Bürokontext. Neue Wege der Diagnostik. 180 Seiten. Verlag: Vdm Verlag. 68.- Euro.
ISBN: 3836456648 EAN: 9783836456647



Spriestersbach, Andrea

Das 360°-Feedback als Instrument der Führungskräfte-Entwicklung: Evaluation der Effektivität und ihrer Einflussfaktoren

30. September 2007

Ein wesentliches Element der Personalentwicklung in Organisationen ist das Feedback für Mitarbeiter. Seit einigen Jahren tragen im Rahmen des "360°-Feedbacks" zusätzlich zur traditionellen Beurteilung durch den Vorgesetzten auch Kollegen, Mitarbeiter und zuweilen auch externe Kooperationspartner oder Kunden zum Feedback bei. Darüber hinaus soll der Mitarbeiter sich selbst einschätzen. Diese Erweiterung bestehender Feedback-Methoden erfreut sich aktuell einer großen Beliebtheit, obwohl bisher nur wenige Forschungsergebnisse zur Effektivität von 360°-Feedback vorliegen. Die Diplomarbeit verfolgt das Ziel, aus differentiell-psychologischer Sicht zu untersuchen, unter welchen Bedingungen das 360°-Grad-Feedback zur intendierten Leistungssteigerung beiträgt. Dazu wurden in Kooperation mit einem Unternehmen zwei Studien durchgeführt. Studie 1 mit 86 Teilnehmer stellt eine Längsschnittsuntersuchung an einer Stichprobe von Feedbacknehmern dar, die an zwei aufeinander folgenden Zeitpunkten (T1 und T2) ein Feedback von Vorgesetzten, Kollegen und Mitarbeitern erhalten haben (T1-T2 Vergleich). Studie 2 umfasst eine Experimentalgruppe im Umfang von 80 Personen, die 360°-Feedback erhalten hat, sowie eine Kontrollgruppe (76 Personen), die kein 360°-Feedback erhalten hat. Sowohl die Teilnehmer der Experimental- als auch die der Kontrollgruppe der Studie 2 nahmen an einer zusätzlichen Befragung teil und bearbeiteten u. a. einen Fragebogen zum Fünf Faktoren Modell.

Insgesamt blieb in beiden Studien ein Nachweis der Effektivität von 360°-Feedback aus. Interessant sind aber die differentiellen Effekte für Über- und Unterschätzer. Während sich für die Feedbacknehmer, die sich selbst im Vergleich zur Fremdbeurteilung zum Zeitpunkt T1 negativer beurteilt haben, keine signifikanten Leistungsveränderungen ergaben, konnten für Feedbacknehmer, die sich zum Zeitpunkt T1 im Vergleich zur Fremdbeurteilung positiver beurteilt haben, zum Zeitpunkt T2 signifikante Verbesserungen der Vorgesetzten- und Mitarbeiterbeurteilungen nachgewiesen werden. Darüber hinaus zeigte sich, dass Feedbacknehmer, die sich überschätzt haben, verärgert auf das Feedback reagieren. Vergleichbare Befunde zeigten sich für die Ablehnung bzw. Aufgeschlossenheit gegenüber dem 360°-Feedback, wobei neurotische Feedbacknehmer ablehnender auf 360°-Feedback reagieren als emotional stabile Personen. Die Einschätzung der Wichtigkeit des Feedbacks durch die Feedbacknehmer variierte in Abhängigkeit von der Feedbackgeber-Gruppe: Das Mitarbeiterfeedback wurde als bedeutend wichtiger eingestuft, als das Feedback von Vorgesetzten und Kollegen. (english abstract)

Steinmayr, Ricarda

Die soziale Akzeptanz von Personalauswahlverfahren.

Untersuchung zum Berliner Intelligenzstruktur-Test der Deutschen Gesellschaft für Personalwesen (BIS-r-DGP) und den Skalen zur Service- und Kundenorientierung (SKASUK)

29. April 2002

Zentrale Thematik der vorliegenden Arbeit ist die Untersuchung der sozialen Akzeptanz des Berliner Intelligenz-Struktur Testes der Deutschen Gesellschaft für Personalwesen (BIS-r-DGP) (Kersting & Beauducel, 2001) und der Skalen zur Service- und Kundenorientierung (Sonnenberg, 2001). Konkret handelte es sich um die Beurteilung der beiden Aspekte Augenscheinvalidität und Kontrollierbarkeit / Messqualität der beiden Verfahren. Die soziale Akzeptanzeinschätzung durch die Untersuchungsteilnehmer lag für beide Verfahren im positiven Bereich. Die Untersuchung wurde von der DGP durchgeführt und umfasste eine Untersuchungsgruppe von N = 407 Personen. Die Untersuchungsteilnehmer bearbeiteten zuerst die beiden Personalauswahlverfahren, um auf Basis ihrer Testerfahrung die soziale Akzeptanz der Verfahren einzuschätzen. Zusätzlich zu den Akzeptanzurteilen über die beiden Verfahren wurden verschiedene Personvariablen erhoben, deren Einfluss auf die Beurteilung der beiden Testverfahren untersucht wurde. Es zeigte sich, dass die Beurteilung beider Verfahren von bestimmten Merkmalen der Untersuchungsteilnehmer beeinflusst wurde. Auf Grundlage dieser Erkenntnisse wurden Überlegungen zur Relevanz der sozialen Akzeptanz bei der Beurteilung von Testverfahren angestellt.

Des Weiteren wurde in der vorliegenden Arbeit ein Überblick zum Stand der Forschung bezüglich des Themengebietes der sozialen Akzeptanz präsentiert. Die Relevanz des Konstruktes für die Gestaltung eignungsdiagnostischer Untersuchungen konnte durch vielfältige Studien nachgewiesen werden. Ein weiterer Inhalt der Arbeit war die Analyse des in der Untersuchung genutzten Fragebogens zur Erfassung der sozialen Akzeptanz, der Akzeptanzfragebogen AKZ von Kersting (1998). Die Analyse ergab, dass es sich um ein über weite Strecken psychometrisch gutes Instrument handelt. Einzig die interne Konsistenzen der Skalen zur Kontrollierbarkeit / Messqualität waren nicht zufriedenstellend. Es werden Vorschläge zur Verbesserung des Messinstrumentes gemacht.

Diese Diplomarbeit wurde im Vdm Verlag publiziert:

Steinmayr, R. (2006). Personalauswahlverfahren. Prozess und soziale Akzeptanz aus Sicht der Bewerber. 166 Seiten. Verlag: Vdm Verlag. 59.- Euro.
ISBN-10: 3865504744. ISBN-13: 978-3865504746.
-> Bestellen bei Amazon.de