Evaluation

Version vom 20. November 2019, 17:36 Uhr von Staatslexikon (Diskussion | Beiträge) (Evaluation)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

E. verweist allg. auf eine Leistung des menschlichen Erfahrens zur reflexiven Einschätzung oder Bewertung von Menschen, Dingen, Situationen und Handlungen. E. bewertet etwas, indem es danach fragt, ob es einen intendierten Zweck erfüllt. In ihrer jüngeren, aus dem Englischen übernommenen Bedeutung bezeichnet professionelle E. einen sozialen Prozess der systematischen Sammlung und nachvollziehbaren Bewertung eines Produkts, eines Projektes, einer Person oder Personengruppe, einer Maßnahme, eines Programmes oder anderer Aktivitäten. E. hat einen klar definierten Gegenstand und wird von Experten anhand ausdrücklicher Kriterien und auf der Grundlage empirisch erhobener Daten durchgeführt, deren Auswertung bestimmten Regeln folgt. Zur Systematisierung und methodischen Legitimation hat sich eine eigenständige E.s-Forschung ausgebildet, bei der vorwiegend sozialwissenschaftliche Forschungsmethoden und -techniken zur Bewertung eingesetzt werden.

1. Entwicklung der Evaluation

Wert und Bewertung sind klassische Kategorien der Geisteswissenschaften und Sozialwissenschaften. Die heutige Verwendung des Begriffes der E., die im Französischen einsetzt, wird aber vom angelsächsischen Sprachraum bestimmt, wo er ab ca. 1900 stetig an Bedeutung gewinnt und nach 1980 seinen Höhepunkt erreicht. Im deutschsprachigen Raum wird E. vor 1960 wenig verwendet; zwischen 1960 und 1980 verfünffacht sich die Zahl der Publikationen und steigt seither fast exponentiell an. E. ist untrennbar mit der jüngeren Geschichte staatlicher Reformprogramme und Steuerungsversuche verbunden, um einer kritischen Öffentlichkeit oder anderen formalen Organisationen gegenüber Rechenschaft über Wirksamkeit, Qualität und Effizienz abzugeben. Unter Rückgriff auf Methoden aus der Psychologie, Soziologie, Politikwissenschaft und Marktforschung setzt die E. in den USA im Bildungsbereich ein. Ihre Entwicklung kann in verschiedene Phasen unterschieden werden: Die Ausbildung des Taylorismus (nach Frederick Winslow Taylor) und der psychologischen Messtechnik kann als eine Vorphase der E. angesehen werden. Ihren eigentlichen Beginn nimmt sie in den 1930er Jahren mit Ralph Tyler, der als „Vater der E.“ gilt. Er entwickelte Messverfahren für die Akkreditierung von Lernleistungen. In der zweiten Phase steht die Beschreibung stärker im Vordergrund. Im Rahmen etwa der „Eight Year Study“ wird nun auch überprüft, ob und wie die gesetzten Ziele erreicht werden. Die dritte Phase betont die Beurteilung: Nun treten zum Messen und Beschreiben auch häufig experimentell untersuchte Kriterien der Bewertung von Leistungsfähigkeit hinzu. Die vierte Phase folgt einer scharfen Kritik am Nutzen des E.s-Wissens in den 1980er Jahren; diese führt zur Umstellung auf stärker betriebswirtschaftlich orientierte Methoden wie das New Public Management und das Qualitätsmanagement, die auf den breiten Instrumental Use zielen. In der jüngsten Phase werden schließlich demokratische Prozesse verstärkt und, etwa bei der „Empowerment E.“ (Fettermann 1994), die Perspektiven der Beteiligten zunehmend auch mithilfe qualitativer, responsiver Verfahren einbezogen und auf Aktivitäten wie Qualitätssicherung, Qualitätszirkel sowie die Ermittlung von Benchmarks zum Leistungsvergleich erweitert. In Deutschland setzt die E. mit der Planungseuphorie und der Curriculums-E. ab 1960 ein und weitet sich auf große Bereiche der öffentlichen, aber auch privaten Dienstleistungen aus, wie etwa im Hochschulsystem, im Bildungssystem, in der Umweltpolitik und bei therapeutischen Maßnahmen. In jüngerer Zeit findet sie sich auch etwa in Form des Qualitätsmanagements im ökonomischen Bereich. Folgt sie in den 1970er Jahren einem kritischen Impuls, so folgt sie heute zunehmend der amerikanischen wirkungsorientierten Entwicklung.

2. Institutionalisierung der Evaluation

Die Systematisierung der E. wird zunächst in den USA vollzogen, sie gewinnt dann im Rahmen transnationaler Vergleichsstudien (PISA) eine transnationale Bedeutung. In den USA ist die E. bereits eine eigenständige universitäre Disziplin. Zwischenzeitlich gibt es über 20 nationale und internationale E.s-Gesellschaften, so auch in Deutschland (DeGEval), Österreich und der Schweiz (SEVAL); international gibt es auf E. spezialisierte Institutionen in zahlreichen anderen Ländern sowie in transnationalen Einrichtungen, wie etwa der UNO, der EU, der OECD oder dem IWF. Neben dem Ausbau verschiedenster spezialisierte Forschungsabteilungen weisen auf E. spezialisierte Studiengänge sowie Handbücher zur E. allg. auf eine zunehmende Professionalisierung hin.

3. Evaluationsforschung

E.s-Forschung bezeichnet die „explizite Verwendung wissenschaftlicher Forschungsmethoden und Techniken für den Zweck der Durchführung einer Bewertung“ (Wottawa/Thierau 1998: 13) und „betont die Möglichkeit des Beweises anstelle der reinen Behauptung bzgl. des Wertes und Nutzens einer bestimmen sozialen Aktivität“ (Wottawa/Thierau 1998: 13). Die E.s-Forschung widmet sich nicht nur der Frage, was, wie und wer evaluiert wird, sondern zielt auch auf die Frage nach der Bewertung der E.s-Verfahren selbst. Die E.s-Forschung weist einen „dualen“ Charakter auf, da sie zugleich wertend und analytisch beschreibend sein soll. Von der wissenschaftlichen Forschung unterscheidet sie sich durch häufig implizite Theorieanlagen, begrenzte Fragestellungen, hohen Zeitdruck der Durchführung, Einfluss von Machtinteressen, begrenzte Publikationsmöglichkeiten und ihren intervenierenden Charakter. Sie folgt häufig einem „rationalistischen Ansatz […]“ (Stamm 2003: 61), der hypothesenbildend verfährt und standardisierte Methoden der empirischen Sozialforschung (z. B. Fragebögen mit quantitativer Auswertung) einsetzt, aber auch klinische Studien und Experimente. In jüngerer Zeit breitet sich vermehrt eine qualitative E.s-Forschung aus, in der auch explorative Erhebungen durchgeführt und interpretative Methoden eingesetzt werden. Diese Forschung geht einher mit der Ausbreitung des „konstruktivistische[n]“ Paradigmas, das von der Konstruiertheit der Bewertung ausgeht (Stamm 2003: 63). Dadurch ergibt sich eine Verbindung mit stärker wissenssoziologisch ausgerichteten Untersuchungen, die die E. (und Valuation) als ein soziales Phänomen und als soziale Konstruktion(Konstruktivismus) ansehen.

4. Formen der Evaluation

Helmut Kromrey unterschiedet drei verschiedene Grundformen der E., die sich wiederum in verschiedene Einzelmodelle unterscheiden lassen: Die methodenorientierte E., wie sie beispielsweise als Objectives-Oriented E. schon von R. Tyler begründet wurde, die nutzerorientierte E., wie etwa die Utilization-Focused E. und die bewertungsorientierte E., wie etwa das Valuing. E.en unterscheiden sich auch hinsichtlich der Skala ihres Gegenstandes. Sie können sich als Mikro-E.en auf einzelne Handlungen (Handeln, Handlung), Individuen, Gruppen (z. B. Schulklassen) oder als Makro-E.en auf Hochschulen, Hochschulsysteme oder ganze Bildungssysteme (z. B. PISA) beziehen. Auch zeitlich variiert die E.: Es kann sich um eine rückblickende Bewertung von etwas Vergangenem handeln, sie kann einen gleichzeitig zur E. ablaufenden Prozess begleiten oder eine prospektive Bewertung vornehmen. Ihre Organisationsform kann intern, extern oder eine Selbst-E. sein. Ihr systematischer Charakter zeichnet sich dadurch aus, dass empirische Daten erhoben werden, auf die verschiedene Analyseperspektiven (Kontext, Input, Prozess) angelegt und die mithilfe der genannten Methoden anhand vereinbarter und ausdrücklicher Gütekriterien bewertet werden. Dazu können einmal die Kriterien der empirischen Sozialwissenschaft gehören, wie Validität, Reliabilität und Objektivität, aber auch praktische Kriterien, wie etwa Glaubwürdigkeit, Übertragbarkeit, Verlässlichkeit und Bestätigbarkeit, Wirksamkeit, Effizienz, Nutzen, Relevanz, Kosten, Qualität, Akzeptanz, (Neben-)Wirkungen und Folgen. In jüngerer Zeit setzen sich auch Kriterien wie Transparenz, Intervention und Kommunikation durch. E.en können die Form von Leistungsindikatoren, Rankings oder Akkreditierungssystemen annehmen. Bei der E. können verschiedene Rollenbilder leitend sein, wie die E. als Faktensammeln, als Begutachtung, als Moderation oder als Entwicklungshilfe. Dabei stehen verschiedene Handlungsstrategien im Vordergrund, die von der neutralen Beobachtung über die Begleitung im E.s-Verlauf bis hin zur dabei angestrebten Veränderung reichen können. Der E. werden unterschiedliche manifeste Funktionen zugeschrieben, wie Legitimation, Kontrolle, Überprüfung oder Entwicklung; sie ist aber häufig auch mit latenten Funktionen verbunden, wie Beschönigung, Rechtfertigung, Weißwaschen, Untergrabung, Aufschiebung, Imponieren, Verzerrung.

5. Bewertung der Evaluation

Sofern sie sich auf öffentliche Maßnahmen bezieht, steht E. im Zusammenhang mit dem Übergang vom patriarchal sorgenden Wohlfahrtsstaat zum aktivierenden schlanken Staat und der Ausbildung einer zivilgesellschaftlichen Kultur (Zivilgesellschaft), die auch mit Begriffen wie Monitoring, Auditing oder Aktivierung bezeichnet wird. Sie wird als Beitrag zur Durchsetzung von Werten wie Rationalität, Effektivität und Effizienz angesehen. Darauf zielen aber auch kritische Stimmen. So sieht Christine Schwarz die „Evaluation als modernes Ritual“ an (Schwarz 2006). Thomas Höhne bringt sie mit der „Durchsetzung neoliberaler Programmatiken und Praktiken“ (Höhne 2006: 204) in Verbindung, wie sie im New Public Management, Total Quality Management und Governance-Modellen (Governance) zum Ausdruck kommt; sie folge weniger einer funktionalen Notwendigkeit, sondern diene der Durchsetzung eines globalen Rationalitätsmodells. Am Beispiel der E. in der Wissenschaft betont Richard Münch, dass E. nicht zur Gleichheit beitrage, sondern bestehende Statushierarchien lediglich verändere bzw. neue Statushierarchien erzeuge.