TEMA 1
PARADIGMAS Y MODELOS DE LA EVALUACIÓN EDUCATIVA
1. Introducción
2. Paradigma cualitativo y paradigma cuantitativo en educación: repercusiones en la evaluación educativa.
3. Modelos y enfoques de la evaluación.
4. Diseños de evaluación educativa.
1.1. INTRODUCCIÓN
La evaluación es un concepto de gran relevancia en el mundo educativo. Muchas son las páginas que se han escrito o se han dicho para tratar este tema. Afortunadamente, en este momento nos encontramos con muchísimas referencias válidas, sin embargo también es preciso advertir que hemos de ser críticos y consecuentes ante tanta información.
Son muchos los subconceptos derivados del primero y también muy variados los enfoques bajo los cuales la evaluación puede ser estudiada y aplicada. Los trabajos que podemos encontrar en las obras de Tenbrink, Gimeno y Pérez, Stufflebeam, Shinkfield, Tyler, Escriven, Rippey, Stake u otros a los que a lo largo de estas páginas hagamos referencia, nos ofrecen unas perspectivas no siempre coincidentes, si bien, en muchos casos, pueden considerarse complementarias.
Así podríamos hablar de paradigmas cualitativos y cuantitativos en evaluación, evaluación por objetivos, evaluación sin referencia a objetivos, evaluación por norma o evaluación según criterios... evaluación inicial, continua y final; evaluación diagnóstica, formativa y sumativa, etc.
Si el campo conceptual se nos presenta bastante abigarrado, todo aquello referido a técnicas e instrumentos de evaluación puede parecernos o presentarse igualmente amplio, heterogéneo, confuso e inconexo.
En el plano educativo, los temas son aquellos que afectan a los alumnos, a los profesores, a los programas, a la organización, a los procesos de enseñanza, a los resultados... y a la propia evaluación, porque también es necesario evaluarla.
CONCEPTO DE EVALUACIÓN.
Evaluar es asignar un valor a algo, juzgar. De entre las muchas definiciones que existen de evaluación, vamos a resaltar la que formula Tenbrink (1981, pág.19):
«Evaluación es el proceso de obtención de información y de su uso para formular juicios que a su vez se utilizarán para tomar decisiones».
Las decisiones educativas se toman sobre la base de unos juicios, y los juicios, a su vez, se emiten sobre la base de una información. La interdependencia de estos tres conceptos (decisiones, juicios, información) define esencialmente la evaluación.
Cuando evaluamos estamos realizando tanto una medición (obtención de información) como una valoración (emisión de un juicio). Una y otra dimensión cumplen funciones diferentes en el proceso total de evaluación. A través de la medición constatamos el estado actual del objeto o situación que queremos evaluar. A través de la valoración realizamos una comparación entre los datos obtenidos en la medición que reflejan el «cómo es» el aspecto a evaluar y unos determinados parámetros de referencia que reflejan bien el «cómo era» o el «cómo debería ser» dicho aspecto. Una y otra dimensión son necesarias para que exista una buena evaluación. Sin la valoración quedaría reducida a una simple medida descontextualizada. Sin medición, la sola valoración da pie a una opinión subjetiva, no a una evaluación.
Pero, el objetivo último, la razón de ser del juicio es la de tomar decisiones que mejoren el proceso de enseñanza-aprendizaje.
Para concluir, diremos esquemáticamente que esta forma de entender la evaluación implica cuatro tareas básicas:
· Recoger información sobre las situaciones a evaluar. Una pretensión fundamental de la evaluación es conseguir informaciones pertinentes para conocer la eficacia de la acción. Y la eficacia de la acción no depende solamente del alumno/a sino de un cúmulo de componentes de variada naturaleza: la adecuación de las pretensiones a la capacidad y actitudes de los niños, el ritmo de aprendizaje, los medios de que se dispone, los momentos elegidos, la relación del profesor con los niños, el ambiente de aprendizaje...
· Realizar juicios de valor apoyados en los datos obtenidos y en las metas previamente seleccionadas. La recogida de informaciones, la obtención de datos de calidad extraídos de la realidad, permitirá efectuar una evaluación de la situación y del proceso que facilitará al profesor la comprensión de lo que sucede en el aula.
· Orientar y reconducir la acción didáctica y los procesos de aprendizaje individuales. De esa evaluación no sólo surgirá una atinada y precisa comprensión sino una intervención más efectiva. Por eso la evaluación es una fuente de mejora de la práctica: reconduciendo el hecho educativo, proponiendo alternativas a las deficiencias encontradas, adaptando los procesos educativos a las necesidades de los alumnos...
NATURALEZA DE LA EVALUACIÓN EDUCATIVA.
Desde la perspectiva de las Ciencias de la Educación, la evaluación es uno de los elementos fundamentales (básicos) del currículum. Es impensable cualquier tipo de planificación yo puesta en práctica de algún programa educativo, que no incluya un diseño de cuáles deben ser los aspectos a evaluar, de cuáles serán los medios y recursos que se emplearán en la evaluación y de cuándo o a través de qué fases se llevará a cabo la misma.
Siendo la evaluación un elemento básico en cualquier tipo de actividad educativa, es preciso señalar que ésta se encuentra sometida a la misma polémica sobre su estatus científico a la que se haya sometida la propia didáctica (entendida ésta como la ciencia de la enseñanza y el aprendizaje).
En la actualidad existen, en los estudios sobre la didáctica, dos posiciones, en cierta medida encontradas, que parten de presupuestos teóricos distintos y que, de esta manera, tienen puntos de vista distintos acerca de cómo deben resolverse los problemas que se plantean en los contextos educativos.
De forma resumida, podemos hablar de la existencia de dos corrientes o paradigmas que se conocen con el nombre de paradigma cuantitativo (formado por aquellos investigadores que consideran que la didáctica debe ser una ciencia hipotético deductiva, que base la elaboración de sus teorías y la resolución de los problemas a los que se enfrenta, en el método experimental) y paradigma cualitativo (formado por aquellos científicos que piensan que el método experimental no ha sido capaz hasta la fecha de resolver los problemas que se plantea la educación, fundamentalmente debido a la singularidad de los mismos, lo que impide la formulación de leyes universalmente válidas; lo cual invita a la utilización alternativa de métodos cualitativos que permitan la interpretación y la comprensión de lo que ocurre en el contexto singular en el que surgen los problemas).
1.2. PARADIGMA CUANTITATIVO Y PARADIGMA CUALITATIVO EN EDUCACIÓN: REPERCUSIONES EN LA EVALUACIÓN EDUCATIVA.
1.2.1. EL PARADIGMA CUANTITATIVO
Como señala Casanova (1992), en principio, cabría preguntarse a qué nos referimos cuando empleamos el término paradigma. Tal y como lo definió Kuhn en 1962, "un paradigma es un conjunto de suposiciones interrelacionadas respecto al mundo social, que proporciona un marco filosófico para el estudio organizado de este mundo". Por tanto, es un marco de referencia para las generalizaciones, los valores, las creencias, normas y actitudes ante la vida y el conocimiento de cada individuo y de los diferentes grupos sociales.
A lo largo de la historia se han ido configurando dos posiciones filosóficas ante la ciencia, cuyo enfrentamiento ha tenido, y para algunos tiene todavía, un carácter paradigmático. Estas concepciones de la ciencia han venido adoptando distintas denominaciones: idealismo/realismo, neopositivismo/relativismo, etc., aunque en el campo de las ciencias humanas y sociales se ha extendido el uso de los términos paradigma cuantitativo/cualitativo, quizá por la identificación con los procedimientos e instrumentos utilizados.
Para adentrarnos en las bases teóricas epistemológicas que sustentan estas dos líneas de pensamiento, es necesario que comencemos señalando lo que se entiende por ciencia.
Los partidarios de la metodología experimental, cuantitativa, definen la ciencia como "el conocimiento generado en una determinada parcela de la realidad (biología, física, química, etc.) siempre que se haya generado dicho conocimiento con la aplicación del método experimental o hipotético-deductivo".
Desde una perspectiva estrictamente cientifista se podría señalar que la única verdad que existe es la generada por la ciencia positiva.
El método experimental se refiere a cómo obtener información científica mediante la realización de experimentos. Todo método consiste en una serie de reglas. En el método experimental, las reglas se refieren a cómo hay que realizar los experimentos para que sus resultados sean fiables. A modo de síntesis puede señalarse que en todo experimento se pueden distinguir, a grandes rasgos, cuatro pasos fundamentales: Determinación del problema, creación de las hipótesis, comprobación de las hipótesis y análisis de los resultados con el fin de comprobar si se han generado o no nuevos conocimientos.
El proceso de obtención de nueva información a través del método experimental debe presentar dos cararcterísticas esenciales, a saber: en primer lugar, el experimento su pone crear una situación artificial totalmente controlada, en la que se hace una prueba y se obtienen unos resultados que pueden ser interpretados de manera precisa y objetiva; en segundo lugar, el método experimental pretende detectar relaciones causales entre las variables estudiadas (variable independiente y variable dependiente). Esto último se apoya en la suposición de que si en una situación se mantienen todas las condiciones constantes, menos una (que varía de forma controlada), las consecuencias que se produzcan hay que achacarlas exclusivamente a aquello que se varió. Como síntesis, podemos definir un experimento como una situación controlada, en la que se trata de detectar las relaciones causales entre algunos eventos.
El método experimental/hipotético deductivo pretende la elaboración de teorías científicas mediante la contrastación de hipótesis a través de la realización de experimentos. El esquema que sigue a continuación refleja este procedimiento:
Desde la publicación en el siglo XVI de la obra de Comenio "Didáctica Magna" hasta nuestros días, las Ciencias de la Educación han pretendido buscar leyes universalmente válidas que trataran de dar solución a los problemas generados en los contextos de enseñanza-aprendizaje. De esta manera, la didáctica como ciencia experimental ha pretendido la elaboración de un cuerpo sólido de conocimientos teóricos que permita actuar, como si de un vademécum se tratara, de forma que a cada situación problemática diagnosticada le siguiera un tratamiento preciso y adecuado (a esta forma de proceder se le denomina enfoque tecnológico).
Esta perspectiva conceptual tan restrictiva ha producido lógicamente el desarrollo de presupuestos éticos, epistemológicos y metodológicos coherentes con sus planteamientos. Presupuestos que, agrupados bajo diferentes denominaciones: «modelo experimental», «esquema tecnológico», «enfoque sistémico», «pedagogía por objetivos», «evaluación objetiva», han dominado la investigación y la práctica de la evaluación durante la mayor parte del siglo XX.
Las características que definen este enfoque pueden resumirse, en principio, en los siguientes presupuestos:
- La búsqueda y la creencia en la objetividad de la evaluación. La objetividad en la ciencia y en la evaluación es el resultado de la fiabilidad y de la validez de los instrumentos de la recogida y análisis de los datos.
- Lógicamente, el único procedimiento que puede proporcionar el rigor requerido por este concepto de la objetividad es el método hipotético deductivo establecido en las ciencias naturales y en la tradición de la psicología experimental. La verificación experimental de la hipótesis o la búsqueda de apoyo empírico para las formulaciones teóricas exige el tratamiento estadístico de los datos, por tanto, la cuantificación de las observaciones.
- El investigador que trabaja dentro del paradigma experimental tiene que observar rigurosamente las normas estrictas de la metodología estadística: operacionalización de variables, estratificación y aleatorización de las muestras, construcción de instrumentos de observación objetiva con suficiente grado de validez y fiabilidad, la aplicación de diseños estructurados, la correlación de conjuntos de dimensiones a lo largo de diferentes y generalmente extensas poblaciones...
- El énfasis casi exclusivo en los productos o resultados de la enseñanza. El evaluador mide el éxito docente de manera similar a como un agricultor comprueba la eficiencia de un nuevo fertilizador [...]. La medición de los productos, así como la situación inicial, requiere la operacionalización exhaustiva de las variables y la consideración de los aspectos observables de la conducta del alumno. No cabe duda de que las exigencias que impone la estadística y la medición numérica conduce al olvido intencional de aspectos del aprendizaje y desarrollo del alumno que son también susceptibles de transformación educativa. Aspectos no siempre previstos y frecuentemente imprevisibles.
- Estricto control de las variables intervinientes. El diseño experimental requiere un control riguroso de los factores que intervienen, neutralizando unos y manipulando y observando el efecto de otros. Ello supone el intento de simular en el aula las condiciones del laboratorio. La posibilidad técnica y la bondad ética de tal intento es uno de los puntos más críticos del modelo experimental. En cualquier caso implica la artificialización del medio escolar.
- El diseño estructurado de un proyecto de evaluación requiere la permanencia y estabilidad del currículo durante un período prolongado de tiempo independientemente del cambio de circunstancias que puedan ocurrir durante el período de investigación y evaluación. Es ésta una condición difícilmente eludible de los diseños de investigación pretest-postest. Los estudios de evaluación poseen un carácter longitudinal que impone la primacía de la estabilidad e incluso, en ocasiones, la renuncia a considerar variables "nuevas" no previstas ni tenidas en cuenta en el pretest. Los efectos secundarios o laterales son difícilmente manejables en el diseño pretest-postest.
- El modelo experimental se concentra en la búsqueda de información cuantitativa mediante medios e instrumentos objetivos. El problema de la relevancia y significación de los datos no es el centro de la preocupación evaluadora. Demasiados aspectos, quizás de importancia crítica para analizar un proceso de innovación, son descartados por considerarse subjetivos, anecdóticos e impresionistas. Asimismo, el empleo de extensas muestras de casos que permitan las generalizaciones estadísticas tienden a mostrarse insensible a las perturbaciones locales y efectos poco usuales.
- El modelo de evaluación cuantitativa encaja en una perspectiva teórica que considera la educación como un proceso tecnológico (...). La evaluación cuantitativa debe preocuparse únicamente de comprobar el grado en que se han alcanzado los objetivos previamente establecidos.
Sin embargo, la utilización del enfoque tecnológico, derivado en primera instancia de considerar que el único conocimiento posible es el obtenido a través de metodología experimental, presenta algunos inconvenientes que hacen necesario un replanteamiento de los presupuestos científicos y prácticos que han sustentado hasta ahora la Didáctica como ciencia de la enseñanza-aprendizaje. Algunos de los principales inconvenientes que surgen a la hora de aplicar la metodología experimental para resolver los problemas de la educación son los siguientes:
· El enunciado de leyes universalmente válidas es materialmente imposible: por un lado, porque en la medida en que no hay dos personas iguales nunca los problemas educativos ni los objetivos a conseguir serán iguales; y, por otro lado, porque los contextos educativos en los que los profesores enseñan y los alumnos aprenden son únicos e irrepetibles, lo cual impide la replicación exacta de los experimentos.
· Existe un problema específico en la realidad educativa que la hace radicalmente distinta a la de otras ciencias físicas y naturales. Esta realidad señala que no se puede establecer una relación de causa-efecto entre el hecho de enseñar y el hecho de aprender. No siempre que un profesor enseña el alumno o los alumnos aprenden. Se puede hablar de una relación de dependencia pero no de causa-efecto. Esta particularidad de los procesos de enseñanza y aprendizaje mina los supuestos teóricos del método experimental al imposibilitar el establecimiento de relaciones causales sólidas.
· Quizá la crítica más demoledora, realizada desde los detractores del enfoque tecnológico, sea la que señala que después de casi quinientos años de estudios bajo los presupuestos cientifistas, la didáctica no ha generado un cuerpo sólido de conocimientos que de solución a los problemas educativos, por lo que parece necesario afrontarlos desde otra perspectiva que resulte más fructífera.
· La mayoría de los trabajos realizados con la metodología experimental han sido realizados desde los despachos de la universidad. En la mayor parte de los casos, los problemas que han tratado de resolver estos estudios son problemas ficticios y descontextualizados, problemas, en muchos casos, alejados de las verdaderas necesidades que tienen los docentes y los alumnos.
Por otro lado también hay que señalar que el enfoque tecnológico no sólo genera dificultades en la investigación educativa, sino que también se ha deja sentir en otros aspectos de la práctica evaluadora habitual como son las calificaciones escolares. El enfoque tecnológico, experimental, aboga por la utilización del número como referencia objetiva en las calificaciones escolares. Sin embargo, la utilización indiscriminada de calificaciones numéricas genera algunas dificultades señaladas, entre otros, por Casanova (1997).
Es imposible expresar con una cifra la riqueza de información que se puede tener acerca de la formación de un alumno o alumna en todas las facetas de la personalidad que se van desarrollando durante su proceso educativo.
Señalaremos ahora algunos ejemplos que pretenden ilustrar que la utilización del número en las calificaciones no garantiza la pretendida objetividad que persigue con su uso:
1er Ejemplo: Todos tenemos constancia de que un mismo ejercicio puede obtener calificaciones distintas en función de quién lo haya corregido. Es ya una práctica adoptada habitualmente, que en los exámenes de oposiciones se descarten las puntuaciones que presentan una diferencia mayor de tres puntos. Igualmente, el mismo profesor valora mas o menos un trabajo según el nivel general del grupo -evaluación normativa-, como ya comentamos en su momento.
¿Por qué se producen estas situaciones? Porque si valora únicamente un evaluador, sin referencias externas -criterios- y rigurosas para ello, lo hará siempre:
· En función de sus criterios personales.
· En función del nivel de exigencia que tenga en su programación (lo que piense que un alumno debe dominar en ese curso determinado).
· En función de lo que ese evaluador conozca del tema trabajado.
· En función del nivel del grupo.
· En función de sus circunstancias personales -estado físico, anímico, situación laboral, etc.- en el momento de valorar.
2º Ejemplo: Si llega un alumno nuevo a un grupo y la información que aporta sobre sus aprendizajes es un boletín donde aparece: Lengua y Literatura: 6 (o Bien, es indiferente). Matemáticas: 5 (o Suficiente), etc., el profesor que debe comenzar a trabajar con él no sabe en absoluto qué aspectos del área domina ese alumno y en cuáles necesita reforzar sus aprendizajes. Puede interpretarse que, en función de la programación del profesor precedente, el alumno había alcanzado lo básico para continuar sin graves dificultades. Pero, primeramente, la programación de ese profesor no tiene por qué coincidir con la del actual (más aún con un sistema educativo que acepta la flexibilidad y apertura del currículo y, por lo tanto, diferentes secuenciaciones de objetivos y contenidos); en segundo lugar, el alumno ha alcanzado unos aprendizajes básicos y le quedan por dominar otros tantos (del 5 al 10 hay un amplio margen de aprendizaje), que no se sabe cuáles son; en tercer lugar, en esa evaluación escueta habrán incidido numerosos factores personales -salvo que se nos aclare lo contrario-, según venimos comentando, que no es posible conocer para encuadrar adecuadamente la información que se recibe del alumno. En síntesis: con una calificación no descriptiva, un profesional no conoce la situación de aprendizaje del estudiante evaluado. Debe, por tanto, comenzar por realizar una amplia y profunda evaluación inicial de las diferentes facetas del área, para determinar qué es lo que domina y dónde necesita reforzar y ampliar sus aprendizajes.
En la actualidad, cuando se produce un cambio de centro por parte de un alumno que no ha finalizado una etapa educativa (si la hubiera terminado y superado habría que suponer que había alcanzado los objetivos propuestos para ella), se exige que se emita un informe en el que aparezcan: el grado de consecución de las capacidades enunciadas en los objetivos generales de la etapa y de las áreas, el grado de asimilación de los contenidos de las diferentes áreas o materias, las valoraciones parciales del aprendizaje que se hubieran emitido y la aplicación, en su caso, de medidas educativas complementarias. Esta completa información que se solicita para que sea trasladada al nuevo centro es difícil -por no decir imposible- simplificarla en unas cifras, por muy expresivas que algunos quieran verlas.
Nos encontraríamos en una situación similar en los casos en que un alumno precisa de medidas especiales de adaptación o diversificación curricular o simples refuerzos educativos para algunas facetas de su aprendizaje. Estas medidas hay que tomarlas sobre datos concretos, claros, bien descritos..., porque hay que elaborar un programa individualizado para el estudiante. Con la evaluación expresada numéricamente seria imposible realizar ese programa de manera que se produjera la regulación de su proceso de enseñanza y aprendizaje para que superara los fallos específicos en su formación.
Se plantea un problema añadido en la situación social y educativa del momento actual. Tal y como se ha promulgado en los decretos de currículo en nuestro país, aparecen contenidos relacionados con actitudes, valores y normas que se deben enseñar, que los alumnos deben aprender y que, por lo tanto, también se deben evaluar. Si ya es incomprensible un "7" en el área de Lengua y Literatura, resultaría grotesco afirmar que un alumno ha obtenido un "7" en solidaridad, sinceridad, respeto a las ideas de los demás, etc.
3er Ejemplo: El siguiente ejemplo alude a un problema matemático realmente expresivo: "Supongamos una simple suma de ocho sumandos, todos ellos de más de cinco cifras. Supongamos que veinte alumnos han coincidido en el mismo error curiosamente: todos ellos han puesto en la tercera cifra de la suma/resultado, comenzando por la derecha, la cifra de las centenas, un 6 en vez de un 7. Probablemente la brutalidad tosca y acientífica, superficial, irreflexiva y burda del profesor/corrector de turno, diagnosticará a todos los alumnos el mismo dictamen: una "M" (mal), sin más especificación o análisis, y propondrá a todos el mismo tratamiento: repetir la suma (o hacer otras tantas). Pues bien, no hace falta mucha imaginación para advertir que el error de ese 6 en lugar de la cifra correcta, el 7, puede ser debido a veinte procesos mentales diferentes (...), cada uno de los cuales, para ser destruido, requeriría intervenciones técnico-didácticas cualitativamente distintas, ya que se trata de errores de tipo cualitativo diferentes (...). Por ejemplo:
- Un alumno puso 6 en vez de 7, porque se olvidó de sumar las que se llevaba de la columna anterior;
- Otro alumno puso 6 en vez de 7, porque no sabía que hay que sumar las que se llevan; (...)
- Otro alumno, porque padece una ligera miopía y confundió en la columna anterior un 3 con un 8; (...)
- Lo más grave de todo: un alumno de los veinte "acertó" y fue calificado por su profesor/corrector disparatadamente con una "B" (Bien), porque se equivocó dos veces, en vez de una, como la mayoría de los compañeros (...)"
Parece incuestionable que la evaluación de procesos hace necesario un modelo de evaluación más amplio, más comprensivo, que extienda sus técnicas y sus instrumentos de valoración y que, además, exprese sus resultados mediante la descripción explícita de lo que se ha alcanzado y lo que está pendiente, y de las causas de un rendimiento concreto o las dificultades que presenta el alumno evaluado.
A la luz de estos ejemplos, refiriéndonos a la evaluación de procesos de formación humana, debemos señalar que no es posible evaluar de forma íntegra el complejo mundo educativo, exclusivamente con métodos experimentales: hay que decantarse obligadamente por el uso de métodos no experimentales como el etnográfico, el estudio de casos, la investigación-acción, etc., que permitan planteamientos eminentemente cualitativos, ajustados a las facetas humanas que se van a valorar, precisamente porque utilizan técnicas procedentes del campo de la antropología, apropiadas a estos tipos de investigaciones y evaluaciones.
Estos y otros inconvenientes han llevado a los estudiosos de la educación a la necesidad de utilizar un concepto de ciencia más amplio y unos métodos de investigación y evaluación más adecuados a los contextos en los que surgen los problemas. El conjunto de métodos alternativos a la utilización en educación de la metodología experimental-cuantitativa, se denomina investigación cualitativa.
1.2.1. EL PARADIGMA CUALITATIVO
La estrechez del paradigma positivista en sus aplicaciones a la elaboración y evaluación de proyectos educativos ha provocado el desarrollo paralelo de enfoques alternativos con presupuestos éticos, epistemológicos y teóricos bien diferentes.
Desde la década de los sesenta se ha producido un rápido y acelerado incremento del interés sobre la perspectiva llamada evaluación cualitativa (Eisner, Cronbach, McDonald, Stenhouse, House, Guba, Parlett, Hamilton, Elliot, Stake...). Tal interés se debe en gran medida al reconocimiento de que los tests estandarizados de rendimiento no proporcionan toda la información que se precisa para comprender lo que los profesores enseñan y los alumnos aprenden.
De forma breve podrían considerarse las siguientes características como las definitorias del paradigma alternativo:
- La objetividad en la ciencia y en la evaluación es siempre relativa y de ninguna forma puede considerarse su objetivo central ni prioritario (...). La comprensión de un fenómeno, de un sistema o de un conjunto de acontecimientos es una empresa humana intencional y tentativa sujeta inevitablemente a limitaciones y errores.
- Comprender una situación donde interactúan los hombres con intencionalidad y significados subjetivos requiere tomar en consideración las diferentes posiciones, opiniones e ideologías mediante las cuales los individuos interpretan los hechos y los objetivos y reaccionan en los intercambios. La posición del evaluador no es neutral, libre de consideraciones de valor. Como afirma Lawton, la evaluación debe referirse no sólo al grado en que el alumno aprende un conjunto de habilidades o un tipo de conocimientos, la evaluación debe también responder a cuestiones de justificación (¿por qué han de aprender x?), así como a los efectos de aprendizaje no intencionados (¿qué han aprendido, además?), (aprendiendo x ¿qué han dejado de aprender?).
- Ni la educación ni la evaluación pueden comprenderse, pues, como procesos tecnológicos desligados de la esfera de los valores. En el intercambio escolar se generan significados y se comparten o contrastan valores. La evaluación no puede versar únicamente sobre la contrastación aséptica de resultados con objetivos preestablecidos, observables y cuantificables. La vida en el aula es un sistema abierto de intercambio, evolución y enriquecimiento según Doyle (...)Eisner afirma que «en parte como resultado de la creciente literatura sobre "currículum oculto", aquellos que trabajan en el campo educativo han reconocido que los profesores y la escuela como institución, enseñan más que lo que se proponen. La mayoría de las lecciones más importantes que los alumnos aprenden en la escuela no están integradas en el currículum explícito».
El objetivo de la evaluación no se restringe a las conductas manifestadas, ni a los resultados a corto plazo, ni a los efectos previsibles o previstos en los objetivos de un programa. Los efectos secundarios y a largo plazo son tanto o más significativos que los inmediatos y planificados.
- Comprender el significado de los productos complejos, a corto y largo plazo, explícitos y ocultos, requiere un cambio de orientación. Una traslación desde el énfasis en los productos al énfasis en los procesos. Sólo comprendiendo la génesis y la historia, la sucesión compleja de fenómenos y acontecimientos, pueden explicarse las conductas y los resultados del aprendizaje. Los métodos cualitativos de evaluación están diseñados en gran medida para enfocar los procesos de la práctica educativa, con objeto de proporcionar la información requerida para la formulación y reformulación racional de la acción didáctica (evaluación formativa).
- La evaluación centrada en los procesos de enseñanza-aprendizaje intenta capturar la singularidad de las situaciones concretas, las características particulares que definen una situación y que pueden considerarse responsables del curso de los acontecimientos y de los productos de la vida en el aula. Los estudios sobre procesos han de registrar los sucesos en su evolución, en su estado de progreso, observar las situaciones e indagar los juicios, interpretaciones y perspectivas de los participantes.
- La búsqueda de significados y procesos supone la traslación desde las generalizaciones estadísticas al análisis e interpretación de lo singular e irrepetible.
- La evaluación cualitativa requiere, pues, una metodología sensible a las diferencias, a los acontecimientos imprevistos, al cambio y al progreso, a las manifestaciones observables y a los significados latentes. Un movimiento metodológico que supone el anverso de los presupuestos del paradigma psicoestadístico [...]
- La evaluación cualitativa incorpora, pues, un conjunto de técnicas, orientaciones y presupuestos de la metodología etnológica, de la investigación de campo extensamente desarrollada por la Escuela de Chicago. Más allá de la objetividad aséptica de datos descontextualizados y con difícil interpretación, la investigación de campo, en una cultura primitiva o en el ámbito del aula, busca el significado, el contenido de los signos o indicadores externos, impregnándose día a día de la vida del medio, de los significados compartidos y latentes, de los comportamientos simbólicos..., la inmersión del evaluador en el centro del intercambio (...). El enfoque sobre los procesos (que enfatiza la descripción e interpretación, el cambio y el contexto) no rechaza los datos cuantitativos ni sugiere que al prestar más atención al proceso se olviden los resultados. Aunque el enfoque debe ser particular, la base de datos se amplía y puede incluir indicadores del progreso de naturaleza cualitativa y cuantitativa, así como evidencias tanto de resultados como de procesos de enseñanza, aprendizaje y vida escolar.
- El diseño estrictamente estructurado de antemano no puede ser un instrumento adecuado para la evaluación cualitativa. La atención a lo singular y a los movimientos previsibles o accidentales requiere un diseño flexible que permita el «enfoque progresivo» en áreas particulares que aparecen más significativas en el curso de la investigación. El estudio se orienta y desarrolla frecuentemente hacia direcciones que no han sido previstas e incluso ni sospechadas con anterioridad. La evaluación centrada en los procesos es ella misma un proceso que evoluciona en virtud de los descubrimientos sucesivos y de la transformación del contexto. Supone, pues, un enfoque selectivo y progresivo.
- El propósito de la evaluación cualitativa es comprender la situación objeto de estudio mediante la consideración de las interpretaciones, intereses y aspiraciones de quienes en ella interactúan, para ofrecer la información que cada uno de los participantes necesita en orden a entender, interpretar e intervenir del modo más adecuado. La información ni es unívoca ni monopolio de un grupo o estamento, es un instrumento válido para el contraste y la reformulación de interpretaciones y actuaciones de cada individuo que interviene en la actividad educativa (...).
Como consecuencia del desarrollo de enfoque y perspectivas cualitativas, los modelos de evaluación que trabajan dentro del paradigma experimental han ido modificando sus estrechos planteamientos y moderando su posición inicial. No es difícil, hoy, encontrar una base de acuerdo para definir la evaluación como un proceso de recogida y provisión de evidencias, sobre el funcionamiento y evolución de la vida en el aula, sobre la base de las cuales se toman decisiones sobre la posibilidad, efectividad y valor educativo del currículum. Más que medir, la evaluación implica entender y valorar.
Se ha producido, pues, una múltiple apertura:
- Apertura conceptual para dar cabida en la evaluación a resultados no previstos y acontecimientos imprevisibles.
- Apertura de enfoque para dar lugar a recogida de datos tanto sobre los procesos como productos.
- Apertura metodológica. La primitiva e inflexible estrategia formal cambia para incluir procedimientos informales. Del monismo al pluralismo metodológico.
- Apertura ético-política. La evaluación proporciona información a todos los participantes y recoge opiniones e interpretaciones de todos los grupos de interés implicados en un proyecto educativo. De la evaluación burocrática a la evaluación democrática».
A continuación presentamos los atributos más representativos de ambos paradigmas:
PARADIGMA CUANTITATIVO | PARADIGMA CUALITATIVO |
Búsqueda y creencia en la objetividad en la evaluación. | Búsqueda y creencia en la comprensión de los fenómenos educativos: para comprender los fenómenos se necesita trabajar con las perspectivas subjetivas, con las creencias, de los agentes implicados en los hechos. |
El único procedimiento que puede proporcionar objetividad y rigor es el método hipotético deductivo o método científico. | Existe un conjunto heterogéneo de métodos que tiene como objetivo comprender los fenómenos educativos tratando de interpretar las opiniones de los agentes implicados en los procesos educativos. |
El método científico es muy restrictivo y universalmente válido. | Hay una gran libertad en la utilización de distintos métodos cualitativos, siempre que se utilicen con conocimiento y rigor. |
Enfasis casi exclusivo en los productos o resultados de la enseñanza. | No interesan exclusivamente los productos de los aprendizajes, interesan fundamentalmente los procesos: lo que ocurre en los contextos físicos, sociales, psicológicos y filosóficos que rodean al hecho educativo. |
El método experimental requiere un estricto control de las variables intervinientes para asegurarnos que lo que ocurre se ha producido como consecuencia de la causa estudiada. Esto exige simular en el aula las condiciones de laboratorio. | La evaluación cualitativa se produce en situaciones naturales en las que el observador es un agente implicado en el problema educativo concreto que se estudia. |
Para comprobar la eficacia de un método se deben mantener constantes todas las condiciones educativas aunque cambien las circunstancias. | No se pretende comprobar la eficacia de los métodos manteniendo las condiciones constantes sino que se pretende reorientar y adaptar a los cambios el método que se está utilizando, de forma que el método inicial puede que no sea el mismo al final del programa. |
Lo subjetivo, lo anecdótico y lo particular es despreciado puesto que lo que se buscan son leyes universalmente válidas. | El interés se centra en la solución de un problema concreto, que ocurre en una situación determinada con personas muy concretas que tienen su particular manera de interpretar el mundo.. |
La evaluación cuantitativa se preocupa por el grado en que se han alcanzado los objetivos previamente establecidos al comienzo de un programa. | La evaluación cualitativa se preocupa por analizar los procesos educativos para que los propios agentes introduzcan los cambios oportunos para conseguir los objetivos propuestos. |
Validar métodos con carácter universal. | Hacer válida la acción educativa concreta que se pone en marcha en cada momento. |
1.3. MODELOS Y ENFOQUES DE LA EVALUACIÓN.
Hasta hace muy poco tiempo, en nuestro ámbito, era muy fácil encontrarse con el siguiente reduccionismo: evaluar es igual a calificar a los alumnos.
Afortunadamente, muchas voces se han levantado en su contra, y así, sin negar esa función, la evaluación se ha convertido en un elemento del proceso educativo con una incidencia muy fuerte en otros aspectos y ámbitos que superan con mucho la figura del discente.
Evaluar programas, evaluar contextos, evaluar centros, evaluar profesores, evaluar materias... son accidentes que ha de cumplir la evaluación dentro del sistema educativo. La evaluación ha ido ampliando sus centros de influencia, hasta convertirse en uno de los ejes y en uno de los requisitos imprescindibles, si queremos hablar con seriedad, de una enseñanza de calidad.
La preocupación por la evaluación en educación es antigua; pero no nos vamos a remontar a los exámenes que los funcionarios chinos ya tenían que realizar 2.000 años antes de Cristo, ni nos detendremos en la influencia positivista primera y la presión de la Psicología ejercida a través de las «medidas mentales» de la inteligencia, la memoria, la atención, etc.
La adscripción de un autor a uno de los paradigmas anteriormente citados, se realizada después de que dicho autor se haya decantado por la utilización práctica de algún modelo de evaluación. Esto viene a indicar que los paradigmas evolucionan y cambian porque los evaluadores introducen cambios en sus prácticas evaluadoras; cambios que surgen por la insatisfacción a la hora de utilizar los modelos anteriores.
Como ya se ha señalado, a lo largo del último siglo, se han ido sucediendo, en función de las necesidades de los investigadores educativos, distintos modelos de evaluación. Desde los puramente cuantitativos, como el Tyler, centrado en la evaluación del producto de los resultados de la enseñanza, hasta otros, más de tipo cualitativo, centrados en el análisis de los procesos, como los de Scriven, Stufflebeam o Stake. Aunque no se agotan aquí todas las posibilidades, podríamos hablar de la evaluación crítica de Eisner, de la evaluación iluminativa de Parlett y Hamilton, de la evaluación democrática de MacDonald, de la eva1uación como investigación de Stenhouse, etc.
Estudiaremos ahora tres de los modelos de evaluación que más han influido en nuestro sistema educativo a lo largo del último siglo. A través de su presentación podremos observar cómo han ido cambiando las modas, desde concepciones positivistas centradas en los productos, hacia posiciones más formativas basadas en la evaluación de los procesos.
El modelo de evaluación de Tyler
Iniciaremos nuestro hipotético andar con la figura de Tyler; tras la Segunda Guerra Mundial. Su aportación y preocupación por 1a evaluación en educación ha ejercido una gran influencia. Muchos han sido sus seguidores. Todavía hoy, puede que sea su modelo uno de los más extendidos en el panorama actual de la evaluación en los centros, si bien está siendo criticado y superado ampliamente por otros planteamientos. Su concepción de la evaluación podría sintetizarse así:
· Evaluar supone establecer comparaciones entre las realizaciones de los alumnos, tras un período de aprendizaje, y los Objetivos que se establecieron con anterioridad y determinar hasta qué punto éstos han sido logrados.
· Llevar a la práctica este modelo de evaluación supone:
· Enumerar, secuencializar objetivos.
· Establecer controles o procedimientos para obtener información de los resultados de los alumnos, de forma observable.
· Comparar los resultados con los objetivos.
· Aceptar o rechazar de acuerdo con unos valores o normas.
El procedimiento de diseño evaluativo es el siguiente:
1º. Establecer las metas u objetivos.
2º. Ordenar los objetivos en amplias clasificaciones.
3º. Definir los objetivos en términos de comportamiento.
4º Establecer situaciones y condiciones según las cuales puede ser demostrada la consecución de los objetivos.
5º Explicar los propósitos de la estrategia de evaluación al profesorado encargado de realizarla y cuales serán los mementos y situaciones más adecuadas para la evaluación.
6º Escoger o desarrollar las apropiadas técnicas de evaluación (a ser posible instrumentos objetivos y estandarizados) y utilizar los procedimientos estadísticos apropiados.
7º Recopilar los datos de trabajo, que podrán referirse a los centros, a los programas desarrollados o al aprendizaje concreto de los alumnos).
8º. Comparar los datos con los objetivos de comportamiento.
El procedimiento tyleriano, con las modificaciones, mejoras y ampliaciones de Scriven (evaluación formativa) y Stufflebeam (evaluación del proceso) principalmente, representa un gran avance para la evaluación educativa, tanto de programas, como de curricula o de alumnos. Este modelo se muestra adecuado para:
· Labores de diagnóstico.
· Tratamiento posterior de aprendizajes defectuosos o lagunas.
· modificación de objetivos.
· Ajuste de objetivos.
· Obtención de información para la dirección y administración educativas.
· Guía indicadora para el profesor de su actividad y de su repercusión en el aprendizaje de sus alumnos.
· Proporcionar información para evaluaciones orientativas de procesos de aprendizaje subordinados de dichas evaluaciones.
· Proporcionar información para evaluaciones sumativas o finales dada su especial preocupación por acabar ciclos o programas y así poder establecer las comparaciones.
Las limitaciones, que son varias, tal como veremos al desarrollar otros modelos, hacen referencia, principalmente, a:
· Dificultad de objetivizar, según taxonomías, las metas y fines educativos.
· No aporta criterios suficientes y claros para seleccionar objetivos.
· Elaborar los «objetivos operativos» para los curricula es excesivo.
· Los objetivos de mayor relevancia (juicios, valores, actitudes) pueden quedar fuera de los procesos de evaluación.
El modelo de Tyler se encuentra claramente dentro de lo que hemos considerado anteriormente corriente cuantitativa o experimental. Pretende objetivar al máximo tanto los objetivos educativos, las situaciones de aprendizaje como la propia práctica de la evaluación, con la pretensión de ejercer el control total de las variables implicadas en el proceso. Pero ya hemos señalado anteriormente las dificultades que este enfoque, tomado en sentido estricto, manifiesta a la hora de ajustarse a las verdaderas necesidades de los centros y de los alumnos.
La evaluación formativa de Scriven y la evaluación del proceso de Stufflebeam
Aunque ya Tyler introdujo el término feed back (retroalimentación o retroacción) en sus planteamientos educativos, este término tuvo escasa incidencia en los primeros planteamientos. Fueron los estudios posteriores los que detectaron la potencialidad y las posibilidades de ese concepto.
Existe una clara distinción entre la evaluación sumativa (final) la evaluación formativa (o de proceso); la primera tiene como objetivo el de certificar un estado resultante de los aprendizajes de los alumnos respecto a unos objetivos preestablecidos, es decir; establecer unos niveles o unas clasificaciones de los resultados obtenidos por los alumnos; la segunda por el contrario, pretende proporcionar una información que sirva para que el alumno y el profesor puedan conducir reconducir sus esfuerzos y sus trabajos dentro de unas coordenadas de acción que faciliten el desarrollo de las actividades y faciliten aprendizaje mientras éste se está desarrollando. En palabras de Scriven, recogidas por Stufflebeam y Shinkfield (1987:345) resulta que:
«La formativa ayuda a desarrollar programas y otros objetos; la sumativa calcula el valor del objeto una vez que ha sido desarrollado y puesto en el mercado»
Esta idea es importante porque nos sitúa ante un hecho irreversible: hablar de evaluación sumativa nos lleva a planteamientos cerrados y acabados, en tanto que la evaluación formativa nos invita a procesos abiertos y flexibles.
Su incidencia es manifiesta tanto en el diseño y desarrollo de determinados programas parciales o en la elaboración de currícula complejos como en el seguimiento y control (ayuda) del desarrollo didáctico de cualquier actividad y, en consecuencia, de los aprendizajes de los alumnos en un momento determinado, con el propósito de mejorar todos y cada uno de los procesos. Así entendida, la evaluación se convierte en parte integrante del proceso didáctico, mientras éste se realiza de modo distinto al considerarlo una parte final e independiente del mismo.
La evaluación formativa o del proceso tiene como finalidad principal la de obtener información, que, una vez contrastada en cuanto a su validez, nos lleve a desarrollar y optimizar el proceso objeto de evaluación, es decir, el desarrollo y la ejecución de una determinada actividad o programa.
La característica esencial de las evaluaciones formativas o de proceso radican en que las decisiones que se toman afectan al propio proceso; esto no ocurre con la evaluación sumativa cuyas repercusiones afectan a otros procesos. Las «repeticiones», en una evaluación formativa, afectan a secuencias o partes del proceso, considerando este no acabado; en una evaluación sumativa esas «repeticiones afectan a otro proceso, entendiendo el anterior como algo acabado.
PUNTO DE CONTRASTACIÓN
A DATOS PARA EMITIR JUICIOS
La realización de un examen, en una evaluación sumativa, tiene su constatación en una calificación (apto, no apto); a continuación se pasa a realizar otro proceso, que no tiene repercusiones ni sobre los procesos ni sobre los contenidos que han sido evaluados (no existe retroalimentación) Los efectos se verán en otro proceso, ya que lo facilitan, lo permiten o lo impiden.
Por su parte, Stufflebeam concibe la evaluación del proceso como una parte de un planteamiento evaluatorio más amplio al que denomina CIPP, o sea, evaluación del contexto (C), evaluación de las entradas- inputs- (I), evaluación del proceso propiamente dicho (P) y evaluación del producto (P). La finalidad del CIPP es perfeccionar un sistema, no demostrar su validez. Este modelo se ajusta más a la evaluación de centros que a la evaluación de los aprendizajes individuales de los alumnos, aunque pueden utilizarse también para esta tarea siempre que se realicen los ajustes oportunos.
En la tabla siguiente se pueden observar las intenciones de Stufflebeam para cada uno de los aspectos del CIPP
| CONTEXTO | ENTRADA | PROCESO | PRODUCTO |
¿Qué evaluar? | Definir el contexto escolar y sociocultural, identificar la población objeto de estudio y valorar sus necesidades. Analizar si los objetivos propuestos son con coherentes con las necesidades valoradas. | Identificar y valorar la capacidad del sistema, las estrategias de programa alternativas, la planificación de procedimientos para llevar a cabo las estrategias, los presupuestos y los programas que lleva la institución a la práctica. | Identificar durante el proceso los efectos de la planificación del procedimiento o de su realización, proporcionar información para las decisiones preprogramadas y describir y juzgar las actividades y aspectos del procedimiento. | Recopilar descripciones y juicios acerca de los resultados y relacionarlos con los objetivos y la información proporcionada por el contexto, por la entrada de datos y por el proceso, e interpretar su valor y su mérito. |
¿Cómo evaluar? | Para ello pueden utilizarse métodos como la observación, la inspección, la revisión de documentos, las entrevistas, los cuestionarios, etc. | Para ello se puede inventariar y analizar los cursos humanos y materiales disponibles. El estudio de las posibilidades de viabilidad, aplicabilidad y las económicas. | Para ello se debe tratar de establecer una continua interacción con el personal del proyecto y la observación de sus actividades. Los cuestionarios, las planillas de observación de los elementos centrales del proceso, los diarios y el análisis de documentos son buenos procedimientos para la evaluación del proceso. | Para ello puede utilizarse como método de evaluación, la tarea de definir operacionalmente y valorar los resultados, mediante la recopilación de los juicios de los clientes y la realización de análisis cualitativos y cuantitativos. |
¿Para qué evaluar? | La evaluación del contexto permitirá definir el marco, las metas, los objetivos y la planificación inicial del programa. | La evaluación de las entradas o imputs permitirá la selección de los recursos de apoyo, los procedimientos y las capacidades del sistema para llevar a cabo el proceso. | La evaluación del proceso permitirá introducir en todo momento los cambios necesarios para llevar a cabo y perfeccionar la planificación y los procedimientos del programa. | La evaluación del producto permitirá decidir la continuación, la modificación o readaptación o la finalización del programa. |
Teniendo en cuenta, como señala el propio Stufflebeam, que la evaluación es una parte integrante del programa regular de una institución y no una actividad especial que se lleva a cabo en determinados momentos, los objetivos de una evaluación formativa o de proceso podrían sintetizarse en los siguientes:
· Aportar una información suficiente y contrastada a las personas interesadas sobre el ritmo de las actividades de un determinado programa. Si éstas se ajustan a lo planificado y si se emplean los recursos de forma eficiente.
· Proporcionar elementos de ayuda y orientación para modificar algún plan concreto previamente establecido o justificar su inadecuación.
· Indicar niveles de satisfacción tanto de ejecutores como de usuarios.
· Elaborar un informe en el cual se recoja la calidad, el coste y el nivel de ajuste respecto a lo planificado.
Después de la presentación de estos modelos, es preciso insistir en la problemática, que se apuntaba más arriba, respecto a los paradigmas cualitativos y cuantitativos. En un primer momento, la aparición de los modelos cualitativos en educación se presentan enfrentados a los modelos cuantitativos-experimentales tradicionales. Tras largos forcejeos en la actualidad, y en el ámbito de las ciencias sociales en general y en las ciencias de la educación en particular, parece que se llega a un consenso: ningún método tiene la exclusividad a la hora de intentar explicar o profundizar en el conocimiento de los fenómenos; es más, presentar los paradigmas como incompatibles constituye un error. Creemos que son muy acertadas las ideas de Reichardt, 1986 y Filstead, 1986, cuando intentan centrar la polémica y buscar una solución considerando que:
· Los atributos de un paradigma no se hallan ligados ni a los métodos cualitativos ni a los cuantitativos.
· Los paradigmas no constituyen el determinante único de la selección de los métodos.
· La elección del método dependerá, en parte, de las exigencias de la situación que se pretende analizar.
· La eficacia, validez y utilidad de una investigación o de una evaluación serán mayores en la medida que hayamos logrado diseñar un proceso que se ajuste a las situaciones que comprende, de las cuales unas serán de índole cuantitativa y otras cualitativas o, la mayoría de las veces, mixtas,
· Los evaluadores han de sentirse libres para cambiar de paradigma cuando lo consideren oportuno.
· Que lo inapropiado es situar a cualquiera de los dos métodos en posición inferior
· Que la evaluación de un programa puede verse fortalecida cuando en un diseño de investigación se hallan integrados los dos paradigmas.
1.4. DISEÑOS DE EVALUACIÓN
Abordar el diseño de la evaluación, en función de la realidad del centro evaluado, de los componentes seleccionados y de las necesidades detectadas, supone disponer el camino para llegar a la meta propuesta. La definición de diseño, en sentido amplio, puede concretarse en: «la planificación de las actividades que deben llevarse a cabo para solucionar los problemas o contestar a las preguntas planteadas» (De la Orden, A.:1985, p. 71).
Una vez identificados los componentes y subcomponentes que se van a evaluar y señaladas las condiciones generales del proceso que se emprende, es necesario determinar el tipo de diseño más adecuado para las finalidades que se pretenden (ver Cuadro que aparece más abajo). Decidido el tipo de diseño, hay que precisar, dentro de su planteamiento genérico, las fases del trabajo, las personas que deben intervenir, los recursos con que se cuenta, las técnicas que se utilizarán, los instrumentos que deben emplearse o elaborarse, el tiempo previsto para su realización, etc.
| Diseño experimental | |
| Diseño quasiexperimental | |
Tipos de diseño evaluador | Diseño no experimental | Ex-post-facto Correlacional Longitudinal Transversal Estudio de casos Investigación-acción Etnográfico |
Cuadro: Tipos de diseños.
La realización del diseño supone una importante toma de decisiones para hacer realidad la evaluación proyectada; sin esta tarea previa, es fácil que no se alcancen los objetivos propuestos en un principio.
En el cuadro anterior hemos presentado una posible clasificación de los tipos de diseños válidos tanto para investigación como para evaluación. Según esta propuesta, podemos distinguir básicamente tres tipos de diseños:
a) Experimental.
b) Quasi-experimental.
c) No experimental.
En principio, es válida la elección de cualquier tipo de diseño para realizar la evaluación global o parcial de un centro, pero nos decantamos por los diseños no experimentales por su mayor adecuación y utilidad en la evaluación interna y formativa de los centros escolares.
Así, aunque entendemos que para casos concretos, especialmente en la evaluación parcial de un centro, puede emplearse un diseño experimental o quasi-experimental, creemos que las situaciones habituales de la vida de un centro, consideradas globalmente, son más fácilmente valorables con diseños no experimentales, por adecuarse mejor a la naturaleza compleja de estos hechos, a la evaluación de procesos y a la dinámica diaria de la tarea educativa. Los diseños no experimentales permiten incorporar las eventualidades que van apareciendo y, por ello, el ajuste de los pasos establecidos previamente en ellos. De esta forma, la continua mejora del proceso y las circunstancias en que éste se desenvuelve y la utilización de la evaluación como estrategia de formación permanente en el centro, se convierten en una realidad.
Dentro de los diseños no experimentales, el diseño etnográfico se adecua especialmente a la flexibilidad que necesita la evaluación de las instituciones educativas.
En consonancia con la exposición que venimos haciendo, consideramos necesario realizar algunas puntualizaciones que quizá orienten al lector a lo largo de las páginas que siguen:
La descripción de los tipos de diseño es sencilla y breve; en ella nos limitamos a destacar sus principales características, de manera que el interesado disponga de unos elementos básicos de juicio para decidir el tipo de diseño que puede resultar más conveniente en cada caso. Para su ampliación, le remitimos a la bibliografía, donde podrá encontrar obras que tratan con mayor profundidad los diseños mencionados.
1.4.1. Diseño experimental
Un experimento consiste en modificar el valor de una variable (denominada independiente) y observar el efecto del cambio en otra variable (denominada dependiente). Por tanto, la caracterización del método experimental en educación viene dada porque el evaluador controla y manipula deliberadamente las condiciones de los hechos que le interesa valorar. De esta forma se pretende establecer relaciones de causa/efecto entre unas variables y otras.
Las funciones que se asignan al diseño experimental son complejas y variadas; siguiendo a De la Orden, A. (1985, PP. 71-72), citamos entre ellas: «La formulación precisa de la hipótesis y su traducción a términos estadísticos, la identificación tanto de la variable independiente (V. I.) como de las extrañas y la toma de decisiones sobre los niveles de aquélla y el control de éstas, la selección de la muestra, su tamaño y procedimiento de asignación, la selección de técnicas para la medición de la variable dependiente (V. D.), la decisión sobre la prueba estadística y el nivel de significación, y el grado de generalización de los resultados.»
Se ha utilizado frecuentemente este diseño para controlar, por ejemplo, el efecto de una nueva metodología sobre el aprendizaje de grupos de alumnos. Para aplicarlo es necesaria la formación aleatoria de los grupos y, también, contar con un grupo de control. Dada la dificultad de que se dé la condición de aleatoriedad, en sentido estricto, dentro del campo educativo, y dados los problemas éticos que en algunos casos puede plantear la manipulación de sujetos, se hace realmente difícil su utilización en buena parte de la evaluación educativa, lo que no significa que para investigaciones muy especificas no deba realizarse y, de hecho, se realice. No obstante, los obstáculos que presenta su utilización en la evaluación interna de los centros, son prácticamente insalvables.
1.4.2. Diseño quasi-experimental
Considerando las dificultades del diseño experimental puro, los investigadores en educación manifiestan, en los últimos años, una clara tendencia hacia la aplicación de la quasi-experimentación.
No todas las leyes que rigen en el ámbito de la educación son leyes linealmente causales, sino que más bien encontramos relaciones teleológicas (regidas por metas, intenciones, objetivos, etc.), o bien ecológicas (orientadas por mecanismos complejos de adaptación). Ciertamente, el contexto en el que ocurren los «hechos» constituye un sistema abierto donde aparecen interacciones de todo tipo y en el que, por lo tanto, es casi imposible establecer relaciones causales puras. Por ello, hay que convenir en que son mayores las posibilidades de aplicar el diseño quasi-experimental para obtener resultados no reduccionistas en educación.
El objetivo principal de este diseño se centra, como en el caso anterior, en establecer ciertas relaciones causales entre las variables estudiadas, pero sin exigir la completa aleatorización de los grupos, por lo que resulta más sencilla y apropiada su utilización. Presenta, de este modo, un menor grado de validez interna, pero un nivel aceptable de validez externa..
Los condicionantes a los que hemos aludido hacen que algunos autores achaquen a este tipo de diseño un menor valor científico. No obstante, las ventajas que presenta, muy especialmente su viabilidad y su escasa interferencia en el curso natural de los hechos, llevan a que los investigadores/evaluadores recomienden este diseño para muchos estudios educativos.
1.4.3. Diseño no experimental
Para caracterizar los diseños no experimentales habría que indicar que son aquellos que no incorporan los elementos de control disponibles en los diseños anteriores. Es decir, no se controlan y manipulan las variables (no se utiliza grupo de control, no se seleccionan y asignan sujetos por procedimientos aleatorios) y no pretenden definir la estricta relación causa-efecto entre una variable y otra. Por el contrario, sí pretenden descubrir relaciones entre los componentes de un hecho, ofrecen una rica información sobre los procesos, explican las complejas interacciones que se producen en los grupos humanos, dejan un gran margen para la interpretación, y por todo ello, sus resultados no son generalizables, pero resultan de gran utilidad para la toma de decisiones en la situación o el centro evaluados. Por lo tanto, desde un punto de vista experimental, estos diseños resultan muy débiles; no obstante, «con fines formativos esto puede ser muy acertado; pero con fines sumativos son mucho menos convenientes que los diseños más rigurosos» (Weiss, C. H.: 1982, pp. 93-94).
Y es precisamente por esta serie de razones por lo que mostramos nuestra preferencia por los diseños no experimentales en la evaluación de centros: los fines que pretendemos con la evaluación interna del centro son, justamente, su continua formación y mejora y, como dice Weiss, es en ese campo en el que los diseños no experimentales encuentran su adecuada aplicación.
A continuación describiremos algunos diseños incluidos en la clasificación respecto a la que, como ya comentamos antes, todavía no se ha llegado a un consenso general y la inclusión o no de algunos diseños en un grupo u otro depende más de un criterio personal guiado por motivos prácticos que de un consenso aceptado de forma general, como señala De la Orden (1985).
a) Diseño ex-post facto
Interpretado literalmente, el término ex-post-facto significa de lo que se hizo antes, es decir, diseño para la evaluación de lo ya realizado o diseño retrospectivo. Se centra, por tanto, en una variable independiente cuyas manifestaciones ya han ocurrido. De ahí que este diseño se defina como: «... aquella investigación en la que no se ejerce control directo sobre la variable independiente» (De la Orden, A.: 1985, p. 107). Esta es, también, su diferencia esencial con el diseño experimental. Constituye un intento planificado para evaluar la relación causa/efecto entre una situación dada y los factores que en el pasado hayan podido producirla. Por ejemplo, en un centro aparecen porcentajes de abandono escolar que antes nunca se habían dado. El evaluador, para intentar averiguar las causas, investigaría los factores que hubieran podido presentarse en el funcionamiento general del centro a lo largo de los cinco últimos años, buscando así la explicación a la alarmante situación que ahora se manifiesta.
Este tipo de diseño ve amenazada su validez interna por la desaparición a corto plazo de la muestra y la regresión estadística. No obstante, hay autores, como E. N. Kerlinger (1975), para quienes este planteamiento es tan riguroso como el experimental, pero teniendo en cuenta su aplicación a la investigación pedagógica, ya que el objeto de estudio (la educación) no posibilita el control riguroso de variables y condicionamientos, como ya hemos comentado antes.
b) Diseño correlacional
Insistiendo en la ambigüedad de las clasificaciones, este diseño es considerado, a veces, como una modalidad del diseño ex-post-facto, al igual que el denominado diseño de grupo criterial o diseño causal-comparativo (Cohen, L. y Manion, L.: 1990, p. 224), mientras que otras es incluido entre los quasi-experimentales. No obstante, presenta algunas diferencias significativas que permiten su diferenciación.
La evaluación mediante un diseño correlacional se propone la identificación de las relaciones existentes entre las diferentes variables que confluyen en un fenómeno, intentando determinar el tipo (positivo o negativo) y ponderar su incidencia. La pretensión no es hallar la relación directa de causa/efecto, sino simplemente poner de manifiesto relaciones entre unas variables y otras. De esta forma, no requiere la manipulación de la variable independiente, por lo que resulta más aplicable al campo educativo, aunque los experimentadores cuantitativos puros ponen en entredicho su validez al no poder establecer el tipo de relación que efectivamente se produce. Son importantes sus aportaciones para constatar la fiabilidad y la validez de una prueba (Tyler, L. E.: 1978).
e) Diseño longitudinal
El diseño de evaluación longitudinal se lleva a cabo mediante la recogida y valoración de los datos a lo largo de un determinado período de tiempo. Este periodo puede establecerse de antemano cuando se evalúa un tema que así lo precise, como puede ser la implantación de un programa, de una reforma educativa, etc. Asimismo, el diseño puede plantearse sistemáticamente cada año en torno a aquellos componentes o aspectos del centro escolar que se consideren de interés (rendimiento del alumnado, funcionamiento de los criterios de evaluación previstos, aplicación de metodologías innovadoras...). Dado que en todos los casos este tipo de diseño evaluativo implica un seguimiento en el tiempo, presenta ciertas ventajas e inconvenientes que comento brevemente. La evaluación longitudinal es útil para llegar a conocer los esquemas de desarrollo del objeto evaluado, para establecer las relaciones que se producen entre unos y otros componentes o resultados, para demostrar cómo los cambios individuales suelen coincidir con los cambios sociales de conjunto y, muy especialmente, para la observación de tendencias en los grupos. No obstante, por el motivo antes citado (su prolongación en el tiempo hace que cuanto mayor sea su duración, más fuertes sean sus limitaciones), también presenta inconvenientes y problemas relativos a su validez, que han hecho reducir enormemente su utilización en los últimos años; entre ellos, el largo período de tiempo en el que se debe contar con un equipo evaluador que realice el seguimiento, el gran coste económico que lleva consigo, la mortalidad de la muestra (cambio o desaparición de los sujetos evaluados por traslado de residencia, de centro, etc.) y las dificultades de organización, ya que las continuas modificaciones impiden cumplir en muchas ocasiones la planificación prevista (Cohen, L. y Manion, L.: 1990, p. 102). No obstante estos inconvenientes, y como ya adelantaba al comenzar este comentario, para la evaluación longitudinal de un centro educativo no existen tantas dificultades como las señaladas por los investigadores cuando se refieren a estudios planificados a escala nacional o internacional y que deben efectuar equipos especialmente contratados para ello. Creo que no es difícil llevar a cabo la evaluación de aquellos componentes que se consideren de mayor interés para el centro, mediante un diseño longitudinal. Ni siquiera es imprescindible precisar de antemano el final de la misma, salvo que así lo requieran los objetivos previstos. Por ejemplo: los resultados obtenidos por los alumnos y las alumnas a lo largo de varios cursos académicos pueden ser objeto de un diseño de evaluación longitudinal sin necesidad de predeterminar el final del estudio. Esto ofrecería al centro datos comparativos por grupos y por áreas o disciplinas durante toda su vida como institución, y permitiría establecer correspondencias entre éstos y los diferentes factores que se hayan ido introduciendo o modificando en el proceso de funcionamiento (metodología, recursos didácticos, profesorado especialista, programas específicos, etc.) o las modificaciones de contexto o entrada que se hayan producido (en el nivel sociocultural de la población de la localidad o del barrio, en el tejido industrial, en los apoyos externos, en las instalaciones, etc.).
Por las características de este diseño, algunos autores lo señalan como próximo a los diseños quasi-experimentales e, incluso, cuando los diseños experimentales cuentan en su planteamiento con observaciones sistemáticas repetidas en el tiempo, también participan de este carácter longitudinal que acabamos de comentar. Por otro lado, si el diseño longitudinal se aplica a hechos ya ocurridos, al menos en parte, se acerca a la caracterización de los diseños ex-post-facto.
d) Diseño transversal
El diseño de evaluación transversal intenta salvar los inconvenientes de aplicación temporal que se atribuyen al longitudinal y, para ello, la toma de datos y su valoración correspondiente se realizan en un momento preciso, pero recogiendo información de muy diferentes estratos de población. situaciones. edades, ámbitos de actuación, etc., de manera que sea posible deducir unas ciertas tendencias de comportamiento a lo largo del tiempo aunque el estudio se realice en un plazo realmente corto: «Un estudio transversal es aquel que produce una fotografía instantánea de una población en un momento determinado. El resumen o compendio de un estudio transversal es un censo nacional en el que una muestra representativa de la población formada por individuos de diferentes edades, diferentes ocupaciones, diferente educación e ingresos y residentes en diferentes partes del país, es entrevistada en el mismo día» (Cohen, L. y Manion, L.: 1990).
Al igual que el anterior, este diseño de evaluación presenta ventajas e inconvenientes claros. Haciendo referencia a los citados anteriormente, podría afirmarse que las ventajas de la evaluación longitudinal corresponden a los inconvenientes de la transversal, y viceversa. En concreto, las ventajas son su inferior coste económico y organizativo, la mayor rapidez en la obtención de resultados, el mayor número de sujetos con los que se puede contar para su realización y la facilidad para contar con la cooperación de los sujetos evaluados. FI inconveniente básico es la dificultad de determinar tendencias en el comportamiento de los grupos a lo largo del tiempo (sean éstos más o menos amplios) y, por tanto, el estudio de procesos de desarrollo mediante este tipo de evaluación es sólo aproximativo. Un ejemplo comparativo: si queremos conocer la incidencia de la aplicación de una reforma educativa en los resultados obtenidos por los alumnos durante los seis primeros años de implantación, su evaluación bajo un diseño de tipo longitudinal supondría realizar el estudio sobre los factores que se desea evaluar al menos una vez al año. Al cabo de los seis años se podría redactar el informe final de la evaluación con los resultados obtenidos. Si decidimos que no es posible mantener el estudio anual a lo largo de todo ese tiempo, cabe la posibilidad de plantear una evaluación con diseño transversal. Para ello, cuando hubiese finalizado el periodo de seis años, se tomarían muestras de alumnos de los cursos 1º, 2º, 3º, 4º, 5º y 6º, con datos relativos a todos los componentes que vayan a ser evaluados (áreas, disciplinas, metodología, modelo de evaluación, organización del centro...). De esta forma se obtendría una visión global, pero referida a los distintos momentos de implantación (cursos 1º, 2º, 3º, 4º, 5º y 6º) y a todos los componentes que deseamos evaluar. Se consigue así un resultado similar al del diseño longitudinal. No obstante, si deseáramos obtener mayor información sobre algún aspecto concreto y profundizar en cualquiera de los factores estudiados, ya no sería posible, puesto que este tipo de diseño se realiza cuando el proceso ha finalizado. Esto obstaculiza también la posibilidad de reformulación, ajuste o corrección de las disfunciones que se vayan produciendo, limitando, por tanto, los valores formativos de la evaluación y la efectividad de las decisiones tomadas en el momento oportuno.
Otro ejemplo más, referido estrictamente al ámbito de un centro educativo: podríamos plantearnos la determinación del valor de los criterios establecidos para la evaluación del alumnado a lo largo de toda la Educación Primaria y Secundaria Obligatoria. El diseño transversal de esta evaluación supondría que, al finalizar un curso, se tomarían datos del funcionamiento de esos criterios en los tres ciclos de la Educación Primaria y en los dos ciclos de la Educación Secundaria Obligatoria, simulando así la continuidad en el tiempo del proceso de aplicación de esos criterios. Una vez hecho esto, se establecerían las comparaciones oportunas actuando como si los datos se hubieran obtenido curso tras curso.
e) Estudio de casos
El diseño de evaluación caracterizado como estudio de casos aparece, como en las situaciones anteriores, clasificado de diversas maneras. Vázquez Gómez, G. (1976) lo considera inscrito dentro de los diseños quasi-experimentales, cuando es capaz de satisfacer, al menos en cierto grado, las exigencias de validez interna y externa necesarias. No obstante, otros autores, como Campbell, D. y Stanley, J. (1979), lo citan como diseño precientífico, al señalar que no controla ninguna de las fuentes de invalidez. Lo incluimos ahora en los diseños no experimentales, continuando con el criterio ya mencionado, no considerándolo estrictamente experimental ni quasi-experimental, tanto por los principios generales que lo inspiran como por las situaciones a las que generalmente suele aplicarse.
Este diseño de evaluación implica el estudio profundo de las características de una realidad singular, de la unidad individual que se pretenda evaluar: un centro educativo, un alumno, una pandilla, una clase, etc. Su propósito fundamental es conocer profundamente y analizar con intensidad los diferentes fenómenos que componen esa unidad. Por lo tanto, la técnica principal que se utiliza para la recogida de datos es la observación, complementada con la entrevista. De esta forma, el evaluador incluso puede pasar a formar parte integrante del medio evaluado con la pretensión de conocerlo en toda su amplitud (observación participante).
Interesa especialmente el conocimiento del proceso tal y como está ocurriendo y la opinión que las personas intervinientes tienen de él, y resulta útil sobre todo cuando el objetivo de la evaluación es comprender la naturaleza y la fenomenología de los procesos. La función asignada al estudio de casos es doble: investigadora y formativa, puesto que se propone ayudar a los protagonistas de la acción a conocer lo que hacen y a reflexionar sobre ello para mejorar su actividad profesional.
Es evidente que este tipo de diseño se enmarca dentro del modelo cualitativo de evaluación (metodologías naturalistas, idiográficas, iluminativas...) y últimamente se ha extendido considerablemente en el ámbito de la evaluación de centros, ya que se adapta muy bien a las necesidades evaluativas de los mismos y responde adecuadamente a los intereses de sus miembros y a la forma de hacer que en estas instituciones tiene lugar.
f) Investigación-acción
En términos generales, se puede definir la investigación-acción o investigación activa (recibe diversas denominaciones) como la intervención sistemática en el funcionamiento de realidades reducidas (un aula, un centro), que lleva al examen continuo de la situación y permite los ajustes permanentes para perfeccionar el proceso que se desarrolla. Si enfocamos nuestro interés hacia el centro o el aula, esto se traduce en que los propios integrantes de la comunidad educativa, que día a día hacen la vida de la institución, son los principales observadores/evaluadores de su actividad, de modo que la retroalimentación puede tener lugar en cada momento en que resulte necesaria, a la vista de las interacciones y los resultados que se van produciendo. Constituye la reflexión personal del profesional sobre su propio trabajo.
Como características del diseño enmarcado en el ámbito de la investigación-acción, Cohen y Manion (1990, p. 271) citan las siguientes:
Situacional
Se preocupa del diagnóstico de un problema en un contexto concreto y lo intenta resolver en ese mismo contexto (en nuestro caso, el centro escolar).
Colaborador
Trabajan juntos el equipo de evaluadores y los profesionales del medio evaluado (profesores y directivos).
Participativo
Los miembros del centro toman parte en la evaluación/investigación.
Autoevaluador
Se evalúan continuamente las modificaciones que se produzcan en la situación del centro, siendo el último objetivo mejorar la práctica profesional específica.
Por otra parte, la investigación-acción se suele recomendar para el estudio o evaluación de métodos de enseñanza, de estrategias de aprendizaje, de procedimientos de evaluación, de actitudes y valores, de formación de profesionales en ejercicio, de cuestiones relacionadas con dirección y control y de situaciones problemáticas de gestión. En resumen, puede resultar idónea para la evaluación de muchos elementos que forman parte del funcionamiento de un centro educativo.
La inclusión de la investigación-acción dentro de los tipos de diseño no experimentales viene justificada por su propio planteamiento, que no intenta controlar y manipular las variables, sino explicar «desde dentro» la realidad de una situación social. De forma parecida al estudio de casos: «se basa en dos principios esenciales: mejora y participación... Dado que es una forma de investigación social... el campo de la interacción y la práctica humanas configura los lugares aptos para la investigación y el perfeccionamiento» (Grundy, 5.: 1991, p. 193). Por otra parte, las técnicas de recogida y análisis de datos que se ajustan a este tipo de diseño son las utilizadas habitualmente por los investigadores o evaluadores cualitativos, ya que se adecuan mejor al estudio de la compleja e interactiva realidad del centro educativo.
g) Diseño etnográfico
Siguiendo el trabajo realizado por Goetz, J. P. y Le Compte, M. D. (1988), sintetizo los rasgos de los diseños etnográficos que nos pueden resultar más interesantes para su aplicación a la evaluación de centros, ya que este diseño se suele utilizar para estudios de investigación más amplios dentro del campo de evaluación de sistemas y, por tanto, con mayor complejidad e implicaciones que las que aquí van a aparecer.
La etnografía educativa ha tomado la terminología y los procedimientos de trabajo del ámbito de la antropología cultural y de la sociología cualitativa, siendo sus elementos básicos los siguientes:
-Comienzo de tipo exploratorio y abierto a cualquier posibilidad de planteamiento para abordar el problema que se investigue o evalúe.
-Fuerte implicación del evaluador en el medio social objeto de su trabajo, como observador y como participante.
-Utilización de diversas técnicas de investigación, especialmente la observación participante y las entrevistas con informantes clave.
-Intento de comprender los acontecimientos desde el significado que tienen para los protagonistas del medio evaluado/investigado.
-Interpretación de los datos dentro del importante papel que el contexto posee en la determinación de las conductas y en la interacción entre conducta y acontecimientos en el sistema.
-Producto de investigación con forma escrita (la «etnografía»), que debe interpretar los hechos de acuerdo con las características señaladas en los puntos anteriores y describir el entorno social con detalles lo suficientemente vivos como para que las personas informadas lleguen a conocer «lo que es estar allí».
Por lo tanto, supone la reconstrucción o descripción analítica de escenarios y grupos culturales (una fotografía del medio estudiado, en nuestro caso el centro educativo), para llegar a esa visión absolutamente real que pretende ofrecer. Con objeto de corregir los posibles sesgos de la información y garantizar la objetividad de los datos, suelen aplicarse técnicas de triangulación.
Por su propia naturaleza, planteamientos básicos, técnicas utilizadas y objetivos pretendidos, este diseño entra de lleno en los modelos cualitativos de evaluación y en el ámbito de los diseños no experimentales.
La obra de Woods, P. (1987) es sumamente ilustrativa en relación con la aplicación del diseño etnográfico a la evaluación del centro escolar.
BIBLIOGRAFÍA
Casanova, M. A. (1992). La evaluación, garantía de calidad para el centro educativo. Zaragoza: Edelvives.
Casanova, M. A. (1997). Manual de evaluación educativa. Madrid: La Muralla.
Ferrández Arenaz, A. y Jiménez Jiménez, B. (1989): Seguimiento y Evaluación de los Procesos Didácticos. Madrid: Fondo Formación Empleo.
Guerrero López, J. F. (1991). Introducción a la Investigación Etnográfica en la Educación Especial. Salamanca: Amarú.
LeCompte, M. D. (1995). Un matrimonio conveniente: diseño de investigación cualitativa y estándares para la evaluación de programas. RELIEVE (Online), 1 (1). Disponible en http://www2.uca.es/RELIEVE/v1n1.htm (1 julio 1999).
Morales Domínguez, J.F. (1985). Metodología y teoría de la psicología. Madrid: UNED.
Rodríguez Diéguez, J. L. (1980 ). Didáctica General: 1. Objetivos y Evaluación. Madrid: Cincel.
TEMA 2
LA EVALUACIÓN EN EL PROCESO DE ENSEÑANZA APRENDIZAJE
2.1. La evaluación en el proceso de enseñanza-aprendizaje.
2.2. El proceso de evaluación.
2.3. Funciones de la evaluación.
2.1. LA EVALUACIÓN EN EL PROCESO DE ENSEÑANZA-APRENDIZAJE
Como ya quedara reflejado en el tema 1, los procesos de enseñanza-aprendizaje son abordados con un enfoque diferente que depende del posicionamiento cuantitativista o cualitativista del investigador. En este sentido, se puede señalar esquemáticamente que existen dos tipos de procesos formativos:
- Procesos finalizados: Su desarrollo se centra en objetivos de aprendizaje formulados en términos de conducta observable, lo que supone considerar el proceso como algo cerrado. Este modelo se estructura en torno a los objetivos «operativos» que son los que concretan, especifican, determinan cuáles han de ser los resultados de la enseñanza. Tienden a la máxima objetividad de los datos, para lo cual se trata de establecer una sistematización estricta en el seguimiento de los procesos de enseñanza y aprendizaje y un diseño de evaluación que desemboca en resultados numérico-estadísticos.
Dentro del debate sobre los objetivos existen algunas corrientes clásicas (Tyler, Popham, Mager, Briggs) desde las cuales la finalización del proceso es una exigencia. Indican que sin objetivos terminales y muy bien especificados el proceso carece de sentido, se halla desorientado, puesto que el profesor no sabría a dónde ha de llegar exactamente y por lo mismo no sabría tampoco si ha llegado o no.
La planificación del proceso de enseñanza aprendizaje en el seno del enfoque cuantitativo presenta una estructura lineal compuesta por una serie de fases que van desde el diseño minucioso de los objetivos hasta la evaluación de los logros. En este enfoque la evaluación es un procedimiento que tiene como misión fundamental comprobar la eficacia del ajuste producido entre lo diseñado y lo conseguido al final del proceso.
Las fases de este enfoque pueden esquematizarse en las siguientes:
Planificar el currículo es realizar una serie de tareas que están íntimamente relacionadas entre sí. Salvo diferencias de matices, hay coincidencia entre los autores a la hora de señalar cuáles son esas tareas, tareas que hacen referencias a las fases de elaboración e implementación del proceso de enseñanza-aprendizaje. Como muestra puede servir la propuesta siguiente, inspirada en la realizada por de Wheeler en 1976, en la que se especifica que en la planificación y puesta en marcha de los procesos educativos existen fundamentalmente seis fases:
1 Fines, metas objetivos
2 Selección del contenido
3 Selección de experiencias
de aprendizaje
4 Organización e integración
de las experiencias de aprendizaje y del contenido
5 Implementación del proceso de
enseñanza-aprendizaje
6 Evaluación
1. Señalar fines, metas y objetivos
En todo proyecto, teoría o modelo tecnológico, lo primero a determinar son los objetivos a conseguir. El currículo, en cuanto es un esquema para organizar la enseñanza, tiene también esta prioridad.
Fines, metas y objetivos no son términos sinónimos. Son finalidades con distinto grado de proximidad, cuya interrelación será analizada en temas posteriores. El máximo nivel de concreción vendrá determinado por los objetivos operativos, formulados en términos de conducta observable.
2. Selección de contenidos
Las conductas no se adquieren en el vacío, sino, especialmente en el terreno académico, manejando unos temas, unidades o contenidos.
3. Selección de experiencias de aprendizaje
Redactar objetivos es especificar conductas que son deseables por los alumnos o deseadas para los alumnos. Adquirir o modificar unas conductas requiere ejercicio, actividad. Seleccionar las actividades o experiencias más adecuadas para conseguir los objetivos diseñados es la segunda tarea en el proceso de planificación.
4. Organizar las experiencias y los contenidos
Se trata de distribuir las tareas anteriores en función del contexto en que se van a llevar a la práctica: qué medios son necesarios o posibles, cuándo se van a realizar, qué tipo de agrupación de alumnos es más idónea, en qué orden se van a ofrecer las experiencias, etc.
5. Implementación del proceso de enseñanza-aprendizaje
En este momento se pone en marcha el proceso de realización de las actividades de enseñanza-aprendizaje por parte de los alumnos. Los alumnos deben enfrentarse a las actividades de enseñanza y aprendizaje diseñadas con anterioridad.
6. Evaluación
La última fase consiste en medir y valorar el grado de consecución de los objetivos y la eficacia de experiencias, contenidos y organización, es decir, de todas y cada una de las tareas anteriores. La evaluación ha debe recoger datos cuantificables con instrumentos de medida objetivos.
- procesos abiertos: caracterizados, bien por la indefinición de las metas, bien por estar organizados en torno a objetivos «expresivos» o experienciales. El desarrollo de los procesos e enseñanza aprendizaje desde esta perspectiva no implica el seguimiento a ciegas y al pie de la letra de un plan previamente fijado. Aunque en el comienzo de los procesos se parte siempre de unas referencias básicas, el proceso mismo va orientando los reajustes y cambios de rumbo oportunos para lograr la mayor calidad en los procesos de enseñanza-aprendizaje.
Los defensores de los procesos abiertos (Eisner, Stenhouse, Gimeno...) señalan que la enseñanza es un conglomerado de múltiples variables, que su desarrollo es fundamentalmente dinámico, que su mayor riqueza formativa radica precisamente en esa variabilidad y multiplicidad de experiencias que se suceden durante su desarrollo, y que especificar claramente de antemano a dónde se pretende llegar significa negar la posibilidad de realizar otros logros, encauzar rígidamente el proceso y en definitiva empobrecerlo.
La planificación del proceso de enseñanza aprendizaje en el seno del modelo cualitativo presenta una estructura circular, de retroalimentación, compuesta por una serie de fases similares a las del enfoque cuantitativo pero con un contenido netamente distinto. En este enfoque la evaluación es un procedimiento que tiene como misión fundamental producir ajustes continuos tanto en el proceso de enseñanza-aprendizaje como en la propia evaluación.
Las fases de este enfoque pueden esquematizarse en las siguientes:
1 Fines, metas objetivos
2 Selección del contenido
3 Selección de experiencias
de aprendizaje
4 Organización e integración
de las experiencias de aprendizaje y del contenido
5 Implementación del proceso de
enseñanza-aprendizaje
6 Evaluación
final
1. Señalar fines, metas y objetivos
Este modelo permite la formulación de objetivos didácticos experienciales. Estos objetivos didácticos no serán objetivos operativos formulados en términos de conductas observables, sino objetivos que marquen una tendencia, una dirección abierta que no cierre de tal manera el proceso que impida el desarrollo educativo de la diversidad del alumnado. Ya se señaló anteriormente que especificar claramente de antemano a dónde se pretende llegar significa negar la posibilidad de realizar otros logros, encauzar rígidamente el proceso y en definitiva empobrecerlo.
Asimismo, hay que señalar que los objetivos deben hacer referencia a las capacidades que habrán de conseguir los alumnos y no a conductas concretas. El aprendizaje de capacidades supone la adquisición de conocimientos, actitudes, habilidades y destrezas aplicables a una gran diversidad de situaciones.
2. Selección de experiencias de aprendizaje
La selección de actividades debe permitir a los alumnos alcanzar los aprendizajes por multitud de caminos; en educación no existe un único y válido camino para aprender. La variabilidad de los alumnos requiere una gran variedad de situaciones de aprendizaje que responda a las necesidades de cada uno de ellos.
3. Selección de contenidos
Las conductas no se adquieren en el vacío sino especialmente en el terreno académico, manejando unos temas, unidades o contenidos. La selección de contenidos debe responder al principio de significación en los aprendizajes; de tal manera que se garantice que la adquisición de nuevos conocimientos quede integrada de manera comprensiva y funcional en el bagaje cultural previo de los alumnos
4. Organizar las experiencias y los contenidos
Se trata de distribuir las tareas anteriores en función del contexto en que se van a llevar a la práctica: qué medios son necesarios o posibles, cuándo se van a realizar, qué tipo de agrupación de alumnos es más idónea, en qué orden se van a ofrecer las experiencias, etc. En todo caso, esta organización de actividades no presupone un planteamiento rígido e inmodificable, sino que estará sujeta a los cambios que la práctica vaya sugiriendo.
5. Implementación del proceso de enseñanza-aprendizaje
En este momento se pone en marcha el proceso de realización de las actividades de enseñanza-aprendizaje por parte de los alumnos. Los alumnos deben enfrentarse a las actividades de enseñanza y aprendizaje diseñadas con anterioridad y a otras que surgirán en el transcurso del proceso educativo.
6. Evaluación
La evaluación en los procesos abiertos debe ser flexible, formativa y continua de manera que trate de aportar información no sólo de los logros conseguidos por los alumnos, sino de todo el desarrollo del proceso (desde su diseño hasta su implementación) de forma que se produzcan los reajustes oportunos en el momento en el que se requieran.
El desarrollo de la evaluación de tipo cualitativo propia de los procesos abiertos, no implica el seguimiento a ciegas de un plan cerrado, sino que ajustará su metodología a las necesidades que vayan surgiendo en cualquier momento del proceso.
2.2. EL PROCESO DE EVALUACIÓN.
Hemos visto en el apartado anterior que la evaluación tiene un hueco y una misión relevante dentro de los procesos de enseñanza-aprendizaje. En el marco del proceso educativo hemos de señalar que la evaluación juega un papel dinámico, y que es susceptible de ser entendida también como un proceso.
En una revisión realizada por Garanto (1989), en la que se hace referencia a varias definiciones sobre evaluación, se pone de manifiesto el carácter procesual de la misma. Son muchas las definiciones que sobre evaluación encontramos en la literatura desde que Tyler en 1950 formalizara la suya entendiéndola como "el proceso que tiene por objeto determinar en qué medida se han logrado unos objetivos previamente establecidos lo cual supone un juicio de valor sobre la información recogida que se emite al contrastar esta información con los criterios que son los objetivos previamente establecidos en términos de las conductas que el alumno debe exhibir para probar su adquisición".
Stufflebeam en 1971 la define como "el proceso de diseñar, obtener y proporcionar información útil para juzgar alternativas de decisión", resaltando así la utilidad de la información recabada y la vinculación de ésta para la toma de decisiones. En términos similares se pronuncia Pérez Gómez en 1983 al referirse a ésta como "proceso de recogida y provisión de evidencia, sobre el funcionamiento y evolución de la vida del aula, sobre la base de las cuales se toman decisiones sobre la posibilidad, efectividad y valor educativo del curriculum". Crombach en 1963 y Alkin en 1969 estaban en esta misma línea.
De la Orden en 1982 señala que "evaluar hace referencia al proceso de recogida y análisis de información relevante para descubrir cualquier faceta de la realidad educativa y formular un juicio sobre su adecuación a un patrón o criterio previamente establecido, como base para la toma de decisiones". Y también este autor en 1985 entiende la evaluación como..."el proceso o conjunto de procesos, para la obtención y análisis de información relevante en que apoyar un juicio de valor sobre un objeto, fenómeno, proceso o acontecimiento, como soporte a una eventual decisión sobre el mismo. Así pues, en todo acto evaluativo se halla implícito el proceso de cerciorarse del valor de la realidad evaluada según su grado de adecuación (o inadecuación) a una instancia de referencia o criterio".
También Cabrera en 1987, quien ha llevado a cabo un exhaustivo y rico trabajo sobre evaluación educativa, después de revisar muchas otras definiciones, propone una más comprehensiva en la que también se resalta el carácter procesual de la evaluación: "la evaluación educativa es el proceso sistemático de obtener información para describir, sea algún elemento, sea el proceso, sean los resultados educativos, con objeto de emitir un juicio sobre los mismos, según su adecuación a unos criterios previamente establecidos, y todos ellos en orden a servir de base para una eventual decisión educativa".
Es evidente el consenso que existe entre todos los estudiosos a la la hora de entender la evaluación como un proceso. Sin embargo, lamentablemente este consenso no se mantiene a la hora de determinar cómo debe realizarse el proceso y cuáles serán sus fases.
La división paradigmática a la que venimos aludiendo también se refleja en este aspecto de la evaluación.
Hay que señalar que el proceso de evaluación es entendido de forma distinta por cada uno de los autores que han formulado modelos sobre la misma. Y no sólo esto, también debe señalarse que cada diseño de evaluación, adaptable a cada contexto en particular, exige un diseño adaptado a las circunstancias. Teniendo en cuenta lo señalado, podemos aventurarnos a señalar lo esencial del proceso, por un lado, como lo entienden los evaluadores cuantitativistas y, por otro, como lo entienden los evaluadores cualitativistas.
No obstante, es necesario matizar que los partidarios de los métodos cualitativos conforman un conjunto heterogéneo de planteamientos; es más, incluso alguno de ellos llega a considerar que no se puede enfrentar el evaluador a la tarea de evaluar con un plan prefijado, como si existiera un proceso de evaluación tipo aplicable a todas las situaciones. Desde el puno de vista cualitativo, el proceso de evaluación será distinto como distintas serán las situaciones a evaluar.
Siguiendo la propuesta realizada por Medina y Villar (1995), y haciendo eco de la misma distinción que venimos realizando a lo largo de estos apuntes, las propuestas de los paradigmas señalados, en cuanto a la organización del proceso de evaluación, son las siguientes:
2.2.1. Fases en el proceso de evaluación en el enfoque cuantitativo
La valoración de programas con un enfoque cuantitativo requiere un diseño adecuadamente sistematizado y ajustado a los propósitos planteados. De modo general podemos establecer como fases a llevar a cabo las siguientes
1ª Codificación y determinación de las variables a evaluar
Se trata de la reorganización de la información que ya se posea al objeto de hacerla más asequible y manejable: dicha información se estructura generalmente en torno a variables o categorías que van a valorarse; cada una de ellas podrá recibir diferentes estimaciones cuantitativas en distintos ámbitos.
Las variables y los ámbitos de ponderación podrán estructurarse y constituir una matriz de datos. Con la introducción de los ordenadores en el ámbito de la investigación evaluativa. Se está produciendo un importante desarrollo de programas diseñados al efecto, que ofrecen matrices de base para la introducción de datos.
2º La selección de la técnica y de los instrumentos de evaluación
La selección de las técnicas evaluativas a utilizar y los instrumentos a manejar dependerá de aspectos como los siguientes: el tipo de investigación evaluativa que vaya a realizarse; la hipótesis de aprtida que desee comprobarse; la población y muestra de la misma; el grupo de personas a quienes afecta el programa y el tipo de centro educativo en que se ubica dicho programa; y las variables que vayan a utilizarse.
3º Recogida y tratamiento de datos
Una vez elegidos la técnica y los instrumentos de evaluar a emplear, será preciso seleccionar la muestra de la población a que afecta el programa. Tras ello, se procederá al empleo de los instrumentos, que ofrecerán el acopio de datos que constituirán la base de evaluación. Tales datos serán oportunamente recogidos y procesados mediante los procedimientos estadísticos que convenga.
4º Análisis de los resultados
Los datos estadísticos arrojarán una configuración de las variables que fueron definidas a partir de la hipótesis de partida. Estos datos o resultados han de ser oportunamente interpretados de acuerdo con criterios de tipo científico-experimental: Se requerirá. pues una evidencia científico-matemática, de carácter estadístico, de la confiabilidad de los datos, lo que requerirá someterlos a contrastación de tipo cuantitativo.
Con la creciente utilización de los ordenadores han aparecido programas informáticos que facilitan los cálculos estadísticos y que, por tanto, resultan especialmente útiles para la evaluación de tipo cuantitativo. SPSS, BMDP, SYSTAT, etc. Son algunos ejemplos de paquetes estadísticos usuales.
5º Elaboración del informe
Tras la puesta en evidencia de la aceptabilidad científica de los datos obtenidos, será preciso proceder a la interpretación de los mismos. De este modo se llegará a la formulación de las conclusiones que se obtengan como resultado de la evaluación. A partir de aquí los evaluadores procederán a la elaboración del informe, que abarcará la descripción del proceso seguido, los resultados obtenidos, los niveles de confianza de los mismos, y las conclusiones alcanzadas. El informe incluirá, además. Tas propuestas de ratificación. modificación o inclusión que proceda formular sobre el programa analizado.
2.2.2. Fases en el proceso de evaluación en el enfoque cualitativo
Tal como hemos señalado, un rasgo fundamental de la evaluación cualitativa es, precisamente, su flexibilidad. Esta característica afectará, no sólo a los aspectos a considerar como fundamento de la evaluación, sino también a la planificación del proceso mismo. Con todo, resultará de interés tener previstas las principales fases a seguir, y que sintetizamos en torno a las siguientes: Observación generalizada, recopilación de impresiones, intercambio de impresiones y elaboración del informe.
1ª La observación generalizada
La observación generalizada constituirá el punto de partida de la evaluación del programa. Podrá llevarse a cabo sin necesidad de tener un esquema previo excesivamente cerrado. La realidad que vaya apareciendo pondrá de manifiesto los aspectos más relevantes para el mejor conocimiento del programa: serán éstos precisamente sobre los que se concentrará la observación por el evaluador.
2ª La recopilación de impresiones
La recopilación de impresiones seguirá a la observación. Esta fase constituye un apoyo fundamental, ya que han de recogerse las manifestaciones que aparezcan y las impresiones que producen en el observador.
No parece aconsejable sustituir la descripción escrita que realiza el observador por el empleo de instrumentos electrónicos de registro (tales como el magnetófono o el video). Por el contrario, la recogida de las impresiones directamente por el evaluador parece ofrecer mayor riqueza interpretativa (por las apreciaciones de tipo personal que éste formula), junto l mantenimiento de un mayor clima de naturalidad entre las personas objeto de observación.
3º El intercambio de impresiones
El intercambio de impresiones supone la comunicación de las mismas a los implicados en el programa, que tendrán la oportunidad de comentarlas, criticarlas, confirmarlas o someterlas a debate. Este intercambio podrá producirse con quienes estén afectados por el programa (tales como profesores, alumnos, directivos, padres, personal docente, etc.); pero también podrá llevarse a cabo con expertos conocedores del mismo.
En cualquier caso, el cambio de impresiones hará que las apreciaciones iniciales se confirmen, se corrijan, se perfilen o se completen, según proceda, hasta darlas carácter definitivo.
4º La elaboración del informe
La elaboración del informe de evaluación será la fase final. En este informe se incluirán, además de la descripción del proceso seguido, los resultados obtenidos (impresiones definitivas), las conclusiones a las que se haya llegado, y las propuestas que se deriven de lo anterior. Este informe podrá ser, también, sometido a la consideración de los implicados o de profesionales expertos, que lo matizarán antes de llegar a la redacción definitiva.
2.3. FUNCIONES DE LA EVALUACIÓN
De lo mencionado hasta aquí, puede observarse que la evaluación educativa abarca un amplio contexto de objetivos, en ningún modo reducibles a la mera constatación del nivel de rendimiento alcanzado por un alumno. De aquí, como señala García Ramos (1989), que las funciones de la evaluación puedan ser muchas y diversas, incluso coincidentes con algunas de las modalidades anteriormente descritas. Por ejemplo, Scriven en 967, al diferenciar entre evaluación formativa y sumativa, lo que hace es distinguir dos funciones diferentes que debe cumplir la evaluación. Nosotros hemos preferido referirnos a ellas como modalidades.
Por otra parte, la evaluación puede referirse al sistema educativo o a una parte de él, bien a un programa particular o en un centro, o bien a los procesos de enseñanza-aprendizaje de los alumnos (entre otros). La evaluación suministra información acerca del modo en que, de hecho, se desarrolla el curriculum y se alcanzan los objetivos propuestos, información sin duda relevante para profesores, centros y administración educativa. En realidad, la justificación de la evaluación en el ámbito educativo radica en el hecho de que nos permite actuar sobre elementos de las estructuras y del proceso educativo, e incluso sobre los mismos objetivos previamente definidos, para modificarlos a la luz de los resultados. Es decir, como señala De la Orden en 1982, «la evaluación nos permitirá conocer mejor los puntos fuertes y débiles de la enseñanza y del aprendizaje y, en consecuencia, facilitará su corrección y mejoramiento».
La responsabilidad principal de los procesos de evaluación en los centros educativos debe correr a cargo, sin duda, de los profesores de los propios centros. «Los docentes han de evaluar críticamente su trabajo, analizar e identificar situaciones en las que el fracaso, la inadaptación o el bajo rendimiento del estudiante remiten a una disfuncionalidad del proceso educativo o a su propia inadecuación como profesor. Él centro educativo ha de evaluar a los estudiantes sin perder de vista que un fracaso o inadaptación escolar generalizada es, ante todo, fracaso del propio centro escolar y de su proyecto educativo. Los servicios de inspección técnica deben desempeñar funciones que también son en rigor evaluadoras y orientadoras. Los profesores y los centros escolares han de utilizar los resultados de las evaluaciones, tanto los directamente obtenidos con sus estudiantes como los procedentes de evaluaciones externas, como un instrumento critico que permite medir su propio trabajo docente y, cuando sea necesario, rectificarlo en la búsqueda de una práctica pedagógica mejor, más acertada» (Ministerio de Educación y Ciencia, 1987, pág. 149).
Así pues, la evaluación educativa en general y la evaluación del rendimiento de los estudiantes en particular, debe cumplir algunas funciones importantes; entre las que suelen asignársele destacan las siguientes:
a) Función de diagnóstico
Diagnóstico de los distintos aspectos y elementos de la estructura, proceso y producto educativo, es la base de la adaptación de la enseñanza a las características y exigencias concretas de cada situación de aprendizaje y, a través de dicha función, podrá ser posible tomar las medidas correctivas y de recuperación precisas.
b) Función predictiva o de pronóstico
Sin duda alguna, el conocimiento de la situación de partida del estudiante, así como del rendimiento previo demostrado y de las posibilidades/aptitudes del alumno podrá servir de base para que el profesor intente predecir o pronosticar rendimientos y posibilidades futuras del mismo. Dichas estimaciones predictivas podrá realizarlas intuitiva o técnicamente (utilizando modelos estadísticos sencillos sobre ecuaciones de regresión simple o múltiple) pudiendo utilizarlas como base para su orientación personal, académica y profesional.
e) Función orientadora
La evaluación no puede conformarse con ser diagnóstica y predictora de limitaciones y ulteriores posibilidades y rendimientos. Si de hecho «descubre dichas limitaciones y posibilidades, permitirá tomar decisiones de ayuda y/o ayudar al alumno a que él mismo las tome. Programas correctivos específicos, ejercicios adecuados, clases de recuperación, tutoría, son otros tantos elementos para ayudar a superarse, a la vez que se potencian las propias posibilidades» (García Hoz y Pérez Juste, 1984, pág. 69).
Esta función orientadora, como afirman los autores anteriores, probablemente se comprenda mejor por contraposición al tradicional valor selectivo de la evaluación, consistente en discriminar entre los alumnos que «valen» y que «no valen»; el carácter orientador parte de la base de que todos, en cuanto personas, valemos algo y para algo, y a la evaluación y a los evaluadores les corresponde ayudar a cada alumno a descubrir sus propias posibilidades, estimulando su pleno desarrollo.
d) Función de control
Esta función es inherente a la evaluación. A través de ella se asegura el control permanente del progreso educativo del alumno de cara a la información a la familia, a la realización adecuada de las promociones de curso o nivel y, obviamente, a la expedición de títulos y diplomas sobre la base de datos lo más objetivos posibles. La necesidad de conocer en qué medida se logran o no alcanzar los objetivos educativos previstos al programar los procesos de enseñanza-aprendizaje, implica la consideración de la función de control de la evaluación. Lógicamente ésta función no tiene por qué hallarse descarnada de las otras funciones anteriormente mencionadas, es más, debe ir unida a ellas.
En resumen, como ya apuntara De la Orden en 1982, si el núcleo esencial de todo esfuerzo educativo, como es evidente, es el aprendizaje de los alumnos y su facilitación, las anteriores funciones de la evaluación junto a otras posibles como «retroalimentación» del alumno, administración y supervisión, solución de problemas, etc. apuntan directa o indirectamente a la facilitación, mejora y perfeccionamiento del aprendizaje.
BIBLIOGRAFÍA
Casanova, M. A. (1997). Manual de evaluación educativa. Madrid: La Muralla.
Garanto Alós, J. (1989). "Modelos de evaluación de programas educativos". En Abarca Ponce, M. P. (1989). La evaluación de Programas Educativos. Escuela Española: Madrid.
García Ramos, J. M. (1989). Bases Pedagógicas de la Evaluación. Síntesis, Madrid.
Medina Rivilla, A. y Villar Angulo, L. M. Coordinadores (1995). Evaluación de Programas Educativos, Centros y Profesores. Editorial Universitas, Madrid.
Sáenz Barrio, O. Coordinador (1983). Didáctica General. Anaya, Salamanca.