Definición y principales instrumentos.
Un instrumento de evaluación se puede definir como una herramienta que permite establecer una valoración sobre el grado de consecución de los aprendizajes (de forma cuantitativa o cualitativa). |
Así, desde este punto de vista, podemos enumerar los siguientes: cuestionarios (cognitivos), listados de comprobación, registros o escalas observacionales, escalas de valoración o estimación, rúbricas, escalas de actitud.
Vamos a centrarnos en tres instrumentos de evaluación que se utilizan básicamente en la educación no universitaria para valorar realizaciones:
- Listados de comprobación.
- Escalas de valoración.
- Rúbricas.
En el apartado Para saber más se desarrollan con cierta profundidad estos instrumentos y se aproxima a otros derivados, recomendando su lectura para profundizar en evaluación formativa/auténtica.
Listados de comprobación.
Las listas de comprobación (checklists, listas de cotejo) son un instrumento de evaluación de realización muy simple en su estructura, pero con una enorme potencialidad para valorar aspectos muy específicos de conductas o características, siempre desde la observación).
En los siguientes apartados, se describe el instrumento, sus usos principales y qué pasos deben realizarse para diseñarlo.
Definición de listado de comprobación:
Un listado de comprobación es una herramienta de evaluación que sirve para identificar la presencia o ausencia de conocimientos, destrezas o conductas. |
Se caracterizan por una serie de ítems (criterios de realización), que expresan conductas o características, situadas generalmente en una columna. Mientras que en la otra columna están las casillas para rayar o marcar en un recuadro, o similar, los ítems conseguidos.
El siguiente ejemplo es un listado de comprobación para valorar un producto que debía realizar el alumnado, una baraja tipo la de los Pokémon o similar, pero con poliedros y sus características. En este caso no se ha utilizado ningún factor de ponderación, todas las características de la baraja "pesan" lo mismo en la valoración.
Sin embargo, más allá de la calificación, si algo tiene de valor la evaluación es que puede proporcionar tanto al alumnado como al profesorado elementos de juicio sobre cómo y qué aprenden y cómo enseñan respectivamente, y hacia dónde pueden ir encaminados sus siguientes pasos en un proceso de mejora continua. La calificación sólo es una síntesis del logro, que generalmente no está alineada con una descripción homogénea de la competencia adquirida.
Así, los listados de comprobación pueden:
- En un proceso con ítems secuenciados, determinar en qué nivel del proceso se ha quedado un alumno/a (qué destrezas ha adquirido dentro de este proceso y cuáles le faltan para finalizar con éxito).
- En un desempeño que implique destrezas de diferente dificultad, observar que se adquieren unas (las más sencillas) y no otras (las más complejas). Pueden ser de índole cognitiva, psicomotriz, afectivas... Si además las ordenamos en el listado, se verá claramente que la puntuación está alineada con la descripción que podemos hacer de la competencia.
En un desempeño con diferentes secciones o aspectos diferenciados, por ejemplo, destrezas individuales y destrezas de trabajo cooperativo o participación... diferenciar de dónde proviene la calificación y dar información relevante sobre uno u otro aspecto.
Las escalas de valoración.
Las escalas de valoración son un instrumento que se situaría entre un listado de comprobación y una rúbrica:
- Mantiene los criterios de realización (lo que observamos) de manera explícita, igual que los listados de comprobación.
- Se establecen niveles de logro en una escala, siguiendo uno o varios criterios de graduación: frecuencia, intensidad, modo, autonomía..., como lo hacen las rúbricas.
Por lo tanto, a lo largo del desarrollo de este epígrafe se harán continuas referencias a los dos instrumentos anteriormente descritos.
Definición de escala de valoración:
Una escala de valoración es un instrumento para valorar, en un rango definido, el grado de cumplimiento de tareas de realización, niveles de habilidad, procedimientos o procesos, cantidades o cualidades. |
Así, estas tareas de realización, niveles de habilidad... se valoran en un nivel concreto dentro de un rango de valores. Por lo tanto, son similares a los listados de comprobación excepto en que indican el grado de cumplimiento, en lugar de señalar si se cumple o no se cumple (sí/no).
Dicho de otra manera, las escalas de valoración añaden un elemento más a los listados de comprobación: la escala por la que se valorarán los diferentes criterios de cumplimiento (o realización, es decir, lo que observamos). En este caso, los criterios de realización no pueden valorarse en términos de realiza/no realiza porque admiten grados en función de alguna calidad:
Ejemplos:
- Frecuencia: siempre, casi siempre, a veces, nunca
- Autonomía: sin apoyos, con apoyos puntuales, con apoyos frecuentes...
- Cumplimiento: completamente, en parte, sin realizar...
- ...
A veces la escala simplemente permite puntuar el criterio de realización (indicadores de logro, es decir, lo que observamos) sin la guía de la calidad que se pretende observar, aunque no es aconsejable. En otras ocasiones, puede darse el caso de que tengamos diferentes cualidades a tener en cuenta: frecuencia, autonomía... en diferentes criterios de realización. Debemos procurar redactar los criterios de realización para intentar manejar sólo una de estas cualidades y mantener la homogeneidad de la escala.
Cuando se trata de frecuencias, suele ser habitual señalar el rango de cada nivel. Por ejemplo, Escribe la receta dadas las normas de ortografía (Ortografía): Siempre (0 a 5 faltas de ortografía); A veces (6 y 10 faltas de ortografía); Nunca (Más de 10 faltas de ortografía).
Estructura de una escala de valoración:
En una escala de valoración los criterios de realización van en una columna y el rango de cumplimiento con palabras descriptivas, con o sin números, en otras columnas. Estas otras columnas forman "la escala" y como se ha comentado pueden indicar un rango de logro, de acuerdo, de frecuencia, de autonomía, de motivación... En muchas ocasiones los criterios de realización se sustituyen por atributos (etiqueta que “resume” esos criterios), pero sólo es aconsejable si se tiene claro qué hay detrás de cada atributo, es decir, el criterio de realización.
Usos principales:
En cuanto a sus usos principales las escalas de valoración son un instrumento que se alinea con los dos anteriormente descritos. Son una buena herramienta para evaluar realizaciones y proporcionar feedback al alumnado sobre qué aspectos deben mejorar en función de un criterio o calidad determinada.
También puede ser un excelente instrumento para que lo elaboren los propios estudiantes y que lo utilicen como herramienta de coevaluación y autoevaluación según lo requiera la situación. En los últimos años se están desarrollando por parte de docentes escalas de valoración que incorporan diferentes elementos visuales que facilitan y motivan al alumnado en la labor de evaluación a sus compañeros o la autoevaluación: dianas de evaluación, estrecheces, likes, acelerizos, semáforos, uso de emoticonos... Son todo versiones de escalas de valoración.
Diana de evaluación para evaluar el trabajo en equipo. Autoría: Proyecto Aprender (CC BY-NC-SA)
Independientemente del atractivo de estas herramientas, en el fondo se debe procurar que estén diseñadas de manera que lo importante, los criterios de realización, o los atributos, estén bien alineados con el currículo y con el contexto de realización de la actividad.
Rúbricas
Analizaremos este elemento con la misma estructura que en los apartados anteriores:
Definición:
Una rúbrica es un instrumento de valoración que utiliza, de forma graduada, la descripción cualitativa de los criterios de realización de una tarea o actividad compleja a evaluar. |
Dejando la cuestión estrictamente léxica y centrándonos en la cuestión pedagógica, en diferentes libros, artículos y otro tipo de documentos que tratan las rúbricas, suelen aparecer diferentes definiciones. La rúbrica requiere de algunas características más específicas, como se verá más adelante.
Contextos de aplicación:
Se parte de la idea de que las rúbricas no son el único instrumento de evaluación posible y válido en el ámbito de la evaluación de los aprendizajes. Son especialmente útiles en contextos de aprendizaje auténticos, de desarrollo de competencias, de evaluación de realizaciones. En concreto en la evaluación de:
- Conocimientos en forma de procedimientos.
- Habilidades de alto nivel (pensamiento crítico, analítico o creativo).
- Desarrollo de hábitos sociales.
- Habilidades de trabajo cooperativo.
- Conductas en procesos de toma de decisiones...
En referencia a la evaluación de desempeños, por ejemplo, existen otras alternativas como la lista de comprobación o las escalas observacionales, quizás más apropiadas cuando la información a registrar se limita a la determinación de si se cumple o no con unos criterios específicos. De hecho, es útil empezar a diseñar redactando unos buenos criterios de realización (indicadores de logro, es decir, lo que observamos), una lista de comprobación o una escala y, posteriormente, evolucionarlos a una rúbrica.
En el siguiente esquema se hace una clasificación de los diferentes tipos reconocidos para la evaluación de realizaciones (performance assessment), y las rúbricas se sitúan como una especie de escala o guía de valoración. La explicación sobre el tipo de rúbricas (analíticas u holísticas) se dará en la siguiente sección.
Elementos constituyentes
Los elementos que conforman una rúbrica se presentan en la siguiente gráfica:
NOTA: en la rúbrica holística, que trataremos en la siguiente sección, suele desaparecer el elemento de ponderación y los criterios de realización y atributos están implícitos en la descripción de los niveles de consecución.
Tipologías y usos
Habitualmente se suele hacer una clasificación de las rúbricas atendiendo a cómo consideran la evaluación de la realización o tarea, si como un todo o atendiendo a sus características específicas, de una en una. Según esta clasificación, distinguimos dos tipos:
- Rúbrica analítica.
- Rúbrica holística.
Rúbricas
Rúbrica analítica.
En las rúbricas analíticas, los criterios de realización con sus atributos se evalúan en diferentes niveles de desempeño proporcionando una descripción para cada uno de ellos. Cada atributo recibirá una puntuación por separado, aunque también puede obtenerse con propósitos sumativos una puntuación global de la realización o actividad.
La principal ventaja en el uso de estas rúbricas es que proporciona tanto a los estudiantes como al docente una imagen muy clara de por qué se obtiene una determinada puntuación y se detecta mejor qué partes del desempeño requieren de una revisión por parte de todos. Su función es diagnóstica y con propósitos claramente formativos (es decir, son ideales para el proceso, y no tienen necesariamente que reflejar una calificación referida a criterios de evaluación). No obstante, para crearlas se necesita mucho tiempo y su uso en la práctica de la evaluación requiere mucha destreza, especialmente en desempeños que se evalúan en el mismo momento de su realización.
Ejemplo:
Rúbrica elaborada para la Unidad Didáctica Integrada: "Conocemos nuestro barrio" (6º Ed. Primaria). Publicada en: AA.VV. (2016). Unidades Didácticas Integradas para la Inclusión: Valencia: Generalidad Valenciana. (enlace).
Rúbricas
Rúbrica holística.
Cuando se da la superposición de criterios o son criterios muy asociados, es mejor utilizar este tipo de rúbrica. Los criterios se consideran en combinación en una sola escala descriptiva. Apoyan valoraciones más amplias sobre la calidad del proceso o del producto. Una valoración holística puede también formar parte de una analítica como un factor más, aunque este tipo de métodos tiene la dificultad de sobreponer los criterios de la rúbrica holística a los demás.
Su uso resulta más práctico, más rápido que las rúbricas analíticas. No obstante, al proporcionar una valoración global del desempeño se pierden detalles específicos y su uso formativo está limitado, al contrario que las analíticas. Así, se usan preferiblemente en evaluaciones con propósito sumativo. También dada su limitada escala de puntuación este uso sumativo se circunscribe casi al hecho de proporcionar una calificación (excelente, notable, bien...) o nivel de consecución o certificación, más que una puntuación.
La comunidad autónoma andaluza sitúa aquí la valoración de los criterios de evaluación. De forma global describiremos el nivel de logro de ese criterio. Para poder valorar en qué nivel sitúo a cada alumno/a, diseñaré qué evidencias son las más adecuadas y sus indicadores; finalmente, con esa información, calificaré el criterio de evaluación.
Estas rúbricas holísticas son adecuadas para la valoración de los criterios de evaluación de una situación de aprendizaje.
En la rúbrica holística los niveles suelen aparecer delimitando las filas y los criterios de realización y sus atributos se combinan para proporcionar una descripción para cada uno de estos niveles.
Ejemplo
Rúbrica elaborada para la Unidad Didáctica Integrada: "Conocemos nuestro barrio" (6º Ed. Primaria).Publicada en: AA.VV. (2016). Unidades Didácticas Integradas para la Inclusión: Valencia.
Generalidad Valenciana. (enlace).