top of page

Inteligencia artificial y aprendizaje: ĀæquĆ© hacemos con la evaluaciĆ³n?

Foto del escritor: Pedro RavelaPedro Ravela

El problema de la IA en tĆ©rminos de evaluaciĆ³n de aprendizajes se puede plantear desde tres perspectivas diferentes: i)Ā la autorĆ­aĀ de los trabajos en evaluaciones con fines de certificaciĆ³n; ii) el papel de las evaluaciones como parte del proceso de aprendizaje; iii) el contenido de las consignas de evaluaciĆ³n. Mi intenciĆ³n en este post es profundizar la tercera perspectiva analizando los tipos de producciones que genera la IA y sus similitudes con las que produce un estudiante medio que se las arregla para sobrevivir en el sistema educativo.

IlustraciĆ³n de una joven con auriculares y sĆ­mbolos alrededor

Hace algo mĆ”s de dos aƱos la Inteligencia Artificial irrumpiĆ³ en el escenario con mucha fuerza -y con mucha propaganda, tanto de quienes hacen dinero con ella como de quienes se entusiasman rĆ”pidamente con las modas-. Como toda nueva tecnologĆ­a, la IA trae consigo una gran cantidad de oportunidades, pero tambiĆ©n conlleva riesgos. Es todavĆ­a muy pronto para saber quĆ© grado de integraciĆ³n tendrĆ” en el sistema educativo. Muchas tecnologĆ­as, como la televisiĆ³n educativa o la enseƱanza asistida por computadora, en su momento prometieron revoluciones que nunca ocurrieron. Otras, como la escritura, se incorporaron en forma definitiva a la prĆ”ctica educativa.


En lo inmediato uno de los principales problemas que la IA plantea a los educadores estĆ” vinculado con la evaluaciĆ³n, ya que puede realizar una enorme variedad de trabajos que habitualmente pedimos a nuestros alumnos. Muchos estudiantes, tanto en la educaciĆ³n terciaria como secundaria, han comenzado a utilizar la IA para que realice tareas por ellos. ĀæQuĆ© podemos hacer al respecto? ĀæCĆ³mo haremos para saber si un estudiante trabajĆ³? ĀæTendremos que dedicarnos a tareas detectivescas para descubrir si un trabajo fue hecho por el alumno o por la IA?


En realidad no se trata de un problema nuevo sino tan viejo como los exĆ”menes: la copia, fraude o plagio utilizando medios inapropiados para resolver las tareas es algo que siempre existiĆ³.


Cuando comencĆ© a trabajar como profesor, hace ya varias dĆ©cadas, no existĆ­an los telĆ©fonos celulares ni las computadoras personales. El problema era la copia. Las evaluaciones solĆ­an consistir en responder preguntas, resolver ejercicios o generar textos escritos tipo ensayo (en asignaturas como Literatura, FilosofĆ­a o Historia). Los alumnos recurrĆ­an a apuntes escondidos (textos, fĆ³rmulas, propiedades) para ayudarse en sus respuestas. En Uruguay se los denominaba ā€œtrencitoā€, en Argentina y Colombia ā€œmacheteā€, en Chile ā€œtorpedoā€, en MĆ©xico ā€œacordeĆ³nā€ y en EspaƱa ā€œchuletaā€. Otra forma de copia era simplemente mirar el trabajo de un compaƱero que estuviese sentado cerca.


Ante estas situaciones los docentes tenĆ­amos dos posibilidades de respuesta.


Una era la vigilancia. Las mesas debƭan estar despejadas, no se podƭa tener cuadernos ni materiales a la vista, el docente observaba a los estudiantes en forma amenazadora para detectar el uso del trencito mientras trabajaban -que solƭa estar escondido en la manga o entre las piernas-. Se proponƭan tareas diferentes a los alumnos sentados en filas de asientos contiguas, para que no pudiesen mirar lo que hacƭan los demƔs.


La otra vĆ­a de respuesta era modificar las consignas. Reemplazamos las tareas que podĆ­an hacerse copiando por otras que requiriesen elaboraciĆ³n o reflexiĆ³n personal por parte de los alumnos y que pudiesen ser realizadas con ā€œcuaderno abiertoā€. Los ejercicios de aplicaciĆ³n de fĆ³rmulas se reemplazaban por problemas mĆ”s complejos que implicasen desarrollar una estrategia de resoluciĆ³n. En muchos casos los exĆ”menes fueron sustituidos por trabajos integradores, proyectos o tesinas.


El problema es que la IA puede hacer muchĆ­simas cosas y de manera muy similar a lo que hacemos las personas. Puede escribir informes, poesĆ­a, responder preguntas, resolver ejercicios matemĆ”ticos, crear ilustraciones y videos, y componer mĆŗsica, entre otras muchas. Para los lectores que no han experimentado cĆ³mo funciona la IA dejo algunos ejemplos y enlaces.


En suno.com se puede acceder a una herramienta gratuita de composiciĆ³n musical. En el portal de ingreso hay ejemplos de producciones musicales generadas por IA. RegistrĆ”ndose se puede utilizar la herramienta en forma gratuita -hasta 10 canciones por dĆ­a-. A partir de instrucciones sencillas tales como "crea una canciĆ³n pop sobre el cuidado de la naturalezaā€, en poco mĆ”s de un minuto la IA genera dos canciones con la misma letra y tĆ­tulo, cada una con sus voces y melodĆ­a, asĆ­ como una imagen de portada. A partir de allĆ­ uno puede elegir la que le gusta mĆ”s, agregar versos a la letra, modificar el tĆ­tulo. TambiĆ©n se puede pedir una composiciĆ³n totalmente instrumental, o darle los versos a la IA y pedirle que genere la melodĆ­a. Dejo aquĆ­ un ejemplo:

Un arroyo entre montaƱas

No digo que sea una producciĆ³n de calidad pero el resultado parece razonable. Creo que podrĆ­a valer como producciĆ³n de un estudiante de secundaria ante una tarea solicitada por el docente. Tal vez tambiĆ©n como inspiraciĆ³n inicial en un proceso de composiciĆ³n musical.


La IA tambiĆ©n puede escribir libros completos. La siguiente noticia es un ejemplo potente de lo que es capaz de hacer: Amazon tuvo que limitar la cantidad de libros que un autor puede autopublicar cada dĆ­a. Esta empresa tiene un servicio que permite que cualquier persona pueda subir el texto de un libro, diagramarlo en lĆ­nea y publicarlo para la venta en formato electrĆ³nico a travĆ©s de la plataforma. El problema es que comenzaron a inundarse de libros escritos mediante IA. De allĆ­ que tuvieron que limitar la cantidad de libros que una misma persona puede publicar en un dĆ­a . El que ese lĆ­mite sea de 3 por dĆ­a indica la velocidad con que la IA puede generar los textos. No me he tomado el trabajo de leer alguno de esos libros. Imagino que deben ser de baja calidad, pero que para un lector poco atento tal vez pueden pasar por originales.

Una sala con robots escribiendo en ordenadores

Un Ćŗltimo ejemplo fue generado en el marco de un Taller sobre evaluaciĆ³n de aprendizajes con docentes de la Universidad TecnolĆ³gica de Uruguay. Un colega, profesor de MatemĆ”tica, habĆ­a solicitado a sus estudiantes la realizaciĆ³n de un trabajo sobre funciones exponenciales, logarĆ­tmicas y radicales, entre otras. Los estudiantes debĆ­an explicar cada funciĆ³n, indicar su rango y dominio, explicar cĆ³mo se calculan, representarlas grĆ”ficamente y dar dos ejemplos de cada una. La tarea debĆ­a ser realizada en equipos a lo largo de una semana y tenĆ­a una finalidad tanto formativa como de certificaciĆ³n. En el marco del Taller le dimos la consigna al Chat GPT y generĆ³ el trabajo que sigue (comparto solo un extracto por razones de espacio).

Un texto generado por Chat GPT

El problema de la IA en tĆ©rminos de evaluaciĆ³n de aprendizajes se puede plantear desde tres perspectivas diferentes.


1. la perspectiva de la autorĆ­a de los trabajos en evaluaciones con fines de certificaciĆ³n;

2. la perspectiva del papel de las evaluaciones como parte del proceso de aprendizaje;

3. la perspectiva del contenido de las consignas de evaluaciĆ³n.


Mi intenciĆ³n en este post es profundizar la tercera perspectiva analizando los tipos de textos que produce la IA.


El primer aspecto no es nuevo y se resuelve estableciendo mecanismos para garantizar que el estudiante sea quien hace el trabajo y que utilice los recursos que el docente defina como vĆ”lidos. Requiere bĆ”sicamente la realizaciĆ³n presencial de la evaluaciĆ³n, o la realizaciĆ³n en lĆ­nea con mecanismos de control de las condiciones de realizaciĆ³n -a quĆ© recursos tiene acceso el estudiante mientras trabaja frente a la pantalla-. TambiĆ©n en el pasado era necesario verificar la autorĆ­a de un proyecto o tesis por parte del estudiante, a travĆ©s de una presentaciĆ³n oral o de una entrevista en torno a su trabajo. En todo caso, es un problema que requiere, o bien una soluciĆ³n tecnolĆ³gica de vigilancia, o bien una instancia de conversaciĆ³n individual.


El segundo aspecto del problema es mĆ”s complejo. El uso inadecuado de la IA para realizar tareas que tienen una finalidad formativa, atenta contra al aprendizaje. Al no hacer el intento de escribir un texto, explicar las funciones o componer una canciĆ³n por sĆ­ mismo, el estudiante pierde la oportunidad de aprender. Este aspecto del problema nos remite a un desafĆ­o crucial de la labor educativa: la motivaciĆ³n de los estudiantes para aprender lo que intentamos enseƱarles.


Durante la pandemia muchos maestros planteaban el problema de que las mamĆ”s y papĆ”s hacĆ­an la tarea por los niƱos en sus casas y los niƱos no aprendĆ­an. Al respecto mi devoluciĆ³n era, primero, pensar por quĆ© el niƱo no quiere hacer la tarea. Porque no le interesa, porque no le resulta atractiva, porque no conecta con su persona. Nada nuevo bajo el sol. Cuando estĆ”n en el aula sucede lo mismo, muchos alumnos se desconectan, pero hacen ā€˜como que estĆ”n trabajandoā€™. Mi segunda devoluciĆ³n era: si la familia hace la tarea por el niƱo es porque se ha desvirtuado el sentido de la educaciĆ³n. La familia estĆ” preocupada por la calificaciĆ³n del niƱo, no por su aprendizaje. Estos no eran problemas de la pandemia, sino educativos. La pandemia simplemente los puso de manifiesto.


Con la IA ocurre algo parecido. Pone de manifiesto problemas de nuestras propuestas educativas. El uso inapropiado de la IA en tareas que tiene carĆ”cter formativo -no en las de certificaciĆ³n- reflejan el desinterĆ©s del estudiante por lo que le estamos proponiendo que aprenda. Es un problema viejo agudizado por un nuevo recurso tecnolĆ³gico. La Ćŗnica soluciĆ³n para esto es trabajar la motivaciĆ³n interna de los estudiantes, proponer tareas que quieran resolver y, en todo caso, discutir con ellos cĆ³mo utilizar la IA como herramienta de apoyo. La cuestiĆ³n es cambiar el sentido del "juego": pasar de ā€˜hago tareas para aprobarā€™ a ā€˜hago tareas porque me quiero resolverlas y me interesa aprenderā€™.


El tercer aspecto del problema, el contenido de las consignas, implica preguntarse quĆ© es lo que realmente estamos evaluando a travĆ©s de las tareas que proponemos a los estudiantes. ĀæQuĆ© se requiere para resolverlas? Si la IA la puede hacer, tal vez la tarea no valga mucho la pena como demostraciĆ³n de aprendizaje. La situaciĆ³n es similar a la que tenĆ­amos hace unas dĆ©cadas con la copia. Si la pregunta podĆ­a ser respondida con un trencito, tal vez no valiese la pena como pregunta para evaluar aprendizaje. Depende de quĆ© esperamos que sean capaces de hacer los estudiantes: recordar o comprender, repetir o pensar.


(Entre parĆ©ntesis, soy consciente de que para reflexionar es necesario apropiarse de conceptos e ideas y recordarlas. No pretendo hacer un planteo dicotĆ³mico. El problema se produce cuando las preguntas solamente requieren recordar y repetir).


Cuando apareciĆ³ la IA una de las primeras pruebas que hice para ver de quĆ© se trataba fue formularle esta pregunta: ĀæQuĆ© diferencias y semejanzas hay entre Platon y Aristoteles? Una pregunta pobre pero plausible en un curso de FilosofĆ­a en la educaciĆ³n media. La respuesta que obtuve fue propia de un estudiante medio de secundaria que se las arregla para sobrevivir aunque no comprenda mucho, combinando frases y conceptos de manera mĆ”s o menos aceptable aunque no entienda del todo de que estĆ” hablando.

Un texto generado por Chat GPT

El texto resultante es un conjunto de afirmaciones correctas pero insustanciales. El resumen o conclusiĆ³n es de una enorme banalidad. No estĆ” mal, pero no dice nada.


La Inteligencia Artificial no piensa y no comprende. Adivina. No hay magia en sus producciones, hay un algoritmo matemĆ”tico probabilĆ­stico. Es un gran copiador y adivinador de cĆ³mo combinar las palabras. En ese sentido se parece a un alumno de secundaria.Y, como un estudiante de secundaria, cuando no sabe, inventa!:

Un texto generado por Chat GPT

(Nota: el INEED es el Instituto Nacional de EvaluaciĆ³n Educativa).


Obviamente, la IA tiene dos ventajas sobre los estudiantes y sobre los humanos en general: la cantidad inmensa de informaciĆ³n que puede procesar y la velocidad a la que puede combinar frases y palabras. Pero no piensa!


El problema de fondo es el carĆ”cter impersonal de muchos de los textos que escriben nuestros estudiantes. Como docente en cursos de posgrado y maestrĆ­a me suele resultar tedioso leer textos de estudiantes que se limitan a citar y parafrasear autores, que no esbozan una reflexiĆ³n original y que no dicen nada personal. Los estudiantes transcriben autores e ideas sin lograr construir un hilo conductor ni comunicar un pensamiento. Se acostumbran a enunciar las ideas de otros antes que a pensar por sĆ­ mismos. Su preocupaciĆ³n estĆ” mĆ”s centrada en demostrar que ā€œsabenā€, que en comprender y reflexionar a partir de los textos.


En el trabajo de un grupo de colegas del Instituto de FormaciĆ³n Docente de San RamĆ³n, con quienes tuve la valiosa oportunidad de colaborar, se enfatiza la construcciĆ³n de sentido en el aprendizaje.

Hablamos de sentido cuando lo pedagĆ³gico ā€œtocaā€ de un modo imprevisible algo que es importante para el que aprende y le aporta cierta luz para ver algo nuevo, o algo viejo con otra perspectiva. El aprendizaje tiene sentido cuando las palabras del educando son ā€œpalabras propiasā€, es decir, no son ā€œdeclamadorasā€, no son clichĆ©.

Cuando el pensamiento se separa de los problemas se transforma en clichĆ©, en palabra muerta, palabra que, como dice Freire, (Freire, 1970/2005, p. 66), es pura sonoridad, palabra que resuena y no dice nada. Un clichĆ© es una palabra sin sentido, una palabra muerta que fue separada de los problemas y, por eso mismo, del sentido (LoĢpez, M. 2008, p. 69).

Algo tiene sentido para quien aprende cuando hay un movimiento interior que le permite conectar aquello que le estƔn enseƱando con sus propias ideas, experiencias y emociones.


Los textos que produce la IA son similares a los estudiantiles, por impersonales. Hablan pero no dicen. La IA puede producir textos gramaticalmente correctos, pero que no tienen significado profundo. Van dos ejemplos adicionales de textos producidos por la IA sobre Ć©tica en la profesiĆ³n docente y sobre la tradiciĆ³n pedagĆ³gica en Uruguay.


Ā 
Un texto generado por Chat GPT
Ā 
Un texto generado por Chat GPT
Ā 

El problema, en buena medida, se origina en las consignas de evaluaciĆ³n que proponemos. La respuesta a la consigna sobre PlatĆ³n y AristĆ³teles no tiene reflexiĆ³n, en buena medida porque la pregunta no es buena. La cuestiĆ³n clave no es tanto que la IA pueda responderla, sino si la pregunta vale la pena como demostraciĆ³n de aprendizaje de la FilosofĆ­a.


Con o sin Inteligencia Artificial, necesitamos volver a pensar en nuestras consignas de evaluaciĆ³n y en los tipos de textos que pedimos a los estudiantes. AsĆ­ como hace mucho tiempo pasamos de las preguntas "de reproducciĆ³n" a los trabajos ā€œde elaboraciĆ³nā€, ahora deberĆ­amos preguntarnos acerca del carĆ”cter personal o impersonal de los textos que pedimos a los estudiantes. Necesitamos pensar en consignas que requieran apropiaciĆ³n y escritura personal, que impidan evadirse de la autorĆ­a, que requieran decir una palabra propia, en el sentido de Freire, que impliquen conectar con el conocimiento acumulado por la humanidad desde la propia experiencia interior.


Vivimos en una cultura en la que el sentido se pierde. Leemos todo el tiempo en los dispositivos electrĆ³nicos, pero es difĆ­cil encontrar textos valiosos, que digan algo del autor. Las noticias y buena parte de la informaciĆ³n que circula por Whatsapp y las redes sociales, los sitios web y los blogs, rebosan de contenido chatarra, ahora generado por Inteligencia Artificial. La llamada ā€œcreaciĆ³n de contenidosā€ suele ser mĆ”s bien una recopilaciĆ³n y combinaciĆ³n de otros textos, lo que tradicionalmente llamamos ā€œrefritosā€. La educaciĆ³n deberĆ­a ser un Ć”mbito para propiciar la producciĆ³n personal -y para aprender a identificar el contenido chatarra-.


Alan Turing fue el precursor de la Inteligencia Artificial. En los aƱos 50 del siglo pasado propuso un test para decidir si una mƔquina podƭa ser considerada inteligente. La prueba consistƭa en analizar conversaciones escritas entre un humano y una mƔquina. Esta serƭa considerada inteligente si un observador externo no podƭa distinguir acertadamente entre las respuestas del humano y las de la mƔquina. Es decir, una mƔquina puede ser considerada como inteligente si es capaz de dar respuestas similares a las de un ser humano.


PodrĆ­amos pensar en una especie de Test de Turing a la inversa: una tarea de evaluaciĆ³n no tiene mucho valor como prueba de aprendizaje si la IA la puede responder por sĆ­ sola, sin intervenciĆ³n humana. Una tarea de evaluaciĆ³n tiene valor cuando la intervenciĆ³n personal del estudiante es indispensable para realizarla. Inteligencia artificial y aprendizaje pueden ir de la mano cuando las consignas de trabajo son apropiadas. En mi prĆ³ximo posteo me enfocarĆ© en los usos razonables de la IA en el aula y en la evaluaciĆ³n.

Un joven trabajando frente a un conjunto de controles y ordenadores













Ā©2022 por Pedro Ravela. Creada con Wix.com

bottom of page