Le pedí a Claude que corrigiera un Writing del IELTS: esto es lo que pasó — y lo que me enseñó sobre las 4D - Blog | MisterRaul

El experimento

Uno de mis estudiantes tomó uno de sus propios Writing Task 2 del IELTS — uno real, con nivel B2 alto — y se lo pasó a Claude con una instrucción simple: "Corrígeme este writing del IELTS".

El resultado llegó en ocho segundos. Cuatro párrafos de feedback, comentarios por criterio, sugerencias de vocabulario, observaciones sobre la cohesión. Todo presentado con una claridad que, honestamente, haría quedar bien a más de un profesor.

Y ahí empezó el problema. No con el feedback de Claude — sino con lo que yo hubiera hecho con ese feedback si hubiera sido el estudiante.

Lo que Claude hace bien

Seamos honestos: Claude, como muchos modelos de IA como ChatGPT o Gemini, es sorprendentemente capaz de evaluar un Writing del IELTS si sabes cómo pedírselo.

Identifica problemas de vocabulario repetido. Detecta cuando la respuesta no aborda directamente el prompt. Señala conectores mal usados, oraciones que pierden el hilo, y a veces incluso nota cuando el registro no es el correcto para una tarea académica.

Si le especificas previamente que debe usar los criterios propios de la rubrica de evaluación del IELTS — Task Achievement, Coherence and Cohesion, Lexical Resource, Grammatical Range and Accuracy — organiza su feedback en torno a ellos con bastante precisión.

Nada de eso es menor. Es genuinamente útil.

Lo que Claude no puede hacer por ti

Aquí está la parte que importa.

Claude puede decirte que tu introducción "no reformula la instrucción de la tarea de forma efectiva". Pero no puede saber si entiendes por qué eso importa. No puede saber si la próxima vez que te sientes a escribir vas a recordar esa observación, o si simplemente vas a aceptar su versión corregida y seguir adelante sin haber procesado nada.

Y eso, en términos de aprendizaje real, es la diferencia entre todo y nada.

Las 4D como lente para entender qué está pasando

El Marco de las 4D de Anthropic — Delegar, Describir, Discernir, Diligencia — no es solo un marco para enseñar IA en el aula. Es también una forma muy concreta de analizar qué estás haciendo tú como estudiante cuando le pides a Claude que corrija tu writing.

Delegar: La primera pregunta es qué tiene sentido delegar aquí. ¿El feedback inicial? Probablemente sí — es una tarea de análisis repetible que Claude hace bien y que ahorra tiempo. ¿La comprensión de ese feedback? No. ¿La decisión de qué cambiar y por qué? Tampoco. Si un estudiante delega esas dos últimas partes — acepta los cambios sin entenderlos — no está usando IA como apoyo. La está usando como reemplazo. Y el examen lo va a notar cuando no puedas autoevaluar tus propios procesos de escritura antes de entregar la prueba.

Describir: El prompt que usé al principio — "corrígeme este writing" — es exactamente el tipo de instrucción vaga que produce resultados vágos. Claude me dio feedback general porque eso fue lo que le pedí. Cuando reformulé la instrucción — "evalúa este Writing Task 2 usando los cuatro criterios oficiales del IELTS, señala los dos problemas más críticos por criterio y explica por qué afectan el puntaje" — el feedback cambió completamente. Se volvió accionable. Para describir bien una instrucción como esa, primero tienes que entender qué evalúa el IELTS. Lo que nos lleva al punto siguiente.

Discernir: Esta es la D más exigente, y la que más trabajo requiere en el contexto del IELTS. Claude cometió un error en su evaluación del writing que usé como ejemplo: señaló un problema de "coherencia" en un párrafo que en realidad estaba bien estructurado — el modelo confundió una transición deliberadamente concisa con una falta de desarrollo. Un estudiante que no conoce, ni entiende, la rúbrica no tiene forma de detectar ese error. Lo acepta como verdad y potencialmente corrige algo que no necesitaba corrección. Discernir el output de un modelo requiere conocimiento previo del dominio. No hay atajo para eso.

Diligencia: El feedback de Claude es un punto de partida, no un destino. El trabajo real empieza después: reescribir el párrafo con conciencia de lo que se está cambiando y por qué, comparar la versión original con la revisada, practicar el mismo tipo de estructura en un contexto diferente. Si el estudiante recibe el feedback, acepta la versión corregida de Claude, y cierra el documento, hizo exactamente lo mismo que copiar una tarea: obtuvo un output sin pasar por el proceso, e incluso cuestionar al modelo de inteligencia artificial si estás en desacuerdo con la respuesta que propone.

Entonces, ¿sirven modelos como Claude, ChatGPT, o Gemini para prepararse para el IELTS Writing?

Sí. Con condiciones.

Sirven como primer lector cuando no tienes a nadie disponible. Sirven para identificar patrones de error que se repiten en distintos textos. Sirven para practicar el ejercicio de leer feedback y decidir qué es válido y qué no. Sirven para generar variantes de una misma oración y comparar cuál funciona mejor.

No sirven como reemplazo de un profesor que conozca la rúbrica, que sepa leer tu nivel real, y que pueda decirte qué priorizar según el tiempo que te queda antes del examen. Y no reemplazan tu propio criterio para autoevaluar tu desempeño de forma crítica e informada.

Las 4D no son una advertencia contra usar IA. Son un recordatorio de que la herramienta no reemplaza el pensamiento — lo amplifica.

Si quieres prepararte para el IELTS con un enfoque que combine recursos tecnológicos, metodologías basadas en evidencia teorías actuales, y acompañamiento real, revisa mis servicios de preparación de exámenes internacionales de inglés. Y si tienes dudas sobre en qué punto está tu Writing específicamente, escríbeme — podemos evaluar juntos tu nivel actual.