Como funcionan los modelos de lenguaje, por que cambian todo, y los desafios eticos que debemos enfrentar.
70 anos de historia. Lo que cambio fue la escala, el dato y el computo. Hoy la IA esta en tu celular, en las plataformas que usas, y proxima a cada obra que construimos.
Cada invierno de la IA fue seguido de un salto mayor. El patron: acumulacion silenciosa de datos y computo, luego explosion.
Selecciona un evento de la linea de tiempo.
Antes de procesar texto, el modelo lo fragmenta en tokens: trozos de sub-palabra con un ID numerico. No son palabras exactas ni letras. Regla practica: 1 token ≈ 4 caracteres ≈ 0,75 palabras en ingles; en espanol suele ser algo mas.
La ventana de contexto es cuanta informacion (en tokens) puede considerar el modelo de una sola vez. Determina si cabe un contrato completo, varias bases tecnicas o solo un parrafo.
tokens en modelos actuales. 128.000 tokens ≈ un libro de ~300 paginas. Aun asi, hay limite: la memoria no es infinita.
Tu prompt son tokens de entrada; la respuesta, tokens de salida. Ambos cuentan para el limite y para el costo.
Si la conversacion supera la ventana, los tokens mas antiguos salen del contexto. El modelo no los "recuerda" salvo que se los repitas.
Subir las bases tecnicas + el contrato + 3 estados de pago puede sumar 60.000 tokens. Si tu modelo tiene 128K de ventana, cabe y puede compararlos. Si pegaras 10 expedientes completos, excederias el limite y el modelo perderia los primeros: conviene resumir o trocear.
Cada token se mapea a miles de numeros (un vector). Esos numeros capturan el significado. Palabras similares quedan cerca en ese espacio.
Las relaciones semanticas se calculan aritmeticamente. Esto da al modelo su capacidad de razonamiento por analogia.
Proyeccion 2D de 4.096 dimensiones
Selecciona una palabra arriba
Para cada token, el modelo calcula cuanto debe "atender" a cada otro token del contexto. Esto le permite conectar palabras distantes.
Click en cualquier palabra
Cada cabeza aprende a detectar un tipo distinto de relacion: sujeto-verbo, pronombre-referente, adjetivo-sustantivo. Se combinan para una representacion rica.
Las primeras capas captan sintaxis. Las intermedias semántica. Las ultimas, razonamiento abstracto.
Para cada posicion el modelo calcula probabilidades sobre todo el vocabulario. No memoriza respuestas. Cada token es una nueva prediccion.
prompt: "Habia una vez un robot que"
Eso cuesta pre-entrenar un modelo como GPT-4. El aprendizaje ocurre en 3 fases que no se pueden saltear.
Ya viste que el modelo convierte tu texto en tokens y predice la continuacion. El prompt es justamente ese texto de entrada: tu forma de guiarlo. Mejor prompt = mejor resultado.
Vago. Sin rol, sin contexto ni formato. La respuesta sera generica y poco util.
Define rol, contexto, tarea acotada y formato. El modelo entrega algo accionable y verificable.
La IA es un ecosistema de enfoques y arquitecturas. Entender las diferencias importa para elegir bien.
Generan texto, codigo, razonan, responden preguntas. Base de la mayoria de productos IA actuales.
Procesan texto, imagenes, audio y video. Un modelo puede leer un plano de obra y generar un informe.
Piensan antes de responder usando chain-of-thought interno. Superiores en matematica, logica y ciencia.
Generan imagenes y videos fotorrealistas desde texto. Marketing, diseno arquitectonico, renders.
Especializados en generar, completar y depurar codigo. Aumentan productividad de devs en 30-55%.
Transcriben, clonan voces, generan audio hiperrealista. Un inspector dicta en obra y recibe el informe.
Un LLM clasico espera tu pregunta y responde. Un agente recibe un objetivo, planifica, usa herramientas y ejecuta tareas autonomamente.
Retrieval-Augmented Generation permite que el modelo busque en tus archivos antes de responder. Sin reentrenar. Sin exponer datos.
La competencia es feroz. El ritmo de progreso, sin precedentes.
Multimodal. o3 con razonamiento avanzado. En Microsoft 365, GitHub Copilot.
1M tokens de contexto. En Search, Workspace, Android.
Lider en escritura. Claude Code para programacion autonoma.
$5M de entrenamiento. Supera GPT-4 en benchmarks. Open source.
Open source. Descargable. Apps privadas sin enviar datos a terceros.
Europeo, eficiente. On-premise para empresas con requisitos de privacidad.
On-device. Los datos no salen del telefono. Privacidad maxima.
Los modelos de razonamiento ya no solo predicen el siguiente token. Razonan paso a paso internamente antes de responder.
Sam Altman (2025): "Podemos ver como construir AGI. El camino esta claro. No es cuestion de si, sino de cuando."
Si los modelos son suficientemente buenos para hacer investigacion en IA, el proceso se auto-acelera. Los modelos mejoran a los modelos. La velocidad de progreso podria ser miles de veces mas rapida que hoy.
Un modelo "desnudo" solo predice texto. Para que sea util en tu trabajo real necesita capacidades, conexiones y memoria. Tres piezas hacen eso: Skills, MCP y CLAUDE.md.
Carpetas con instrucciones, plantillas y scripts que enseñan a Claude a ejecutar una tarea (crear un Word, un Excel, un informe). Se cargan solo cuando son relevantes.
Estandar abierto que conecta a Claude con tus herramientas y datos: Drive, Slack, GitHub, bases de datos. Lo convierte de asistente a compañero con acceso real.
Archivo de texto que Claude lee al inicio de cada sesion: convenciones, contexto del proyecto y reglas "siempre haz X". Evita re-explicar lo mismo una y otra vez.
Claude Code es la herramienta de linea de comandos donde estas piezas brillan: Claude trabaja directo sobre tus archivos y proyectos, leyendo el CLAUDE.md, usando Skills y conectandose via MCP.
Es lo primero que Claude lee en cada sesion de Claude Code. Lo que escribas ahi se aplica siempre, sin repetirlo. Por eso es la pieza que mas mejora la consistencia.
Skills, MCP y CLAUDE.md trabajan juntos: el CLAUDE.md dice como trabajar, las Skills aportan el saber hacer, y el MCP da acceso a los datos. Juntos convierten a Claude en un colaborador que entiende tu contexto.
— Cathy O'Neil, Weapons of Math Destruction
La IA no es neutral. Cada modelo refleja los sesgos de sus datos, las decisiones de sus disenadores y los incentivos economicos de quien lo despliega.
Sistema de prediccion de reincidencia criminal usado en tribunales de EE.UU. Documental: Coded Bias.
| Persona | Historial | Prediccion | Realidad |
|---|---|---|---|
| Rivelli | Violencia, robo, drogas | BAJO 3 | Reincidio |
| Cannon | 1 robo menor | MEDIO 6 | No reincidio |
| Fugett | 1 robo frustrado | BAJO 3 | Reincidio x3 |
| Parker | 1 resistencia | ALTO 10 | No reincidio |
ProPublica: el sistema predecia incorrectamente el riesgo en personas negras al doble de tasa que en blancas.
Sam Altman advirtio que la informacion proporcionada a ChatGPT se almacena y puede usarse en entrenamiento futuro. No existe secreto profesional.
Para Independencia — accion urgente
Proyectos, contratos, datos de clientes ingresados a ChatGPT pueden quedar en servidores externos. Establecer una politica de uso de IA es urgente.
Conversaciones, feedback, patrones de uso
Entrenar futuros modelos, analisis
Historial off, Enterprise, politica interna
Mapa de la industria tecnologica de construccion — 37 casos de uso, ~2.400 firmas. Adaptado de McKinsey (Pitchbook, Preqin).
Tamano del circulo = numero de firmas que ofrecen ese caso de uso. Grosor de linea = firmas que ofrecen casos conectados a la vez.
Advertencia critica
"Automatizar la ineficiencia es ser el doble de ineficiente." Primero redisenar procesos. Despues automatizar.
Dentro del ecosistema de Google, Independencia cuenta con tres herramientas complementarias. No compiten: cada una resuelve un tipo de tarea distinto.
El chat de IA de Google para redactar, resumir, analizar y generar ideas. Los Gems son versiones personalizadas: un asistente a medida para una tarea que repites (ej. "revisor de informes SERVIU").
Subes tus fuentes (PDF, contratos, bases tecnicas, normativa) y pregunta, resume o compara: responde citando la fuente exacta. Incluso genera un resumen en audio tipo podcast.
El entorno tecnico para experimentar directo con los modelos Gemini: probar prompts, ajustar parametros y obtener una API para integrarlos en sistemas propios. Para perfiles mas tecnicos.
Regla simple: Gemini para el dia a dia, NotebookLM cuando la respuesta debe salir de tus documentos, y AI Studio cuando quieres construir algo a la medida.
— Ted Lechterman, UNESCO
→ Incomodidad
La incomodidad ante la IA es el primer paso del pensamiento critico. Usala productivamente.
→ Escepticismo
Desconfia tanto del "IA que destruira empleos" como del "IA perfecta". La realidad esta en el medio.
→ Accion
Quien entienda la IA — sus capacidades Y sus limites — tendra ventaja competitiva real en los proximos anos.
Miedos — Sensaciones — Expectativas — Intereses