Independencia — 2026
Inteligencia
Artificial
& LLMs

Como funcionan los modelos de lenguaje, por que cambian todo, y los desafios eticos que debemos enfrentar.

Tokens & Vectores
Atencion & Capas
Etica & Sesgos
IA en Construccion
Modulo 1 — Intro
La IA ya no es el futuro.
Es el presente.

70 anos de historia. Lo que cambio fue la escala, el dato y el computo. Hoy la IA esta en tu celular, en las plataformas que usas, y proxima a cada obra que construimos.

0%
del contenido que ves en Netflix fue recomendado por IA
0
USD sera el mercado de IA en construccion para 2029
<1%
del ingreso gastan constructoras en TI. 3x menos que automotriz
0
usuarios de ChatGPT en sus primeros 2 meses. El mas rapido en la historia
1950 — Hoy
La historia
importa

Cada invierno de la IA fue seguido de un salto mayor. El patron: acumulacion silenciosa de datos y computo, luego explosion.

Selecciona un evento de la linea de tiempo.

Paso 1 — Tokens
El modelo no
lee palabras.
Lee tokens.

Antes de procesar texto, el modelo lo fragmenta en tokens: trozos de sub-palabra con un ID numerico. No son palabras exactas ni letras. Regla practica: 1 token ≈ 4 caracteres ≈ 0,75 palabras en ingles; en espanol suele ser algo mas.

"El proyecto incluye 48 viviendas."
Haz clic en cualquier token
Por que importan los tokens
SUB-PALABRASe construyen con BPE (Byte-Pair Encoding): las combinaciones frecuentes se juntan. "obra" = 1 token; "hormigonado" puede ser 3-4.
CONTEXTOEl modelo solo "ve" un numero limitado de tokens a la vez (la ventana de contexto). Todo lo que excede ese limite se ignora.
COSTOSe paga y se mide por token, tanto de entrada como de salida. Prompts mas largos = mas tokens = mas costo y latencia.
Quiz — "independencia" (13 letras) se tokeniza en:
Paso 1 — Profundizacion
Tokens
en la practica.

La ventana de contexto es cuanta informacion (en tokens) puede considerar el modelo de una sola vez. Determina si cabe un contrato completo, varias bases tecnicas o solo un parrafo.

Ventana de contexto
~128K-1M

tokens en modelos actuales. 128.000 tokens ≈ un libro de ~300 paginas. Aun asi, hay limite: la memoria no es infinita.

Entrada vs salida
in + out

Tu prompt son tokens de entrada; la respuesta, tokens de salida. Ambos cuentan para el limite y para el costo.

Por que se "olvida"
overflow

Si la conversacion supera la ventana, los tokens mas antiguos salen del contexto. El modelo no los "recuerda" salvo que se los repitas.

Ejemplo en obra

Subir las bases tecnicas + el contrato + 3 estados de pago puede sumar 60.000 tokens. Si tu modelo tiene 128K de ventana, cabe y puede compararlos. Si pegaras 10 expedientes completos, excederias el limite y el modelo perderia los primeros: conviene resumir o trocear.

Paso 2 — Vectores
Las palabras
se convierten
en numeros.

Cada token se mapea a miles de numeros (un vector). Esos numeros capturan el significado. Palabras similares quedan cerca en ese espacio.

v(rey) − v(hombre) + v(mujer)
v(reina)

Las relaciones semanticas se calculan aritmeticamente. Esto da al modelo su capacidad de razonamiento por analogia.

Proyeccion 2D de 4.096 dimensiones

Selecciona una palabra arriba

Paso 3 — Atencion
El modelo mira
todo el contexto
a la vez.

Para cada token, el modelo calcula cuanto debe "atender" a cada otro token del contexto. Esto le permite conectar palabras distantes.

En "El banco estaba lleno de peces", la palabra "banco" debe atender mas a:
Haz clic en una palabra

Click en cualquier palabra

Multi-cabeza — GPT-4 usa 96 cabezas en paralelo

Cada cabeza aprende a detectar un tipo distinto de relacion: sujeto-verbo, pronombre-referente, adjetivo-sustantivo. Se combinan para una representacion rica.

Paso 4 — Transformer
96 capas de
refinamiento
sucesivo.

Las primeras capas captan sintaxis. Las intermedias semántica. Las ultimas, razonamiento abstracto.

Drag & Drop — Ordena el transformer
Bloques
Softmax
Embedding
Atencion
FFN
Orden (entrada a salida)
Haz clic en cualquier bloque del diagrama
Paso 5 — Prediccion
Un token
a la vez.

Para cada posicion el modelo calcula probabilidades sobre todo el vocabulario. No memoriza respuestas. Cada token es una nueva prediccion.

Contexto: "La capital de Chile es"
0.5
Moderada — balance entre creatividad y coherencia.
Generacion token a token

prompt: "Habia una vez un robot que"

Un LLM con temperatura=0 genera texto eligiendo SIEMPRE el token con mayor probabilidad. Con temperatura alta:
Entrenamiento — Cómo aprende un LLM
$100M USD. Meses de cómputo.
10 billones de tokens.

Eso cuesta pre-entrenar un modelo como GPT-4. El aprendizaje ocurre en 3 fases que no se pueden saltear.

1
Pre-entrenamiento — predice el siguiente token en billones de textos
El modelo aprende lenguaje, hechos, codigo, razonamiento basico. Es la fase mas costosa (meses en miles de GPUs). El modelo no sabe nada de instrucciones todavia.
2
Fine-tuning supervisado (SFT) — aprende a seguir instrucciones
Humanos demuestran como responder correctamente. El modelo aprende formato, estilo y utilidad. Sin esto, el modelo solo completaria texto sin sentido.
3
RLHF — aprende preferencias humanas
Humanos eligen entre respuestas. Se entrena un modelo de recompensa. El LLM aprende a maximizarla. Aqui nace la utilidad y el alineamiento.
La analogia de construccion para RLHF seria:
Modulo 3 — Prompt
Tu instruccion
al modelo:
el prompt.

Ya viste que el modelo convierte tu texto en tokens y predice la continuacion. El prompt es justamente ese texto de entrada: tu forma de guiarlo. Mejor prompt = mejor resultado.

Anatomia de un buen prompt
ROLQuien quieres que sea el modelo. "Actua como jefe de obra..."
CONTEXTODatos relevantes: proyecto, plazos, normativa.
TAREAQue necesitas, en verbo concreto: "resume", "compara", "redacta".
FORMATOComo lo quieres: tabla, lista, 3 parrafos, tono formal.
✗ Prompt debil
"hablame de seguridad en obra"

Vago. Sin rol, sin contexto ni formato. La respuesta sera generica y poco util.

✓ Prompt efectivo
"Actua como prevencionista de riesgos. Para una obra de 48 viviendas en altura, lista las 5 medidas de seguridad mas criticas en la etapa de excavacion. Formato: tabla con riesgo, medida y norma aplicable."

Define rol, contexto, tarea acotada y formato. El modelo entrega algo accionable y verificable.

Panorama completo
No todos los
modelos son
iguales.

La IA es un ecosistema de enfoques y arquitecturas. Entender las diferencias importa para elegir bien.

LLM — Lenguaje
ChatGPT, Claude, Gemini

Generan texto, codigo, razonan, responden preguntas. Base de la mayoria de productos IA actuales.

texto → texto
Multimodal
GPT-4o, Gemini 2, Claude 3

Procesan texto, imagenes, audio y video. Un modelo puede leer un plano de obra y generar un informe.

texto+imagen+audio → cualquiera
Razonamiento
o1, o3, DeepSeek R1

Piensan antes de responder usando chain-of-thought interno. Superiores en matematica, logica y ciencia.

problema → razona → solucion
Imagen / Video
DALL-E 3, Midjourney, Sora

Generan imagenes y videos fotorrealistas desde texto. Marketing, diseno arquitectonico, renders.

texto → imagen/video
Codigo
Copilot, Cursor, Claude Code

Especializados en generar, completar y depurar codigo. Aumentan productividad de devs en 30-55%.

descripcion → codigo funcionando
Voz
Whisper, ElevenLabs, NotebookLM

Transcriben, clonan voces, generan audio hiperrealista. Un inspector dicta en obra y recibe el informe.

audio → texto/audio sintetizado
El siguiente nivel
Los agentes
no responden.
Actuan.

Un LLM clasico espera tu pregunta y responde. Un agente recibe un objetivo, planifica, usa herramientas y ejecuta tareas autonomamente.

La diferencia clave
LLM
"Redacta un informe" → devuelve texto.
AGENTE
"Genera el informe de hoy" → accede a fotos, lee el sistema, busca el contrato, redacta y envia.
Un agente IA se diferencia de un LLM clasico porque:
Ciclo de un agente
1
Percibir objetivo
Recibe tarea y contexto
2
Planificar
Descompone en subtareas
3
Usar herramientas
Web, archivos, APIs, codigo
4
Evaluar y actuar
Verifica o replantea
Ejemplos reales
Analiza ventas mensuales, genera reporte y envia a gerencia
Lee contratos, detecta clausulas de riesgo y resume
Monitorea avance de obra y alerta desviaciones al cronograma
Tu informacion + IA
RAG: conecta
el modelo a tus
documentos.

Retrieval-Augmented Generation permite que el modelo busque en tus archivos antes de responder. Sin reentrenar. Sin exponer datos.

Tu: "Cual es el plazo del contrato #447?"
Sin RAG: "No tengo esa informacion."
Con RAG: busca en contratos.pdf → "Vence el 15/03/2026 (clausula 4.2)."
Para Independencia
Busqueda semantica en contratos y normativas
Asistente que conoce todos tus proyectos historicos
Preguntas sobre especificaciones tecnicas de obra
Como funciona RAG
1
Indexar: tus documentos se dividen en chunks y se vectorizan
2
Recuperar: tu pregunta busca los chunks mas similares
3
Generar: LLM recibe pregunta + chunks relevantes → responde
Tipos de memoria en IA
Contexto
Ventana de 128k-1M tokens
Vector DB
Millones de docs buscables
Parametros
Conocimiento pre-entrenamiento
Instrucciones
System prompt persistente
Estado del arte — 2026
Los modelos
frontera.

La competencia es feroz. El ritmo de progreso, sin precedentes.

OpenAI
GPT-4o / o3

Multimodal. o3 con razonamiento avanzado. En Microsoft 365, GitHub Copilot.

Google
Gemini 2.0

1M tokens de contexto. En Search, Workspace, Android.

Anthropic
Claude 3.5 / 4

Lider en escritura. Claude Code para programacion autonoma.

China
DeepSeek R1

$5M de entrenamiento. Supera GPT-4 en benchmarks. Open source.

Meta
Llama 3.3

Open source. Descargable. Apps privadas sin enviar datos a terceros.

Mistral
Mistral Large 2

Europeo, eficiente. On-premise para empresas con requisitos de privacidad.

Apple
Apple Intelligence

On-device. Los datos no salen del telefono. Privacidad maxima.

DeepSeek R1 fue relevante porque demostro que:
La frontera actual
Del autocomplete
al razonamiento
profundo.

Los modelos de razonamiento ya no solo predicen el siguiente token. Razonan paso a paso internamente antes de responder.

Escala de capacidades
ANI
Ya tenemos esto
AGI
~2-5 anos
ASI
Desconocido

Sam Altman (2025): "Podemos ver como construir AGI. El camino esta claro. No es cuestion de si, sino de cuando."

Los modelos de razonamiento (o1, o3) se diferencian porque:
IQ estimado vs humanos (2025)
o3 OpenAI
~120
GPT-4
~90
Humano avg
100
Explosion de inteligencia

Si los modelos son suficientemente buenos para hacer investigacion en IA, el proceso se auto-acelera. Los modelos mejoran a los modelos. La velocidad de progreso podria ser miles de veces mas rapida que hoy.

El mapa completo
El ecosistema
completo.
Fundacional
GPT-4o, Claude, Gemini
Llama, Mistral (open)
o1/o3 (razonamiento)
Codigo
GitHub Copilot
Cursor, Claude Code
Devin (agente)
Imagen/Video
Midjourney, DALL-E
Stable Diffusion
Sora, Runway, Kling
Voz/Audio
Whisper
ElevenLabs
NotebookLM
Agentes
CrewAI, AutoGPT
LangChain
n8n, Make (no-code)
Busqueda IA
Perplexity AI
Google AI Overviews
Bing Copilot
Infraestructura
AWS Bedrock
Azure OpenAI
Google Vertex AI
Productividad
Microsoft Copilot
Google Workspace AI
Notion AI, Gamma
IA Vertical
Harvey (legal)
Nabla (salud)
Procore AI (construc.)
ML Clasico
sklearn, XGBoost
TensorFlow, PyTorch
AutoML, H2O
Modulo 4 — Usar Claude
No basta con
conversar:
hay que equiparlo.

Un modelo "desnudo" solo predice texto. Para que sea util en tu trabajo real necesita capacidades, conexiones y memoria. Tres piezas hacen eso: Skills, MCP y CLAUDE.md.

Skills — Habilidades
Que sabe hacer

Carpetas con instrucciones, plantillas y scripts que enseñan a Claude a ejecutar una tarea (crear un Word, un Excel, un informe). Se cargan solo cuando son relevantes.

experiencia empaquetada
MCP — Conexiones
A que se conecta

Estandar abierto que conecta a Claude con tus herramientas y datos: Drive, Slack, GitHub, bases de datos. Lo convierte de asistente a compañero con acceso real.

enchufe universal
CLAUDE.md — Memoria
Que debe recordar

Archivo de texto que Claude lee al inicio de cada sesion: convenciones, contexto del proyecto y reglas "siempre haz X". Evita re-explicar lo mismo una y otra vez.

contexto persistente

Claude Code es la herramienta de linea de comandos donde estas piezas brillan: Claude trabaja directo sobre tus archivos y proyectos, leyendo el CLAUDE.md, usando Skills y conectandose via MCP.

Modulo 4 — Usar Claude
CLAUDE.md:
la memoria
del proyecto.

Es lo primero que Claude lee en cada sesion de Claude Code. Lo que escribas ahi se aplica siempre, sin repetirlo. Por eso es la pieza que mas mejora la consistencia.

Buenas practicas
Conciso y legible: textos largos (>200 lineas) diluyen la atencion.
En la raiz del repo y versionado en git para compartirlo con el equipo.
Solo hechos que Claude deba tener en cada sesion: comandos, convenciones, estructura.
Anota tambien los enfoques que NO funcionaron, para no repetir callejones sin salida.
# CLAUDE.md
## Proyecto
App de gestion de obra. Stack: React + Node.
## Comandos
build: npm run build
test: npm test
## Convenciones
- Montos siempre en CLP, sin decimales.
- Fechas en formato dd-mm-aaaa.
## Siempre
- Validar RUT antes de guardar.
- No tocar la carpeta /legacy.
La idea clave

Skills, MCP y CLAUDE.md trabajan juntos: el CLAUDE.md dice como trabajar, las Skills aportan el saber hacer, y el MCP da acceso a los datos. Juntos convierten a Claude en un colaborador que entiende tu contexto.

Modulo 5 — Etica
"Los algoritmos
son opiniones
en codigo."

— Cathy O'Neil, Weapons of Math Destruction

La IA no es neutral. Cada modelo refleja los sesgos de sus datos, las decisiones de sus disenadores y los incentivos economicos de quien lo despliega.

Riesgos principales — clic para expandir
Caso real — COMPAS
El algoritmo
que discrimina

Sistema de prediccion de reincidencia criminal usado en tribunales de EE.UU. Documental: Coded Bias.

PersonaHistorialPrediccionRealidad
RivelliViolencia, robo, drogasBAJO 3Reincidio
Cannon1 robo menorMEDIO 6No reincidio
Fugett1 robo frustradoBAJO 3Reincidio x3
Parker1 resistenciaALTO 10No reincidio

ProPublica: el sistema predecia incorrectamente el riesgo en personas negras al doble de tasa que en blancas.

Justicia IA
Justicia algorítmica: cuando el codigo no es neutral
El sesgo de COMPAS se origino principalmente en:
Por que ocurren los sesgos
Datos historicos sesgados: el modelo aprende desigualdades del pasado
Proxy variables: el codigo postal predice raza/clase implicitamente
Feedback loops: el modelo influye en los datos futuros
Riesgo critico
Lo que
le dices a la IA
se queda ahi.

Sam Altman advirtio que la informacion proporcionada a ChatGPT se almacena y puede usarse en entrenamiento futuro. No existe secreto profesional.

Para Independencia — accion urgente

Proyectos, contratos, datos de clientes ingresados a ChatGPT pueden quedar en servidores externos. Establecer una politica de uso de IA es urgente.

Privacidad
1
Conversaciones almacenadas por defecto en servidores de OpenAI.
2
Usadas para entrenar modelos futuros a menos que se desactive.
3
Version Enterprise desactiva el entrenamiento con tus datos.
🔒
Que recopila

Conversaciones, feedback, patrones de uso

⚠️
Para que

Entrenar futuros modelos, analisis

Proteccion

Historial off, Enterprise, politica interna

Modulo 6 — Sector Construccion
La oportunidad
mas grande
del sector.
0
USD mercado IA en construccion 2029
Mordor Intelligence
0%
Crecimiento anual compuesto (CAGR)
<1%
Gasto en TI del sector
3x menos que automotriz
1/3
del promedio de otras industrias
segun McKinsey
Construccion
Inspeccion en obra
Robot
Robotica autonoma
Dron
Drones de inspeccion
BIM
BIM predictivo
Modulo 6 — Mapa del sector
Los mayores clusters de casos de uso: impresion 3-D, modularizacion y robotica.

Mapa de la industria tecnologica de construccion — 37 casos de uso, ~2.400 firmas. Adaptado de McKinsey (Pitchbook, Preqin).

Colaboracion digital
Back office
Ejecucion en obra
1 Financiamiento de capital
20 Gestion documental
2 Relacion con clientes (CRM)
21 Escaneo laser
3 Gestion de equipos
22 Aprendizaje automatico
4 Estimacion de costos
23 Simulacion de procesos
5 Optimizacion de mano de obra
24 Gestion de productividad
6 Gestion de materiales
25 Avance y dashboards
7 Planificacion de portafolio
26 Ingenieria de valor
8 Evaluacion predictiva
27 Capacitacion virtual
9 Programacion de proyecto
28 Impresion 3-D
10 Monitoreo en tiempo real
29 Cumplimiento normativo
11 Planificacion de recursos
30 Marketplace de materiales
12 Gestion de riesgos
31 Inspeccion con drones
13 Modelado 3-D
32 Marketplace de equipos
14 Proceso de licitacion
33 Marketplace de mano de obra
15 Modelado BIM
34 Fabricacion off-site
16 Gestion de contratos
35 Control de calidad
17 Aprendizaje profundo
36 Robotica / automatizacion
18 Gestion de diseno
37 Testing y capacitacion
19 Simulacion de diseno

Tamano del circulo = numero de firmas que ofrecen ese caso de uso. Grosor de linea = firmas que ofrecen casos conectados a la vez.

Independencia — Hoja de ruta
Donde la IA
genera valor
real.
Ventas & Marketing: chatbots 24/7, recomendacion personalizada, prediccion de demanda por zona
Obras: vision computacional para inspeccion de calidad, deteccion temprana de defectos estructurales
Documentacion: LLMs para analisis de contratos, informes SERVIU/MINVU, busqueda semantica
Data: prediccion de costos, riesgo de proyectos, optimizacion de materiales

Advertencia critica

"Automatizar la ineficiencia es ser el doble de ineficiente." Primero redisenar procesos. Despues automatizar.

Oficina
Independencia: liderando la transformacion digital
Cual es el primer paso correcto para adoptar IA en un proceso de la empresa?
Independencia — Herramientas disponibles
Las IA a las que
ya tienes acceso.

Dentro del ecosistema de Google, Independencia cuenta con tres herramientas complementarias. No compiten: cada una resuelve un tipo de tarea distinto.

Gemini
Gemini & Gems
Asistente conversacional

El chat de IA de Google para redactar, resumir, analizar y generar ideas. Los Gems son versiones personalizadas: un asistente a medida para una tarea que repites (ej. "revisor de informes SERVIU").

NotebookLM
NotebookLM
Investigacion sobre tus documentos

Subes tus fuentes (PDF, contratos, bases tecnicas, normativa) y pregunta, resume o compara: responde citando la fuente exacta. Incluso genera un resumen en audio tipo podcast.

Google AI Studio
Google AI Studio
Laboratorio de prototipos

El entorno tecnico para experimentar directo con los modelos Gemini: probar prompts, ajustar parametros y obtener una API para integrarlos en sistemas propios. Para perfiles mas tecnicos.

Regla simple: Gemini para el dia a dia, NotebookLM cuando la respuesta debe salir de tus documentos, y AI Studio cuando quieres construir algo a la medida.

Modulo 7 — Cierre
El flujo
completo.
Tu texto
Tokens
Vectores
Atencion×N
Softmax
Respuesta
✓ Lo que SI hace
Predecir patrones de texto con precision sin precedentes
Generalizar a situaciones completamente nuevas
Razonar por analogia y combinar conceptos
Procesar contextos largos (100k+ tokens)
✗ Lo que NO hace
"Saber" en sentido humano: son patrones estadisticos
Recordar conversaciones pasadas por defecto
Garantizar veracidad: puede alucinar con confianza
Razonar en tiempo real: es una pasada forward
Quiz final — Un LLM que "alucina" con confianza es porque:
Pensamiento critico
"Democratizar
la IA no es
accesibilidad.
Es poder."

— Ted Lechterman, UNESCO

→ Incomodidad

La incomodidad ante la IA es el primer paso del pensamiento critico. Usala productivamente.

→ Escepticismo

Desconfia tanto del "IA que destruira empleos" como del "IA perfecta". La realidad esta en el medio.

→ Accion

Quien entienda la IA — sus capacidades Y sus limites — tendra ventaja competitiva real en los proximos anos.

Equipo
El futuro es de quienes usan la IA con criterio
Independencia — Hoja de Ruta
Datos primero. IA después.
F1 Datos
F2 Gobernanza
F3 Sistemas
F4 IA
Completado
En curso
Fase 1
Ordenar datos
Jun–Ago 2026 · En ejecución
Auditoría Drive (420 usuarios)
Estandarización estructura
Inventario de fuentes
Diagnóstico calidad por área
Fase 2
Gobernanza de datos
Jun–Nov 2026 · Próxima
Marco DAMA-DMBOK & roles
Ley 21.719 implementación
Data catalog & diccionario
Política uso IA interna
Fase 3
Suprimir CRM & iConstruye
Jun–Ene 2027 · CRM Jun–Sep
Desarrollo CRM propio
Migración datos históricos
Sistema propio Gerencia Técnica
Integración ERP↔CRM↔Drive
Fase 4
IA productiva
Jun 2026–May 2027 · En paralelo
LLM local + segundo cerebro
RAG contratos, planos, bases
Predicción costos & riesgo ML
Agentes IA & Vision AI obras
Iniciativa
Independencia
?

Miedos — Sensaciones — Expectativas — Intereses

Independencia desde 1990
Clase IA 2026
Portada