IA & LLMs — Independencia

Independencia — 2026

Inteligencia
Artificial
& LLMs

Como funcionan los modelos de lenguaje, por que cambian todo, y los desafios eticos que debemos enfrentar.

Tokens & Vectores

Atencion & Capas

Etica & Sesgos

IA en Construccion

Modulo 1 — Intro

La IA ya no es el futuro.
Es el presente.

70 anos de historia. Lo que cambio fue la escala, el dato y el computo. Hoy la IA esta en tu celular, en las plataformas que usas, y proxima a cada obra que construimos.

0%

del contenido que ves en Netflix fue recomendado por IA

0

USD sera el mercado de IA en construccion para 2029

<1%

del ingreso gastan constructoras en TI. 3x menos que automotriz

0

usuarios de ChatGPT en sus primeros 2 meses. El mas rapido en la historia

1950 — Hoy

La historia
importa

Cada invierno de la IA fue seguido de un salto mayor. El patron: acumulacion silenciosa de datos y computo, luego explosion.

Selecciona un evento de la linea de tiempo.

Paso 1 — Tokens

El modelo no
lee palabras.
Lee tokens.

Antes de procesar texto, el modelo lo fragmenta en tokens: trozos de sub-palabra con un ID numerico. No son palabras exactas ni letras. Regla practica: 1 token ≈ 4 caracteres ≈ 0,75 palabras en ingles; en espanol suele ser algo mas.

"El proyecto incluye 48 viviendas."

Haz clic en cualquier token

Por que importan los tokens

SUB-PALABRASe construyen con BPE (Byte-Pair Encoding): las combinaciones frecuentes se juntan. "obra" = 1 token; "hormigonado" puede ser 3-4.

CONTEXTOEl modelo solo "ve" un numero limitado de tokens a la vez (la ventana de contexto). Todo lo que excede ese limite se ignora.

COSTOSe paga y se mide por token, tanto de entrada como de salida. Prompts mas largos = mas tokens = mas costo y latencia.

Quiz — "independencia" (13 letras) se tokeniza en:

Paso 1 — Profundizacion

Tokens
en la practica.

La ventana de contexto es cuanta informacion (en tokens) puede considerar el modelo de una sola vez. Determina si cabe un contrato completo, varias bases tecnicas o solo un parrafo.

Ventana de contexto

~128K-1M

tokens en modelos actuales. 128.000 tokens ≈ un libro de ~300 paginas. Aun asi, hay limite: la memoria no es infinita.

Entrada vs salida

in + out

Tu prompt son tokens de entrada; la respuesta, tokens de salida. Ambos cuentan para el limite y para el costo.

Por que se "olvida"

overflow

Si la conversacion supera la ventana, los tokens mas antiguos salen del contexto. El modelo no los "recuerda" salvo que se los repitas.

Ejemplo en obra

Subir las bases tecnicas + el contrato + 3 estados de pago puede sumar 60.000 tokens. Si tu modelo tiene 128K de ventana, cabe y puede compararlos. Si pegaras 10 expedientes completos, excederias el limite y el modelo perderia los primeros: conviene resumir o trocear.

Paso 2 — Vectores

Las palabras
se convierten
en numeros.

Cada token se mapea a miles de numeros (un vector). Esos numeros capturan el significado. Palabras similares quedan cerca en ese espacio.

      v(rey) − v(hombre) + v(mujer)

      ≈ v(reina)

Las relaciones semanticas se calculan aritmeticamente. Esto da al modelo su capacidad de razonamiento por analogia.

Proyeccion 2D de 4.096 dimensiones

Selecciona una palabra arriba

Paso 3 — Atencion

El modelo mira
todo el contexto
a la vez.

Para cada token, el modelo calcula cuanto debe "atender" a cada otro token del contexto. Esto le permite conectar palabras distantes.

En "El banco estaba lleno de peces", la palabra "banco" debe atender mas a:

Haz clic en una palabra

Click en cualquier palabra

Multi-cabeza — GPT-4 usa 96 cabezas en paralelo

Cada cabeza aprende a detectar un tipo distinto de relacion: sujeto-verbo, pronombre-referente, adjetivo-sustantivo. Se combinan para una representacion rica.

Paso 4 — Transformer

96 capas de
refinamiento
sucesivo.

Las primeras capas captan sintaxis. Las intermedias semántica. Las ultimas, razonamiento abstracto.

Drag & Drop — Ordena el transformer

Bloques

Softmax

Embedding

Atencion

FFN

Orden (entrada a salida)

Haz clic en cualquier bloque del diagrama

Paso 5 — Prediccion

Un token
a la vez.

Para cada posicion el modelo calcula probabilidades sobre todo el vocabulario. No memoriza respuestas. Cada token es una nueva prediccion.

Contexto: "La capital de Chile es"

Temperatura 0.5

Moderada — balance entre creatividad y coherencia.

Generacion token a token

prompt: "Habia una vez un robot que"

Un LLM con temperatura=0 genera texto eligiendo SIEMPRE el token con mayor probabilidad. Con temperatura alta:

Entrenamiento — Cómo aprende un LLM

$100M USD. Meses de cómputo.
10 billones de tokens.

Eso cuesta pre-entrenar un modelo como GPT-4. El aprendizaje ocurre en 3 fases que no se pueden saltear.

1

Pre-entrenamiento — predice el siguiente token en billones de textos

El modelo aprende lenguaje, hechos, codigo, razonamiento basico. Es la fase mas costosa (meses en miles de GPUs). El modelo no sabe nada de instrucciones todavia.

2

Fine-tuning supervisado (SFT) — aprende a seguir instrucciones

Humanos demuestran como responder correctamente. El modelo aprende formato, estilo y utilidad. Sin esto, el modelo solo completaria texto sin sentido.

3

RLHF — aprende preferencias humanas

Humanos eligen entre respuestas. Se entrena un modelo de recompensa. El LLM aprende a maximizarla. Aqui nace la utilidad y el alineamiento.

La analogia de construccion para RLHF seria:

Modulo 3 — Prompt

Tu instruccion
al modelo:
el prompt.

Ya viste que el modelo convierte tu texto en tokens y predice la continuacion. El prompt es justamente ese texto de entrada: tu forma de guiarlo. Mejor prompt = mejor resultado.

Anatomia de un buen prompt

ROLQuien quieres que sea el modelo. "Actua como jefe de obra..."

CONTEXTODatos relevantes: proyecto, plazos, normativa.

TAREAQue necesitas, en verbo concreto: "resume", "compara", "redacta".

FORMATOComo lo quieres: tabla, lista, 3 parrafos, tono formal.

✗ Prompt debil

"hablame de seguridad en obra"

Vago. Sin rol, sin contexto ni formato. La respuesta sera generica y poco util.

✓ Prompt efectivo

"Actua como prevencionista de riesgos. Para una obra de 48 viviendas en altura, lista las 5 medidas de seguridad mas criticas en la etapa de excavacion. Formato: tabla con riesgo, medida y norma aplicable."

Define rol, contexto, tarea acotada y formato. El modelo entrega algo accionable y verificable.

Panorama completo

No todos los
modelos son
iguales.

La IA es un ecosistema de enfoques y arquitecturas. Entender las diferencias importa para elegir bien.

LLM — Lenguaje

ChatGPT, Claude, Gemini

Generan texto, codigo, razonan, responden preguntas. Base de la mayoria de productos IA actuales.

texto → texto

Multimodal

GPT-4o, Gemini 2, Claude 3

Procesan texto, imagenes, audio y video. Un modelo puede leer un plano de obra y generar un informe.

texto+imagen+audio → cualquiera

Razonamiento

o1, o3, DeepSeek R1

Piensan antes de responder usando chain-of-thought interno. Superiores en matematica, logica y ciencia.

problema → razona → solucion

Imagen / Video

DALL-E 3, Midjourney, Sora

Generan imagenes y videos fotorrealistas desde texto. Marketing, diseno arquitectonico, renders.

texto → imagen/video

Codigo

Copilot, Cursor, Claude Code

Especializados en generar, completar y depurar codigo. Aumentan productividad de devs en 30-55%.

descripcion → codigo funcionando

Voz

Whisper, ElevenLabs, NotebookLM

Transcriben, clonan voces, generan audio hiperrealista. Un inspector dicta en obra y recibe el informe.

audio → texto/audio sintetizado

El siguiente nivel

Los agentes
no responden.
Actuan.

Un LLM clasico espera tu pregunta y responde. Un agente recibe un objetivo, planifica, usa herramientas y ejecuta tareas autonomamente.

La diferencia clave

LLM

"Redacta un informe" → devuelve texto.

AGENTE

"Genera el informe de hoy" → accede a fotos, lee el sistema, busca el contrato, redacta y envia.

Un agente IA se diferencia de un LLM clasico porque:

Ciclo de un agente

1

Percibir objetivo

Recibe tarea y contexto

↓

2

Planificar

Descompone en subtareas

↓

3

Usar herramientas

Web, archivos, APIs, codigo

↓

4

Evaluar y actuar

Verifica o replantea

Ejemplos reales

Analiza ventas mensuales, genera reporte y envia a gerencia

Lee contratos, detecta clausulas de riesgo y resume

Monitorea avance de obra y alerta desviaciones al cronograma

Tu informacion + IA

RAG: conecta
el modelo a tus
documentos.

Retrieval-Augmented Generation permite que el modelo busque en tus archivos antes de responder. Sin reentrenar. Sin exponer datos.

Tu: "Cual es el plazo del contrato #447?"
Sin RAG: "No tengo esa informacion."
Con RAG: busca en contratos.pdf → "Vence el 15/03/2026 (clausula 4.2)."

Para Independencia

Busqueda semantica en contratos y normativas

Asistente que conoce todos tus proyectos historicos

Preguntas sobre especificaciones tecnicas de obra

Como funciona RAG

1

Indexar: tus documentos se dividen en chunks y se vectorizan

2

Recuperar: tu pregunta busca los chunks mas similares

3

Generar: LLM recibe pregunta + chunks relevantes → responde

Tipos de memoria en IA

Contexto

Ventana de 128k-1M tokens

Vector DB

Millones de docs buscables

Parametros

Conocimiento pre-entrenamiento

Instrucciones

System prompt persistente

Estado del arte — 2026

Los modelos
frontera.

La competencia es feroz. El ritmo de progreso, sin precedentes.

OpenAI

GPT-4o / o3

Multimodal. o3 con razonamiento avanzado. En Microsoft 365, GitHub Copilot.

Google

Gemini 2.0

1M tokens de contexto. En Search, Workspace, Android.

Anthropic

Claude 3.5 / 4

Lider en escritura. Claude Code para programacion autonoma.

China

DeepSeek R1

$5M de entrenamiento. Supera GPT-4 en benchmarks. Open source.

Meta

Llama 3.3

Open source. Descargable. Apps privadas sin enviar datos a terceros.

Mistral

Mistral Large 2

Europeo, eficiente. On-premise para empresas con requisitos de privacidad.

Apple

Apple Intelligence

On-device. Los datos no salen del telefono. Privacidad maxima.

DeepSeek R1 fue relevante porque demostro que:

La frontera actual

Del autocomplete
al razonamiento
profundo.

Los modelos de razonamiento ya no solo predicen el siguiente token. Razonan paso a paso internamente antes de responder.

Escala de capacidades

ANI

Ya tenemos esto

AGI

~2-5 anos

ASI

Desconocido

Sam Altman (2025): "Podemos ver como construir AGI. El camino esta claro. No es cuestion de si, sino de cuando."

Los modelos de razonamiento (o1, o3) se diferencian porque:

IQ estimado vs humanos (2025)

o3 OpenAI

~120

GPT-4

~90

Humano avg

100

Explosion de inteligencia

Si los modelos son suficientemente buenos para hacer investigacion en IA, el proceso se auto-acelera. Los modelos mejoran a los modelos. La velocidad de progreso podria ser miles de veces mas rapida que hoy.

El mapa completo

El ecosistema
completo.

Fundacional

GPT-4o, Claude, Gemini

Llama, Mistral (open)

o1/o3 (razonamiento)

Codigo

GitHub Copilot

Cursor, Claude Code

Devin (agente)

Imagen/Video

Midjourney, DALL-E

Stable Diffusion

Sora, Runway, Kling

Voz/Audio

Whisper

ElevenLabs

NotebookLM

Agentes

CrewAI, AutoGPT

LangChain

n8n, Make (no-code)

Busqueda IA

Perplexity AI

Google AI Overviews

Bing Copilot

Infraestructura

AWS Bedrock

Azure OpenAI

Google Vertex AI

Productividad

Microsoft Copilot

Google Workspace AI

Notion AI, Gamma

IA Vertical

Harvey (legal)

Nabla (salud)

Procore AI (construc.)

ML Clasico

sklearn, XGBoost

TensorFlow, PyTorch

AutoML, H2O

Modulo 4 — Usar Claude

No basta con
conversar:
hay que equiparlo.

Un modelo "desnudo" solo predice texto. Para que sea util en tu trabajo real necesita capacidades, conexiones y memoria. Tres piezas hacen eso: Skills, MCP y CLAUDE.md.

Skills — Habilidades

Que sabe hacer

Carpetas con instrucciones, plantillas y scripts que enseñan a Claude a ejecutar una tarea (crear un Word, un Excel, un informe). Se cargan solo cuando son relevantes.

experiencia empaquetada

MCP — Conexiones

A que se conecta

Estandar abierto que conecta a Claude con tus herramientas y datos: Drive, Slack, GitHub, bases de datos. Lo convierte de asistente a compañero con acceso real.

enchufe universal

CLAUDE.md — Memoria

Que debe recordar

Archivo de texto que Claude lee al inicio de cada sesion: convenciones, contexto del proyecto y reglas "siempre haz X". Evita re-explicar lo mismo una y otra vez.

contexto persistente

Claude Code es la herramienta de linea de comandos donde estas piezas brillan: Claude trabaja directo sobre tus archivos y proyectos, leyendo el CLAUDE.md, usando Skills y conectandose via MCP.

Modulo 4 — Usar Claude

CLAUDE.md:
la memoria
del proyecto.

Es lo primero que Claude lee en cada sesion de Claude Code. Lo que escribas ahi se aplica siempre, sin repetirlo. Por eso es la pieza que mas mejora la consistencia.

Buenas practicas

✓Conciso y legible: textos largos (>200 lineas) diluyen la atencion.

✓En la raiz del repo y versionado en git para compartirlo con el equipo.

✓Solo hechos que Claude deba tener en cada sesion: comandos, convenciones, estructura.

✓Anota tambien los enfoques que NO funcionaron, para no repetir callejones sin salida.

# CLAUDE.md
## Proyecto
App de gestion de obra. Stack: React + Node.
## Comandos
build: npm run build
test: npm test
## Convenciones
- Montos siempre en CLP, sin decimales.
- Fechas en formato dd-mm-aaaa.
## Siempre
- Validar RUT antes de guardar.
- No tocar la carpeta /legacy.

La idea clave

Skills, MCP y CLAUDE.md trabajan juntos: el CLAUDE.md dice como trabajar, las Skills aportan el saber hacer, y el MCP da acceso a los datos. Juntos convierten a Claude en un colaborador que entiende tu contexto.

Modulo 5 — Etica

"Los algoritmos
son opiniones
en codigo."

— Cathy O'Neil, Weapons of Math Destruction

La IA no es neutral. Cada modelo refleja los sesgos de sus datos, las decisiones de sus disenadores y los incentivos economicos de quien lo despliega.

Riesgos principales — clic para expandir

Caso real — COMPAS

El algoritmo
que discrimina

Sistema de prediccion de reincidencia criminal usado en tribunales de EE.UU. Documental: Coded Bias.

Persona	Historial	Prediccion	Realidad
Rivelli	Violencia, robo, drogas	BAJO 3	Reincidio
Cannon	1 robo menor	MEDIO 6	No reincidio
Fugett	1 robo frustrado	BAJO 3	Reincidio x3
Parker	1 resistencia	ALTO 10	No reincidio

ProPublica: el sistema predecia incorrectamente el riesgo en personas negras al doble de tasa que en blancas.

Justicia algorítmica: cuando el codigo no es neutral

El sesgo de COMPAS se origino principalmente en:

Por que ocurren los sesgos

→Datos historicos sesgados: el modelo aprende desigualdades del pasado

→Proxy variables: el codigo postal predice raza/clase implicitamente

→Feedback loops: el modelo influye en los datos futuros

Riesgo critico

Lo que
le dices a la IA
se queda ahi.

Sam Altman advirtio que la informacion proporcionada a ChatGPT se almacena y puede usarse en entrenamiento futuro. No existe secreto profesional.

Para Independencia — accion urgente

Proyectos, contratos, datos de clientes ingresados a ChatGPT pueden quedar en servidores externos. Establecer una politica de uso de IA es urgente.

1

Conversaciones almacenadas por defecto en servidores de OpenAI.

2

Usadas para entrenar modelos futuros a menos que se desactive.

3

Version Enterprise desactiva el entrenamiento con tus datos.

🔒

Que recopila

Conversaciones, feedback, patrones de uso

⚠️

Para que

Entrenar futuros modelos, analisis

✅

Proteccion

Historial off, Enterprise, politica interna

Modulo 6 — Sector Construccion

La oportunidad
mas grande
del sector.

0

USD mercado IA en construccion 2029

Mordor Intelligence

0%

Crecimiento anual compuesto (CAGR)

<1%

Gasto en TI del sector

3x menos que automotriz

1/3

del promedio de otras industrias

segun McKinsey

Inspeccion en obra

Robotica autonoma

Drones de inspeccion

BIM predictivo

Modulo 6 — Mapa del sector

Los mayores clusters de casos de uso: impresion 3-D, modularizacion y robotica.

Mapa de la industria tecnologica de construccion — 37 casos de uso, ~2.400 firmas. Adaptado de McKinsey (Pitchbook, Preqin).

Colaboracion digital

Back office

Ejecucion en obra

1 Financiamiento de capital

20 Gestion documental

2 Relacion con clientes (CRM)

21 Escaneo laser

3 Gestion de equipos

22 Aprendizaje automatico

4 Estimacion de costos

23 Simulacion de procesos

5 Optimizacion de mano de obra

24 Gestion de productividad

6 Gestion de materiales

25 Avance y dashboards

7 Planificacion de portafolio

26 Ingenieria de valor

8 Evaluacion predictiva

27 Capacitacion virtual

9 Programacion de proyecto

28 Impresion 3-D

10 Monitoreo en tiempo real

29 Cumplimiento normativo

11 Planificacion de recursos

30 Marketplace de materiales

12 Gestion de riesgos

31 Inspeccion con drones

13 Modelado 3-D

32 Marketplace de equipos

14 Proceso de licitacion

33 Marketplace de mano de obra

15 Modelado BIM

34 Fabricacion off-site

16 Gestion de contratos

35 Control de calidad

17 Aprendizaje profundo

36 Robotica / automatizacion

18 Gestion de diseno

37 Testing y capacitacion

19 Simulacion de diseno

Tamano del circulo = numero de firmas que ofrecen ese caso de uso. Grosor de linea = firmas que ofrecen casos conectados a la vez.

Independencia — Hoja de ruta

Donde la IA
genera valor
real.

✓Ventas & Marketing: chatbots 24/7, recomendacion personalizada, prediccion de demanda por zona

✓Obras: vision computacional para inspeccion de calidad, deteccion temprana de defectos estructurales

✓Documentacion: LLMs para analisis de contratos, informes SERVIU/MINVU, busqueda semantica

✓Data: prediccion de costos, riesgo de proyectos, optimizacion de materiales

Advertencia critica

"Automatizar la ineficiencia es ser el doble de ineficiente." Primero redisenar procesos. Despues automatizar.

Independencia: liderando la transformacion digital

Cual es el primer paso correcto para adoptar IA en un proceso de la empresa?

Independencia — Herramientas disponibles

Las IA a las que
ya tienes acceso.

Dentro del ecosistema de Google, Independencia cuenta con tres herramientas complementarias. No compiten: cada una resuelve un tipo de tarea distinto.

Gemini & Gems

Asistente conversacional

El chat de IA de Google para redactar, resumir, analizar y generar ideas. Los Gems son versiones personalizadas: un asistente a medida para una tarea que repites (ej. "revisor de informes SERVIU").

NotebookLM

Investigacion sobre tus documentos

Subes tus fuentes (PDF, contratos, bases tecnicas, normativa) y pregunta, resume o compara: responde citando la fuente exacta. Incluso genera un resumen en audio tipo podcast.

Google AI Studio

Laboratorio de prototipos

El entorno tecnico para experimentar directo con los modelos Gemini: probar prompts, ajustar parametros y obtener una API para integrarlos en sistemas propios. Para perfiles mas tecnicos.

Regla simple: Gemini para el dia a dia, NotebookLM cuando la respuesta debe salir de tus documentos, y AI Studio cuando quieres construir algo a la medida.

Modulo 7 — Cierre

El flujo
completo.

Tu texto

→

Tokens

→

Vectores

→

Atencion×N

→

Softmax

→

Respuesta

✓ Lo que SI hace

Predecir patrones de texto con precision sin precedentes

Generalizar a situaciones completamente nuevas

Razonar por analogia y combinar conceptos

Procesar contextos largos (100k+ tokens)

✗ Lo que NO hace

"Saber" en sentido humano: son patrones estadisticos

Recordar conversaciones pasadas por defecto

Garantizar veracidad: puede alucinar con confianza

Razonar en tiempo real: es una pasada forward

Quiz final — Un LLM que "alucina" con confianza es porque:

Pensamiento critico

"Democratizar
la IA no es
accesibilidad.
Es poder."

— Ted Lechterman, UNESCO

→ Incomodidad

La incomodidad ante la IA es el primer paso del pensamiento critico. Usala productivamente.

→ Escepticismo

Desconfia tanto del "IA que destruira empleos" como del "IA perfecta". La realidad esta en el medio.

→ Accion

Quien entienda la IA — sus capacidades Y sus limites — tendra ventaja competitiva real en los proximos anos.

El futuro es de quienes usan la IA con criterio

Independencia — Hoja de Ruta

Datos primero. IA después.

F1 Datos

F2 Gobernanza

F3 Sistemas

F4 IA

Completado

En curso

Fase 1

Ordenar datos

Jun–Ago 2026 · En ejecución

Auditoría Drive (420 usuarios)

Estandarización estructura

Inventario de fuentes

Diagnóstico calidad por área

Fase 2

Gobernanza de datos

Jun–Nov 2026 · Próxima

Marco DAMA-DMBOK & roles

Ley 21.719 implementación

Data catalog & diccionario

Política uso IA interna

Fase 3

Suprimir CRM & iConstruye

Jun–Ene 2027 · CRM Jun–Sep

Desarrollo CRM propio

Migración datos históricos

Sistema propio Gerencia Técnica

Integración ERP↔CRM↔Drive

Fase 4

IA productiva

Jun 2026–May 2027 · En paralelo

LLM local + segundo cerebro

RAG contratos, planos, bases

Predicción costos & riesgo ML

Agentes IA & Vision AI obras

Iniciativa