¿Qué es RAG en inteligencia artificial?

RAG (Retrieval-Augmented Generation, generación aumentada por recuperación) es una técnica que conecta un modelo de lenguaje como GPT o Claude con tus propios documentos. Antes de responder, el sistema busca en tu base de conocimiento los fragmentos relevantes y se los pasa al modelo como contexto. El resultado: la IA responde con TUS datos (precios, políticas, productos, procedimientos) en vez de con su conocimiento genérico de internet.

¿En qué se diferencia un chatbot RAG de ChatGPT normal?

ChatGPT responde con lo que aprendió hasta su fecha de corte y no sabe nada de tu empresa: tus tarifas, tu catálogo, tus horarios o tus normas internas. Un chatbot RAG consulta tus documentos en cada pregunta y responde solo con esa información. Por eso un RAG bien montado da respuestas concretas y verificables sobre tu negocio, mientras que ChatGPT genérico improvisa o se inventa los detalles.

¿Cuánto cuesta montar un chatbot con RAG para una empresa?

Orientativo: un chatbot RAG básico para una pyme (FAQ, catálogo, atención web) ronda los 1.500-4.000 € de montaje inicial más un coste mensual de 30-200 € según el volumen de consultas y el modelo usado. Soluciones más complejas (asistente interno con varios sistemas conectados, miles de documentos) suben a 6.000-15.000 €. El coste recurrente de la API de IA suele ser pequeño: céntimos por consulta.

¿Qué son los embeddings y para qué sirven?

Un embedding es la representación numérica del significado de un texto: convierte una frase en una lista de números (un vector) de forma que textos con significado parecido quedan cerca en el espacio matemático. Sirven para que el sistema RAG encuentre los fragmentos de tus documentos que de verdad responden a la pregunta del usuario, aunque no usen las mismas palabras exactas.

¿Qué es un vector store o base de datos vectorial?

Un vector store es la base de datos donde se guardan los embeddings de tus documentos. Cuando alguien hace una pregunta, el sistema la convierte también en embedding y busca en el vector store los fragmentos más cercanos (más parecidos en significado). Ejemplos: Pinecone, Weaviate, Qdrant, pgvector. Es el componente que hace la búsqueda rápida en RAG.

¿Un chatbot RAG puede inventarse respuestas (alucinar)?

Sí, pero mucho menos que un modelo sin RAG. Una alucinación es cuando la IA afirma algo falso con seguridad. RAG reduce las alucinaciones porque obliga al modelo a basarse en tus documentos, pero no las elimina del todo: si la información no está en tu base de conocimiento o el prompt está mal diseñado, puede improvisar. Por eso se configura para que diga 'no tengo ese dato' en vez de inventarlo y se citan las fuentes.

¿Mis datos están seguros si monto un chatbot RAG?

Depende de cómo se monte. Si usas APIs de pago de OpenAI o Anthropic en su modo empresarial, no entrenan con tus datos y cumplen RGPD con el acuerdo de tratamiento adecuado. Si manejas datos muy sensibles (salud, datos personales masivos), se puede montar con modelos open source en tu propio servidor para que nada salga de tu infraestructura. Nunca debes meter en el RAG datos que no tengas derecho a tratar.

¿Qué datos debo usar para alimentar el RAG y cuáles no?

Usa: catálogos, fichas de producto, FAQ, manuales, políticas públicas, documentación de soporte, base de conocimiento interna. No metas sin protección: datos personales de clientes, contraseñas, información financiera sensible, documentos con cláusulas de confidencialidad de terceros. Todo lo que entre debe estar actualizado: un RAG con documentos viejos da respuestas viejas.

¿Cuánto tarda en estar listo un chatbot RAG?

Un piloto funcional con un conjunto de documentos acotado se puede tener en 2-4 semanas. Una implementación de producción, con tus datos limpios, conectada a tu web o a tus sistemas internos, probada y con control de calidad, suele llevar entre 4 y 10 semanas según la complejidad y el estado de tu documentación.

¿Necesito programadores para montar un RAG?

Para un piloto sencillo existen plataformas no-code que te dejan subir documentos y crear un chatbot sin escribir código. Para algo serio, conectado a tus sistemas, con control de calidad y sin sorpresas de privacidad, sí conviene un equipo técnico que controle el modelo, la vectorización, los prompts y la seguridad. Lo barato suele salir caro cuando el bot empieza a contestar mal a tus clientes.

¿RAG sirve para atención al cliente y para uso interno a la vez?

Sí, pero normalmente se montan como dos asistentes distintos con bases de conocimiento separadas. El de atención al cliente solo ve documentación pública (catálogo, FAQ, condiciones). El interno puede ver procedimientos, manuales y documentación sensible, con control de acceso. Mezclarlos es el error clásico: acabas exponiendo información interna a clientes.

¿Cada cuánto hay que actualizar la base de conocimiento de un RAG?

Cada vez que cambie la información de la que depende: precios, catálogo, horarios, políticas. Lo ideal es automatizar la actualización (que el RAG re-indexe cuando cambia un documento fuente) para no depender de hacerlo a mano. Un RAG sin mantenimiento se degrada: a los pocos meses contesta con datos viejos y pierdes la confianza del usuario.

Inteligencia Artificial

Cómo hacer que la IA conozca tu empresa: chatbots y asistentes con tus datos (RAG)

Guía 2026 para montar un chatbot o asistente IA conectado a tus propios documentos (RAG). Qué es, cómo se monta paso a paso, qué datos usar, errores y coste real.

Yeray Álamo·20 de junio de 2026·24 min read

#RAG#inteligencia artificial#chatbot empresa#asistente IA#automatización#Tenerife

RAG (Retrieval-Augmented Generation) es la técnica que hace que un chatbot de IA responda con los datos reales de tu empresa en vez de con conocimiento genérico de internet. Antes de contestar, el sistema busca en tus documentos —catálogo, precios, FAQ, manuales— los fragmentos relevantes y se los pasa al modelo de lenguaje como contexto. El resultado es una IA que sabe tus horarios, tus tarifas y tus productos, y que cita de dónde sacó cada respuesta. Montar uno para una pyme cuesta de forma orientativa entre 1.500 y 4.000 € en versión básica, con un coste recurrente de céntimos por consulta.

Llevamos en YAG catorce años montando webs y, en los últimos dos, sistemas de IA para empresas de Tenerife. Y la conversación que más se repite es esta: "He probado ChatGPT, le he preguntado por mi empresa y se lo inventa todo". Claro que se lo inventa. ChatGPT no sabe quién eres. No conoce tu catálogo, tus precios ni tus condiciones de envío. Responde con lo que leyó de internet hasta su fecha de corte, y cuando no sabe algo, rellena el hueco con lo que estadísticamente suena bien. A eso lo llamamos alucinación, y es el motivo por el que un modelo genérico no sirve para que un cliente pregunte por tus servicios.

La solución tiene nombre y apellidos: se llama RAG. Y este artículo es la guía honesta de cómo funciona, cómo se monta, qué datos meterle, qué errores te van a costar dinero y cuánto vale de verdad. Sin humo. Si al final decides que no te compensa, también te lo diremos.

Qué es RAG (Retrieval-Augmented Generation), explicado para que lo entienda cualquiera

RAG significa "Retrieval-Augmented Generation", en español "generación aumentada por recuperación". Es una técnica que conecta un modelo de lenguaje (como GPT, Claude o Gemini) con una base de conocimiento propia. Antes de generar la respuesta, el sistema recupera de tus documentos los fragmentos que tienen que ver con la pregunta y los inyecta en el contexto del modelo. Así la IA responde con tu información, no con la suya.

Vamos a quitarle el misterio con una analogía. Imagina un empleado nuevo brillante: lee rapidísimo, escribe bien, razona de maravilla. Pero acaba de entrar y no sabe nada de tu empresa. Si un cliente le pregunta por el precio del servicio premium, el empleado no puede inventárselo. Lo que hace es ir al archivador, sacar la carpeta de tarifas, leer el dato correcto y entonces responder.

Ese empleado brillante es el modelo de lenguaje. El archivador es tu base de conocimiento. Y el gesto de "ir a buscar la carpeta antes de hablar" es exactamente lo que hace RAG. La "R" de Retrieval es ir al archivador. La "G" de Generation es redactar la respuesta. La palabra "Augmented" en el medio significa que la capacidad de generar del modelo se ve aumentada por la información que acaba de recuperar.

Sin RAG, ese mismo empleado brillante, si no sabe el precio, se lo inventa con aplomo. Con RAG, va a la carpeta, lee y responde con el dato real. Esa es toda la diferencia, y es enorme.

Por qué no basta con "entrenar" a la IA con tus datos

Aquí hay un malentendido que cuesta dinero. Mucha gente cree que para que la IA conozca su empresa hay que "entrenarla" con sus documentos. Técnicamente eso se llama fine-tuning, y casi nunca es lo que necesitas.

El fine-tuning modifica el comportamiento del modelo: le enseñas un estilo, un formato, una manera de responder. Es caro, lento, y si mañana cambias un precio tienes que volver a entrenar. Además, el fine-tuning no es bueno guardando datos concretos: el modelo no memoriza tu lista de precios como una tabla, la diluye entre millones de parámetros y luego no la recuerda con fiabilidad.

RAG resuelve esto sin tocar el modelo. Tus datos viven fuera, en una base de conocimiento que puedes actualizar en cualquier momento. Cambias un precio en tu documento, se re-indexa, y el chatbot ya responde con el precio nuevo en segundos. Sin reentrenar nada. Por eso, para el 95 % de los casos de empresa —atención al cliente, soporte, consultas internas— la respuesta correcta es RAG, no fine-tuning.

El glosario que necesitas: cuatro palabras y ya entiendes el sistema entero

Si entiendes estos cuatro conceptos, entiendes cómo funciona un RAG por dentro. No hace falta ser técnico. Son cuatro ideas.

Embedding

Un embedding es la representación numérica del significado de un texto. El sistema convierte una frase en una lista de números (un vector) de manera que dos textos con significado parecido tengan vectores parecidos, aunque usen palabras distintas.

Ejemplo concreto. "¿Cuánto cuesta el envío?" y "¿Qué precio tienen los portes?" no comparten casi ninguna palabra, pero significan lo mismo. Un embedding captura eso: ambas frases acaban con vectores muy cercanos en el espacio matemático. Por eso un RAG bien hecho encuentra la respuesta correcta aunque el cliente no use exactamente las palabras de tu documento. Esto es lo que diferencia una búsqueda semántica (por significado) de la búsqueda clásica de "Ctrl+F" (por palabras exactas), que fallaría aquí.

Vector store (base de datos vectorial)

Un vector store es la base de datos donde se guardan todos los embeddings de tus documentos. Su trabajo es, dada una pregunta convertida en vector, encontrar a toda velocidad los fragmentos de texto cuyo vector está más cerca.

Piensa en él como el índice del archivador, pero ordenado por significado en lugar de por orden alfabético. Cuando entra una pregunta, el vector store devuelve en milisegundos los tres, cinco o diez fragmentos más relevantes. Nombres que oirás: Pinecone, Weaviate, Qdrant, Chroma, o pgvector (una extensión de PostgreSQL que permite usar tu base de datos de siempre como vector store, muy práctica para pymes que ya tienen Postgres).

Chunk (fragmento)

Un chunk es un trozo manejable de un documento. Antes de indexar, tus documentos se trocean en fragmentos de, por ejemplo, 300-800 palabras, porque buscar y pasar al modelo trozos pequeños y precisos funciona mucho mejor que pasarle un PDF de 90 páginas entero.

El troceado (chunking) parece un detalle y es media batalla. Si troceas mal —cortando una tabla por la mitad, separando una pregunta de su respuesta— el RAG recupera fragmentos inservibles y responde fatal. Buena parte del trabajo serio de montar un RAG está aquí: en trocear los documentos de forma que cada chunk tenga sentido por sí solo.

Alucinación

Una alucinación es cuando la IA afirma con total seguridad algo que es falso. El modelo no "miente" en el sentido humano: genera la continuación más probable, y a veces lo más probable no es lo verdadero.

Es el enemigo número uno. Un modelo sin RAG alucina con frecuencia sobre datos concretos (precios, fechas, referencias). RAG reduce drásticamente las alucinaciones porque ancla la respuesta a tus documentos reales. Pero no las elimina al 100 %: si la información no está en tu base, o si el sistema está mal configurado, el modelo todavía puede improvisar. Más abajo verás cómo se domestica esto.

Por qué un chatbot RAG responde mucho mejor que ChatGPT genérico

Pongamos las dos respuestas lado a lado. La pregunta del cliente: "¿Hacéis envíos a La Gomera y cuánto tardan?"

ChatGPT genérico responde algo así: "El tiempo de envío depende de la empresa de transporte y la ubicación. Te recomiendo consultar directamente con la tienda para conocer los plazos exactos." Correcto, educado e inútil. No ha resuelto nada. El cliente sigue sin saber si le envías a La Gomera.

Tu chatbot RAG responde: "Sí, enviamos a toda Canarias incluida La Gomera. El plazo habitual a las islas no capitalinas es de 3 a 5 días laborables y el envío es gratuito a partir de 60 €. Por debajo de ese importe, el coste es de 6,90 € (fuente: Política de Envíos, actualizada en junio de 2026)." Esa respuesta cierra ventas.

La diferencia no es de inteligencia del modelo: por debajo puede ser exactamente el mismo GPT. La diferencia es el acceso a tus datos. Y resumida en una tabla:

Aspecto	ChatGPT genérico	Chatbot RAG con tus datos
Conoce tus precios, horarios, catálogo	No	Sí
Datos actualizados	Hasta su fecha de corte	En tiempo real, los que tú metas
Cita la fuente de la respuesta	No	Sí, puede indicar de qué documento sale
Riesgo de inventarse detalles	Alto	Bajo (anclado a tus documentos)
Responde "no lo sé" cuando no hay dato	Raramente	Sí, si se configura bien
Sirve para vender/cerrar dudas reales	No	Sí

El matiz honesto: un RAG mal montado puede responder igual de mal que ChatGPT, o peor. La tecnología no salva un proyecto chapucero. Si los documentos están desactualizados, mal troceados o el prompt es flojo, tendrás un chatbot que da respuestas con aplomo y equivocadas, que es lo peor de los dos mundos. La calidad del RAG es la calidad de la ejecución, no de la sigla.

Casos de uso reales: dónde un RAG paga lo que cuesta

No todo proyecto de IA merece la pena. Estos tres son los que, por experiencia, devuelven la inversión en una pyme.

Caso 1: Atención al cliente en la web (el más rentable para empezar)

Es el caso estrella. Un chatbot en tu web que conoce tu catálogo, tus precios, tus condiciones y tus FAQ, y responde 24/7. Resuelve las preguntas repetitivas —horarios, envíos, devoluciones, "¿tenéis tal producto?", "¿cuánto cuesta tal servicio?"— sin que nadie de tu equipo tenga que estar pendiente.

El valor real no es solo ahorrar tiempo. Es que captura consultas fuera de horario, que de otro modo se perderían, y que da respuestas consistentes (el chatbot no tiene un mal día ni se equivoca de tarifa). En YAG tenemos desplegado nuestro propio chatbot RAG sobre el portfolio: el mismo motor sirve a varias webs, cada una con su propia base de conocimiento, y responde solo con la información de cada sitio. Ese es el patrón que recomendamos: un motor, una base de conocimiento por negocio.

Cuándo te conviene: recibes muchas consultas repetitivas, tienes catálogo o servicios con detalles (precios, condiciones), y pierdes clientes fuera de horario. Cuándo no: si vendes algo tan a medida que cada consulta es única y necesita una persona, el chatbot solo será un primer filtro.

Caso 2: Soporte interno (el secreto mejor guardado)

Este caso casi nadie lo pide y es de los que más productividad dan. Un asistente interno que conoce tus procedimientos, tus manuales, tu documentación técnica, tu histórico de incidencias. El empleado pregunta "¿cómo se tramita una devolución del proveedor X?" o "¿cuál es el protocolo si un cliente pide la baja?" y obtiene la respuesta exacta de vuestra propia documentación, sin tener que rebuscar en carpetas compartidas ni preguntar al compañero veterano.

Esto multiplica el valor de la documentación que ya tienes y que casi nadie lee porque está dispersa. Convierte 200 PDFs muertos en un buscador que responde en lenguaje natural. Para empresas con rotación de personal o procedimientos complejos, es oro: reduce drásticamente el tiempo de incorporación de gente nueva.

Cuándo te conviene: tienes documentación interna abundante, procedimientos que la gente consulta a menudo, o gastas tiempo respondiendo las mismas preguntas internas. Cuándo no: si tu operativa cabe en la cabeza de dos personas, no compensa montar nada.

Caso 3: Asistente comercial (el que cierra más rápido)

Un asistente para tu equipo de ventas que conoce todo tu catálogo, las objeciones típicas y las respuestas, los casos de éxito y las condiciones. El comercial, en plena llamada o reunión, pregunta "¿qué le digo al cliente que dice que somos caros frente a la competencia?" o "¿qué casos de éxito tenemos en su sector?" y obtiene munición al instante, alineada con vuestro discurso.

También funciona para preparar propuestas: el asistente saca las cláusulas, los precios y los argumentos correctos de vuestra documentación comercial sin que el vendedor tenga que ser un experto en todo el catálogo. Acorta el tiempo de respuesta a un lead, que es donde se ganan o se pierden muchas ventas.

Cuándo te conviene: catálogo amplio, equipo comercial que no se sabe todo de memoria, ciclos de venta donde la velocidad de respuesta importa. Cuándo no: producto único y simple que cualquiera explica en una frase.

Cómo se monta un RAG paso a paso (el proceso real, sin saltarse nada)

Esto es lo que de verdad pasa por dentro, en orden. Te lo cuento como se lo explico a un cliente que quiere entender por qué cuesta lo que cuesta y dónde está el trabajo.

Paso 1: Reunir y limpiar las fuentes de datos

Todo empieza por decidir qué sabe el chatbot. Las fuentes habituales:

Documentos: PDFs, Word, hojas de cálculo, presentaciones.
Tu web: páginas de producto, FAQ, condiciones, blog.
Bases de datos: catálogo, precios, stock (conectados en vivo si cambian a menudo).
Herramientas internas: tu CRM, tu gestor documental, tu base de conocimiento de soporte.

El trabajo invisible y crítico de este paso es la limpieza. La regla es brutal y no negociable: basura entra, basura sale. Si metes un PDF de tarifas de 2023 junto al de 2026, el chatbot a veces dará el precio viejo. Si metes tres versiones contradictorias de la política de devoluciones, responderá lo que le toque. Antes de indexar nada hay que decidir qué documento es la fuente de verdad de cada tema y retirar los duplicados y obsoletos. Este paso, hecho mal, hunde todo el proyecto por muy buena que sea la tecnología.

Paso 2: Trocear los documentos (chunking)

Cada documento se parte en fragmentos manejables. No es cortar cada 500 palabras a ciegas: se trocea respetando la estructura —que una sección quede entera, que una pregunta de la FAQ vaya con su respuesta, que una tabla no se parta por la mitad—. A cada chunk se le añaden metadatos: de qué documento sale, de qué fecha es, a qué sección pertenece. Esos metadatos luego permiten filtrar ("solo busca en la documentación de 2026") y citar la fuente en la respuesta.

Paso 3: Vectorizar (crear los embeddings)

Cada chunk pasa por un modelo de embeddings que lo convierte en su vector numérico. Estos vectores se guardan en el vector store junto con el texto original y sus metadatos. Este proceso se llama indexar. Es como crear el índice del archivador, pero por significado. Hacerlo una vez con todos tus documentos es rápido y barato; lo importante es poder repetirlo automáticamente cuando un documento cambie.

Paso 4: El flujo en vivo, cuando alguien pregunta

Aquí es donde todo se junta. Cuando un usuario escribe una pregunta, ocurre esto en menos de un par de segundos:

La pregunta se convierte en embedding con el mismo modelo que usaste para indexar.
El vector store busca los chunks más cercanos a esa pregunta (los más relevantes por significado). Normalmente devuelve entre 3 y 10.
Se construye el prompt: se juntan la pregunta del usuario, los fragmentos recuperados y unas instrucciones para el modelo ("responde solo con esta información, cita la fuente, si no está aquí di que no lo sabes").
El modelo de lenguaje genera la respuesta usando solo ese contexto.
Se devuelve al usuario, idealmente con la fuente citada.

Ese ciclo —embedding de la pregunta, búsqueda, construcción del prompt, generación— es RAG en funcionamiento. Repetido en cada mensaje.

Paso 5: Elegir el modelo de lenguaje

El modelo que genera la respuesta final. Las opciones grandes en 2026:

GPT (OpenAI) y Claude (Anthropic): los más capaces, vía API de pago. Coste por uso, céntimos por consulta. No entrenan con tus datos en su modo empresarial.
Gemini (Google): competitivo, buena relación capacidad/precio.
Modelos open source (familias tipo Llama, Mistral, y derivados): se pueden alojar en tu propio servidor. Más control y privacidad total —nada sale de tu infraestructura— a cambio de necesitar máquina y mantenimiento. Es la vía cuando los datos son muy sensibles.

La elección no es "el más potente gana". Es equilibrar capacidad, coste por consulta, velocidad de respuesta y requisitos de privacidad. Para una atención al cliente estándar, un modelo intermedio suele dar la mejor relación calidad/precio.

Paso 6: Diseñar el prompt de sistema (donde se gana o se pierde la calidad)

El prompt de sistema son las instrucciones fijas que rigen el comportamiento del chatbot. Aquí se define el tono ("habla de usted, en español de España, sin tecnicismos"), las reglas de oro ("nunca des un precio que no esté en los documentos", "si no tienes el dato, dilo y ofrece contacto humano") y los límites ("no des consejo legal ni médico"). Un buen prompt de sistema es la diferencia entre un chatbot fiable y uno que se va de madre. Se ajusta probando, no se acierta a la primera.

Paso 7: Probar, medir y afinar

Ningún RAG sale perfecto del horno. Hay que probarlo con preguntas reales —las que de verdad hace tu gente— y revisar las respuestas. Donde falle, se ajusta: quizá falta un documento, quizá el troceado parte mal una sección, quizá el prompt necesita una regla más. Esta fase de afinado es la que separa un piloto de juguete de un sistema que pones delante de clientes. En producción se mide: qué pregunta la gente, qué responde mal, qué consultas acaban derivadas a un humano. Con esos datos se mejora de forma continua.

Qué datos meter en el RAG y cuáles no (la parte de privacidad que no te puedes saltar)

Esta sección es la que más disgustos evita. La pregunta no es solo "¿qué le doy de comer al chatbot?" sino "¿qué tengo derecho a darle y qué riesgo asumo?".

Datos que sí, sin problema

Catálogos, fichas de producto, listas de precios públicas.
FAQ, condiciones de venta, políticas de envío y devolución.
Manuales de producto, guías de uso, documentación de soporte.
Contenido de tu web y tu blog.
Procedimientos internos y base de conocimiento (para el asistente interno, con acceso restringido).

Datos que requieren cuidado y control de acceso

Documentación interna sensible: solo en el asistente interno, nunca en el de cara al cliente.
Información comercial confidencial (márgenes, costes internos): igual, blindada.

Datos que NO debes meter alegremente

Datos personales de clientes (nombres, DNI, historiales) sin base legal y sin medidas. Esto entra de lleno en el RGPD.
Contraseñas, claves, credenciales. Nunca. Ni en un documento "que solo ve el bot".
Documentos de terceros con cláusula de confidencialidad. Si firmaste un NDA, ese material no va al RAG.
Datos especialmente protegidos (salud, ideología, etc.) salvo montaje específico, con base legal clara y, casi siempre, con modelo en tu propio servidor.

Las tres reglas de privacidad que aplicamos siempre

Separación de mundos. El chatbot público y el interno son sistemas distintos, con bases de conocimiento distintas. Mezclarlos es el error que acaba con información interna respondiendo a un cliente. No se negocia.
Dónde viven tus datos. Con las APIs de pago de OpenAI o Anthropic en su modo empresarial, tus datos no se usan para entrenar sus modelos y existe acuerdo de tratamiento conforme al RGPD. Aun así, si manejas información muy sensible, la vía limpia es un modelo open source alojado en tu propio servidor: así nada sale de tu infraestructura. Es una decisión de riesgo, no solo técnica.
Solo lo que tengas derecho a tratar. Antes de indexar un documento, la pregunta es: ¿tengo base legal para que un sistema procese esto? Si la respuesta es dudosa, no entra. Más vale un chatbot que sabe un poco menos que una multa de la AEPD.

Honestidad: esto no es para asustar, es para hacerlo bien. La mayoría de los RAG de pyme se alimentan de catálogo, FAQ y documentación pública, y el tema de privacidad se resuelve con sentido común y un buen montaje. Pero si tu caso toca datos personales en serio, hay que diseñarlo desde el principio con esa restricción, no parchearlo después.

Los errores que hunden un proyecto RAG (y cómo evitarlos)

Estos son los fallos que vemos una y otra vez. Conocerlos te ahorra dinero y disgustos.

Error 1: Documentos desactualizados

El más común y el más caro en credibilidad. El chatbot responde con un precio o una condición que ya no existe, el cliente se enfada, y tú quedas mal. Solución: definir una fuente de verdad por cada tema, automatizar la re-indexación cuando un documento cambia, y poner fecha de actualización en los metadatos. Un RAG sin proceso de mantenimiento se pudre en meses.

Error 2: Alucinaciones por falta de control

El modelo, cuando no encuentra el dato, improvisa con seguridad. Solución: un prompt de sistema que ordene explícitamente "si la información no está en los documentos, di que no la tienes y ofrece contacto humano; nunca inventes datos". Y mostrar la fuente de cada respuesta, para que el propio usuario pueda verificar. Un RAG que sabe decir "no lo sé" vale más que uno que lo sabe todo a medias.

Error 3: Mal troceado de documentos

Chunks que cortan tablas, separan preguntas de respuestas o mezclan temas. El sistema recupera fragmentos inservibles y responde mal aunque la información esté ahí. Solución: trocear respetando la estructura del documento, con solapamiento entre fragmentos para no perder contexto, y probar con preguntas reales para detectar dónde falla.

Error 4: Esperar magia sin dar buenos datos

"Le metí toda la carpeta del Drive y responde regular." Normal: si la carpeta tiene 14 versiones de cada cosa, documentos a medio hacer y notas internas mezcladas, el RAG hereda ese caos. Solución: invertir en la limpieza y curación de los datos antes de indexar. Es el paso más aburrido y el más decisivo.

Error 5: No medir nada después de lanzar

Se monta el chatbot, se pone en la web y nadie vuelve a mirar qué contesta. Solución: revisar periódicamente las conversaciones reales, detectar qué preguntas falla, qué documentos faltan, y mejorar. Un RAG es un sistema vivo, no un cartel que cuelgas y olvidas.

Error 6: Querer que lo haga todo

Un solo chatbot que atienda clientes, gestione el soporte interno, responda al comercial y prepare propuestas. Acaba haciéndolo todo regular y mezclando contextos que no debe mezclar. Solución: empezar por un caso de uso concreto, hacerlo bien, y expandir después. El RAG que intenta abarcarlo todo de golpe suele fracasar.

Cuánto cuesta un RAG de verdad (rangos orientativos honestos)

Aviso: las cifras siguientes son rangos orientativos del mercado, no una tarifa cerrada. El precio real depende de la cantidad y el estado de tus datos, las integraciones y el nivel de exigencia. Pero te dan un orden de magnitud para no ir a ciegas.

Montaje inicial

Tipo de proyecto	Rango orientativo	Qué incluye
Piloto / chatbot web básico	1.500 – 4.000 €	FAQ + catálogo + condiciones, una base de conocimiento, integración en web
Asistente intermedio	4.000 – 8.000 €	Más documentos, prompt afinado, citado de fuentes, panel de control, ajuste fino
Implementación avanzada	8.000 – 15.000 €+	Varias fuentes conectadas en vivo (CRM, BD), control de acceso, asistente interno + público, alta exigencia de privacidad

Coste recurrente mensual

Uso de la API de IA: suele ser lo más barato, céntimos por consulta. Un chatbot con varios cientos de consultas al mes puede costar de 10 a 100 €/mes en API según el modelo y la longitud de las respuestas. Modelos open source en tu servidor cambian este coste por el del servidor.
Vector store y alojamiento: desde casi gratis (pgvector en un servidor que ya tienes) hasta 20-150 €/mes en servicios gestionados según volumen.
Mantenimiento y mejora: lo que dediques a actualizar datos, revisar respuestas y afinar. Puede ser interno o un servicio recurrente.

En conjunto, una pyme con un chatbot RAG de atención al cliente bien dimensionado se mueve, de forma orientativa, en 30-200 €/mes de coste recurrente. Lo caro no es operarlo: es montarlo bien y mantener los datos al día.

La pregunta honesta: ¿te compensa?

Haz la cuenta sencilla. ¿Cuántas horas a la semana dedica tu equipo a responder las mismas preguntas? ¿Cuántas consultas se pierden fuera de horario? ¿Cuántas ventas se caen porque tardas en responder un lead? Si la suma es relevante, un RAG se paga solo en pocos meses. Si recibes cuatro consultas al mes y las contestas en un minuto, no montes nada: estarías matando moscas a cañonazos. Te lo decimos claro porque preferimos un cliente que vuelve a uno al que le vendimos algo que no necesitaba.

Cómo empezar sin pegarte un tiro en el pie

Si has llegado hasta aquí y crees que tu empresa encaja, esta es la ruta sensata:

Elige un solo caso de uso. El más doloroso y repetitivo. Normalmente, atención al cliente en la web. Resiste la tentación de hacerlo todo a la vez.
Audita tus datos. ¿Tienes la documentación de ese caso ordenada y actualizada? Si no, ese es el primer trabajo, antes de tocar IA. La calidad del RAG es la calidad de tus datos.
Monta un piloto acotado. Con un conjunto limitado de documentos, en 2-4 semanas. El objetivo es validar que funciona con tus preguntas reales, no construir la nave espacial.
Mide y decide. Si el piloto resuelve consultas reales con fiabilidad, amplías: más documentos, más casos, más integraciones. Si no, ajustas o aprendes barato que no era para ti.
Pon un proceso de mantenimiento. Define quién y cómo actualiza la base de conocimiento. Sin esto, cualquier RAG se degrada.

La tentación de las plataformas no-code es real: subes documentos, sale un chatbot, y para un piloto interno o una prueba puede valer. Para algo que ponen tus clientes delante, con tu marca en juego, control de privacidad y datos conectados en vivo, conviene un equipo que controle el modelo, el troceado, los prompts y la seguridad. Lo barato sale caro cuando el bot empieza a dar tarifas equivocadas a tus clientes.

Conclusión: la IA deja de ser un juguete cuando conoce tu empresa

ChatGPT genérico es una herramienta brillante para tareas generales, pero no sabe quién eres y nunca lo sabrá por sí solo. RAG es el puente: conecta esa inteligencia con tus datos para que la IA hable de tu negocio con conocimiento de causa, datos actualizados y fuentes verificables. Esa es la diferencia entre un chatbot que decora tu web y uno que resuelve, vende y libera tiempo a tu equipo.

La tecnología está madura y es más accesible de lo que parece. Lo que marca la diferencia no es la sigla, es la ejecución: datos limpios, troceado cuidadoso, prompts bien diseñados, privacidad resuelta y mantenimiento continuo. Hazlo bien y tendrás un activo que trabaja por ti las 24 horas. Hazlo a lo loco y tendrás un loro caro que contesta mal.

En YAG llevamos catorce años y más de 890 proyectos ayudando a empresas de Tenerife a usar la tecnología sin humo. Montamos sistemas de IA con datos propios —chatbots, asistentes internos, automatizaciones con inteligencia artificial integradas en tu web— pensados para tu negocio concreto, no plantillas. Si quieres saber si tu caso encaja, te lo decimos con honestidad, incluido un "esto no te conviene todavía" cuando sea verdad. Habla con nosotros en contacto, echa un ojo a cómo trabajamos el marketing digital y el diseño web, y si te interesa el detalle de los modelos, te recomendamos leer también nuestra comparativa de ChatGPT, Claude y Gemini para empresas, la guía de automatización con n8n e IA y los casos reales de chatbots IA en Tenerife.

Inteligencia Artificial

Cómo hacer que la IA conozca tu empresa: chatbots y asistentes con tus datos (RAG)

Guía 2026 para montar un chatbot o asistente IA conectado a tus propios documentos (RAG). Qué es, cómo se monta paso a paso, qué datos usar, errores y coste real.

Yeray Álamo·20 de junio de 2026·24 min read

#RAG#inteligencia artificial#chatbot empresa#asistente IA#automatización#Tenerife

Qué es RAG (Retrieval-Augmented Generation), explicado para que lo entienda cualquiera

Sin RAG, ese mismo empleado brillante, si no sabe el precio, se lo inventa con aplomo. Con RAG, va a la carpeta, lee y responde con el dato real. Esa es toda la diferencia, y es enorme.

Por qué no basta con "entrenar" a la IA con tus datos

El glosario que necesitas: cuatro palabras y ya entiendes el sistema entero

Si entiendes estos cuatro conceptos, entiendes cómo funciona un RAG por dentro. No hace falta ser técnico. Son cuatro ideas.

Embedding

Vector store (base de datos vectorial)

Chunk (fragmento)

Alucinación

Por qué un chatbot RAG responde mucho mejor que ChatGPT genérico

Pongamos las dos respuestas lado a lado. La pregunta del cliente: "¿Hacéis envíos a La Gomera y cuánto tardan?"

La diferencia no es de inteligencia del modelo: por debajo puede ser exactamente el mismo GPT. La diferencia es el acceso a tus datos. Y resumida en una tabla:

Aspecto	ChatGPT genérico	Chatbot RAG con tus datos
Conoce tus precios, horarios, catálogo	No	Sí
Datos actualizados	Hasta su fecha de corte	En tiempo real, los que tú metas
Cita la fuente de la respuesta	No	Sí, puede indicar de qué documento sale
Riesgo de inventarse detalles	Alto	Bajo (anclado a tus documentos)
Responde "no lo sé" cuando no hay dato	Raramente	Sí, si se configura bien
Sirve para vender/cerrar dudas reales	No	Sí

Casos de uso reales: dónde un RAG paga lo que cuesta

No todo proyecto de IA merece la pena. Estos tres son los que, por experiencia, devuelven la inversión en una pyme.

Caso 1: Atención al cliente en la web (el más rentable para empezar)

Caso 2: Soporte interno (el secreto mejor guardado)

Caso 3: Asistente comercial (el que cierra más rápido)

Cómo se monta un RAG paso a paso (el proceso real, sin saltarse nada)

Esto es lo que de verdad pasa por dentro, en orden. Te lo cuento como se lo explico a un cliente que quiere entender por qué cuesta lo que cuesta y dónde está el trabajo.

Paso 1: Reunir y limpiar las fuentes de datos

Todo empieza por decidir qué sabe el chatbot. Las fuentes habituales:

Documentos: PDFs, Word, hojas de cálculo, presentaciones.
Tu web: páginas de producto, FAQ, condiciones, blog.
Bases de datos: catálogo, precios, stock (conectados en vivo si cambian a menudo).
Herramientas internas: tu CRM, tu gestor documental, tu base de conocimiento de soporte.

Paso 2: Trocear los documentos (chunking)

Paso 3: Vectorizar (crear los embeddings)

Paso 4: El flujo en vivo, cuando alguien pregunta

Aquí es donde todo se junta. Cuando un usuario escribe una pregunta, ocurre esto en menos de un par de segundos:

La pregunta se convierte en embedding con el mismo modelo que usaste para indexar.
El vector store busca los chunks más cercanos a esa pregunta (los más relevantes por significado). Normalmente devuelve entre 3 y 10.
Se construye el prompt: se juntan la pregunta del usuario, los fragmentos recuperados y unas instrucciones para el modelo ("responde solo con esta información, cita la fuente, si no está aquí di que no lo sabes").
El modelo de lenguaje genera la respuesta usando solo ese contexto.
Se devuelve al usuario, idealmente con la fuente citada.

Ese ciclo —embedding de la pregunta, búsqueda, construcción del prompt, generación— es RAG en funcionamiento. Repetido en cada mensaje.

Paso 5: Elegir el modelo de lenguaje

El modelo que genera la respuesta final. Las opciones grandes en 2026:

GPT (OpenAI) y Claude (Anthropic): los más capaces, vía API de pago. Coste por uso, céntimos por consulta. No entrenan con tus datos en su modo empresarial.
Gemini (Google): competitivo, buena relación capacidad/precio.
Modelos open source (familias tipo Llama, Mistral, y derivados): se pueden alojar en tu propio servidor. Más control y privacidad total —nada sale de tu infraestructura— a cambio de necesitar máquina y mantenimiento. Es la vía cuando los datos son muy sensibles.

Catálogos, fichas de producto, listas de precios públicas.
FAQ, condiciones de venta, políticas de envío y devolución.
Manuales de producto, guías de uso, documentación de soporte.
Contenido de tu web y tu blog.
Procedimientos internos y base de conocimiento (para el asistente interno, con acceso restringido).

Datos que requieren cuidado y control de acceso

Documentación interna sensible: solo en el asistente interno, nunca en el de cara al cliente.
Información comercial confidencial (márgenes, costes internos): igual, blindada.

Datos que NO debes meter alegremente

Datos personales de clientes (nombres, DNI, historiales) sin base legal y sin medidas. Esto entra de lleno en el RGPD.
Contraseñas, claves, credenciales. Nunca. Ni en un documento "que solo ve el bot".
Documentos de terceros con cláusula de confidencialidad. Si firmaste un NDA, ese material no va al RAG.
Datos especialmente protegidos (salud, ideología, etc.) salvo montaje específico, con base legal clara y, casi siempre, con modelo en tu propio servidor.

Las tres reglas de privacidad que aplicamos siempre

Separación de mundos. El chatbot público y el interno son sistemas distintos, con bases de conocimiento distintas. Mezclarlos es el error que acaba con información interna respondiendo a un cliente. No se negocia.
Dónde viven tus datos. Con las APIs de pago de OpenAI o Anthropic en su modo empresarial, tus datos no se usan para entrenar sus modelos y existe acuerdo de tratamiento conforme al RGPD. Aun así, si manejas información muy sensible, la vía limpia es un modelo open source alojado en tu propio servidor: así nada sale de tu infraestructura. Es una decisión de riesgo, no solo técnica.
Solo lo que tengas derecho a tratar. Antes de indexar un documento, la pregunta es: ¿tengo base legal para que un sistema procese esto? Si la respuesta es dudosa, no entra. Más vale un chatbot que sabe un poco menos que una multa de la AEPD.

Tipo de proyecto	Rango orientativo	Qué incluye
Piloto / chatbot web básico	1.500 – 4.000 €	FAQ + catálogo + condiciones, una base de conocimiento, integración en web
Asistente intermedio	4.000 – 8.000 €	Más documentos, prompt afinado, citado de fuentes, panel de control, ajuste fino
Implementación avanzada	8.000 – 15.000 €+	Varias fuentes conectadas en vivo (CRM, BD), control de acceso, asistente interno + público, alta exigencia de privacidad

Coste recurrente mensual

Uso de la API de IA: suele ser lo más barato, céntimos por consulta. Un chatbot con varios cientos de consultas al mes puede costar de 10 a 100 €/mes en API según el modelo y la longitud de las respuestas. Modelos open source en tu servidor cambian este coste por el del servidor.
Vector store y alojamiento: desde casi gratis (pgvector en un servidor que ya tienes) hasta 20-150 €/mes en servicios gestionados según volumen.
Mantenimiento y mejora: lo que dediques a actualizar datos, revisar respuestas y afinar. Puede ser interno o un servicio recurrente.

La pregunta honesta: ¿te compensa?

Cómo empezar sin pegarte un tiro en el pie

Si has llegado hasta aquí y crees que tu empresa encaja, esta es la ruta sensata:

Elige un solo caso de uso. El más doloroso y repetitivo. Normalmente, atención al cliente en la web. Resiste la tentación de hacerlo todo a la vez.
Audita tus datos. ¿Tienes la documentación de ese caso ordenada y actualizada? Si no, ese es el primer trabajo, antes de tocar IA. La calidad del RAG es la calidad de tus datos.
Monta un piloto acotado. Con un conjunto limitado de documentos, en 2-4 semanas. El objetivo es validar que funciona con tus preguntas reales, no construir la nave espacial.
Mide y decide. Si el piloto resuelve consultas reales con fiabilidad, amplías: más documentos, más casos, más integraciones. Si no, ajustas o aprendes barato que no era para ti.
Pon un proceso de mantenimiento. Define quién y cómo actualiza la base de conocimiento. Sin esto, cualquier RAG se degrada.

¿Necesitas ayuda con algo concreto?

SEO & Posicionamiento

Diseño Web

Marketing Digital

¿Necesitas ayuda con algo concreto?

SEO & Posicionamiento

Diseño Web

Marketing Digital