Hermes y OpenClaw resuelven dos problemas distintos, no el mismo problema de dos formas. Hermes es un asistente de IA self-hosted con memoria persistente y acceso a los datos propios de tu empresa: brilla cuando lo que importa es CONOCER tu negocio, recordar el contexto a lo largo del tiempo y mantener todo en infraestructura que controlas tú (privacidad y soberanía del dato). OpenClaw es un gateway que orquesta varios modelos de lenguaje (ChatGPT, Claude, Gemini) bajo una única interfaz: brilla cuando lo que importa es flexibilidad de modelo y acceso unificado sin atarte a un proveedor. La regla rápida: si la respuesta útil depende de TUS datos y de la continuidad, te interesa el enfoque Hermes; si solo quieres elegir entre modelos para tareas genéricas, un gateway tipo OpenClaw basta. Y, muy a menudo, lo correcto es usar el gateway POR DEBAJO del asistente con memoria, porque son capas complementarias.
La pregunta que nos llega cada vez más en la primera reunión ya no es "¿IA sí o no?". Eso está superado: casi todo el mundo ha usado ChatGPT. La pregunta de 2026 es más fina: "Vale, quiero IA en mi empresa de verdad, ¿pero qué tipo? ¿Algo que conozca mis datos y los guarde a buen recaudo, o algo que me deje usar varios modelos a la vez?". Esas dos frases son, sin que el cliente lo sepa, la diferencia entre el enfoque Hermes y el enfoque OpenClaw. Y elegir mal cuesta dinero: montas un asistente self-hosted carísimo para tareas que no usan tus datos, o montas un simple gateway cuando lo que necesitabas era memoria y privacidad.
Este artículo es la comparativa honesta que no encontrarás en un folleto de ventas. Vamos a explicar los dos enfoques sin humo, cuándo conviene cada uno, qué pasa con la privacidad, el coste y el mantenimiento, y te daremos un marco de decisión de tres preguntas para que salgas sabiendo qué pedir. Y, porque vendemos los dos, te diremos también cuándo NO te conviene cada uno. Si quieres antes el contexto general de un asistente con memoria, lo desarrollamos en asistente de IA para empresas con memoria propia.
Qué es Hermes y qué es OpenClaw (sin marketing)
Hermes es un asistente de IA self-hosted con memoria persistente y datos propios; OpenClaw es un gateway que orquesta varios modelos de lenguaje bajo una sola interfaz. Esa es la frase de una línea. Ahora la desplegamos, porque la confusión nace de meter ambos en el saco genérico de "herramientas de IA" cuando operan en capas distintas de la arquitectura.
Hermes resuelve el problema del CONOCIMIENTO y la MEMORIA. Su trabajo es saber cómo funciona tu empresa —tus productos, precios, procesos, documentos, el historial de cada cliente— y recordar el contexto a lo largo del tiempo. Para eso necesita dos cosas que un modelo genérico no tiene: acceso a tus datos (vía RAG, la técnica que conecta el modelo a tu base de conocimiento) y un sistema de memoria persistente que sobrevive entre conversaciones. Y, como apellido importante, es self-hosted: vive en infraestructura que tú controlas, no en los servidores de un tercero al que le envías todo.
OpenClaw resuelve el problema del ACCESO a modelos. Su trabajo es ponerte delante varios modelos de lenguaje (GPT de OpenAI, Claude de Anthropic, Gemini de Google) a través de una única puerta. En lugar de integrar cada proveedor por separado, hablas con el gateway y este decide o te deja decidir qué modelo usa cada petición. La gracia es no casarte con un solo proveedor: si mañana sale uno mejor o más barato, cambias el enrutado sin rehacer tu integración.
La diferencia de fondo: Hermes aporta verdad sobre tu negocio y continuidad; OpenClaw aporta flexibilidad de modelo y portabilidad. Son ejes distintos. Por eso la pregunta "¿Hermes o OpenClaw?" muchas veces está mal planteada: es como preguntar "¿coche o gasolina?". A menudo quieres las dos cosas.
La analogía que usamos con clientes
Imagina una oficina. OpenClaw es la centralita telefónica: una sola línea por la que puedes llamar a varios especialistas (uno bueno en textos largos, otro en razonamiento, otro más barato para consultas simples) y la centralita te conecta con el adecuado. Es muy útil, pero la centralita no sabe nada de tu empresa: solo enruta llamadas.
Hermes es el empleado veterano con el archivo de la empresa en su mesa: conoce tus precios, recuerda a tus clientes, sabe qué se decidió el mes pasado, y todo ese archivo está guardado bajo llave en tu oficina, no en la nube de un desconocido. Ese empleado, para responder, puede usar la centralita (el gateway) para hablar con el especialista que necesite en cada momento. Por eso lo natural es que el empleado veterano (Hermes) use la centralita (OpenClaw) cuando le conviene. No compiten: colaboran.
Tabla comparativa: Hermes vs OpenClaw de un vistazo
Antes de desmenuzar, la foto rápida. Léela con la idea de que casi ninguna fila es "mejor/peor" en abstracto: depende de tu caso.
| Aspecto | Hermes (asistente self-hosted) | OpenClaw (gateway multi-modelo) |
|---|---|---|
| Qué problema resuelve | Conocer tus datos y recordar el contexto | Acceder a varios modelos con una interfaz |
| Memoria persistente | Sí, es su razón de ser | No por sí mismo (es una pasarela) |
| Acceso a tus datos (RAG) | Sí, integrado | No por sí mismo |
| Dónde se aloja | Infraestructura propia (self-hosted) | Capa que enruta a modelos (en la nube o propia) |
| Privacidad / soberanía del dato | Alta: los datos no salen de tu perímetro | Depende: parte de la info viaja a proveedores |
| Flexibilidad de modelo | Buena si usa un gateway por debajo | Es su especialidad: cambia de modelo a voluntad |
| Mantenimiento | Mayor: infra, backups, actualizaciones | Menor si la infra del modelo la lleva el proveedor |
| Coste de montaje (orientativo) | 3.000-8.000 € + infra/API mensual | Más bajo: integración + consumo de modelos |
| Caso ideal | Datos sensibles, memoria, continuidad | Probar/comparar modelos, evitar lock-in |
| Caso a evitar | Tareas genéricas sin datos propios | Cuando necesitas memoria y privacidad fuerte |
| ¿Se combinan? | Sí: usa el gateway por debajo | Sí: vive bajo un asistente con memoria |
Importante sobre la fila de coste: son rangos orientativos para una pyme, no tarifas cerradas. El coste real depende del número de fuentes de datos, las integraciones, el volumen de uso y si los modelos corren en la nube o alojados. Cualquiera que te dé un precio sin haber visto tu caso te está improvisando una cifra.
Por qué elegir Hermes frente a OpenClaw
Elige el enfoque Hermes cuando la respuesta útil depende de TUS datos y la continuidad importa. Esa es la respuesta directa, y ahora la justificamos con los cuatro motivos concretos por los que un asistente self-hosted con memoria propia gana a un simple gateway.
1. Porque la respuesta correcta depende de tu conocimiento, no del general
Un gateway, por bueno que sea enrutando, sigue hablando con modelos genéricos. Si le preguntas "¿hacéis envíos a La Gomera y cuánto cuesta?", el modelo que esté detrás te dará una respuesta plausible sacada de internet, no tu tarifa real. Hermes consulta tu tabla de tarifas y responde con tu precio. La diferencia entre "plausible" y "correcto" es, en un negocio, la diferencia entre cerrar una venta y soltar un dato falso que luego genera una reclamación.
Si tu caso de uso es "que la IA conozca mi catálogo, mis precios, mis procesos y mi histórico de clientes", el gateway por sí solo no llega. Necesitas la capa de datos y memoria que define a Hermes.
2. Porque la memoria persistente cambia la experiencia
Un gateway no recuerda. Cada petición es independiente; no sabe que este cliente ya preguntó por el producto X la semana pasada ni que tu equipo prefiere un tono concreto. Hermes guarda ese contexto de forma estructurada y lo recupera: la próxima vez que ese cliente o empleado interactúa, el asistente parte de lo que ya sabe. Es la diferencia entre un becario que llega cada mañana sin acordarse de nada y un veterano que conoce la casa.
Para atención al cliente, soporte interno o cualquier flujo donde el historial importe, la memoria no es un lujo: es lo que separa una herramienta de un asistente de verdad.
3. Porque la privacidad y la soberanía del dato son innegociables en ciertos sectores
Aquí está el argumento más fuerte a favor de Hermes y conviene no maquillarlo. Self-hosted significa que tus datos y el asistente viven en infraestructura que tú controlas. No envías toda tu información a un SaaS externo del que dependes y del que no sabes exactamente qué hace con tus datos. Para sectores con datos sensibles —sanitario, legal, financiero, recursos humanos— y para empresas con exigencias estrictas de RGPD, esto no es un extra: es un requisito de partida.
Un gateway puede configurarse para ser respetuoso con la privacidad (usando API de pago que no entrena con tus datos), pero por su naturaleza parte de tu información viaja a proveedores externos. Si la regla de tu empresa es "el dato no sale de aquí", el enfoque self-hosted lleva ventaja clara. Por eso en contenido y datos sensibles tratamos el control de la información como innegociable, igual que explicamos en nuestra forma de trabajar la IA.
4. Porque no quieres depender de que un tercero cambie las reglas
Continuidad. Cuando tu operativa depende de un asistente, dependes de que su infraestructura siga ahí, a un precio razonable y con los mismos términos. Un montaje self-hosted te da control sobre eso: no te quedas vendido si un proveedor cierra, sube precios de golpe o cambia sus condiciones de uso. El precio de esa tranquilidad es el mantenimiento, que abordamos más abajo sin endulzarlo.
Cuándo NO elegir Hermes (y un gateway te basta)
No conviene Hermes cuando no tienes datos propios que aporten valor, cuando el volumen es bajo, cuando no quieres asumir mantenimiento de infraestructura o cuando la privacidad no es un requisito. Lo decimos claro porque montar un asistente self-hosted en estos casos es pagar de más por capacidades que no vas a usar.
- No usas tus datos. Si lo que quieres es redactar emails, resumir textos o generar borradores genéricos, no necesitas que la IA conozca tu negocio. Un gateway que te deje elegir el mejor modelo para cada tarea (o incluso ChatGPT en el navegador) te sobra. Montar memoria y RAG para tareas que no tocan tus datos es sobreingeniería.
- Tu volumen es muy bajo. Self-hosted tiene un coste fijo de infraestructura y mantenimiento. Si el uso es esporádico, ese coste fijo no se amortiza. La IA propia renta con volumen y repetición.
- No quieres (ni puedes delegar) el mantenimiento. Un asistente self-hosted necesita que alguien actualice, haga copias y vigile la infraestructura. Si no tienes ese perfil ni quieres pagar soporte gestionado, un servicio en la nube reduce esa carga, aunque cedas control.
- La privacidad no es un requisito duro. Si tus datos no son especialmente sensibles y te vale con una API en la nube bien contratada, la ventaja principal de Hermes (la soberanía del dato) deja de pesar y el coste extra del self-hosted no se justifica.
La pregunta honesta: ¿el self-hosting me da algo que de verdad necesito (privacidad, control, memoria sobre mis datos)? Si la respuesta es "no especialmente", un gateway es más sensato y barato.
Cuándo elegir OpenClaw (y por qué a veces es lo correcto)
Elige el enfoque OpenClaw cuando lo que necesitas es flexibilidad de modelo y acceso unificado, sin que la memoria ni los datos propios sean el eje. Un gateway es la herramienta adecuada en varios escenarios reales.
Quieres comparar y combinar modelos
Hay tareas que GPT hace mejor, otras donde Claude brilla con textos largos y razonamiento cuidadoso, y otras donde Gemini destaca por contexto largo. Un gateway te deja usar el modelo idóneo para cada tarea sin integrar cada proveedor por separado. Si tu necesidad es "quiero lo mejor de cada modelo según el momento", el gateway es exactamente eso. Profundizamos en las diferencias entre modelos en ChatGPT, Claude y Gemini para empresas.
Quieres evitar el lock-in (la dependencia de un proveedor)
Atarte a un único modelo es deuda técnica desde el día uno: el mercado cambia cada mes. Un gateway desacopla tu aplicación del proveedor concreto. Si mañana uno sube precios o baja calidad, cambias el enrutado sin rehacer nada. Para una empresa que quiere optionalidad y no depender de una sola casa, el gateway es una decisión arquitectónica sólida.
Quieres repartir carga y controlar coste
Con un gateway puedes mandar las consultas simples a un modelo barato y reservar el caro para lo que de verdad lo necesita. Eso optimiza el gasto en API. Si tienes volumen y quieres exprimir cada euro de consumo, esta capa de enrutado paga sola. Cómo montar este patrón en tu empresa lo contamos en montar OpenClaw en tu empresa con ChatGPT, Claude y Gemini.
Estás empezando y quieres una base flexible
Si aún no sabes qué modelo te va a servir mejor a largo plazo, empezar por un gateway te da margen para experimentar sin comprometerte. Es una buena base sobre la que, más adelante, añadir la capa de memoria y datos cuando el caso de uso lo pida. Empezar flexible y especializar después suele salir mejor que casarte de entrada.
Cuándo NO basta con OpenClaw (necesitas Hermes por encima)
No basta con un gateway cuando la respuesta útil depende de tus datos, cuando necesitas memoria entre sesiones o cuando la privacidad exige que la información no salga de tu perímetro. Un gateway, repetimos, enruta a modelos genéricos: no conoce tu negocio ni recuerda nada.
- De cara al cliente con tus datos. Un asistente que atiende a tus clientes con horarios, precios y políticas reales necesita acceso a tus datos. El gateway por sí solo dará respuestas genéricas o inventadas. Aquí necesitas la capa Hermes por encima.
- Cuando el historial importa. Soporte que recuerda al cliente, asistente interno que sabe lo que se decidió, cualquier flujo donde la continuidad mejora la experiencia. El gateway no recuerda; Hermes sí.
- Cuando el dato no puede salir. Datos sanitarios, legales, financieros, personales sensibles. Si la regla es "no sale de nuestra infraestructura", un gateway que enruta a APIs externas no cumple ese requisito por sí solo. El self-hosting es la respuesta.
Privacidad y soberanía del dato: el eje que más pesa
En privacidad, el enfoque self-hosted (Hermes) ofrece más control porque los datos viven donde tú decides y no se envían a un SaaS externo. Este es, para muchas empresas, el factor que inclina la balanza, así que lo tratamos aparte y sin endulzar.
Cuando usas un servicio de IA en la nube, tu información viaja a servidores de un tercero. Si está bien contratado (API de pago que no entrena con tus datos, acuerdos de tratamiento de datos en regla), puede ser perfectamente compatible con RGPD. Pero "puede ser" no es lo mismo que "está garantizado por diseño". El self-hosting cambia el planteamiento: los datos no salen de tu perímetro, así que el riesgo de fuga, de uso indebido o de cambio de términos por parte de un proveedor desaparece de la ecuación. Decides tú dónde se almacenan, quién accede y cuánto tiempo se conservan.
Esto importa de forma especial en tres situaciones:
- Datos personales sensibles. Historiales clínicos, datos jurídicos de clientes, información financiera. El RGPD trata estos datos con exigencia y la responsabilidad recae en ti, no en el proveedor de IA.
- Secreto comercial. Procesos, fórmulas, listas de clientes, estrategia. Información que, en manos equivocadas o entrenando un modelo ajeno, te perjudica.
- Requisitos contractuales o sectoriales. A veces es tu propio cliente quien exige que sus datos no salgan de una infraestructura controlada. El self-hosting es la forma de cumplir esa cláusula.
Si nada de esto aplica a tu caso, la ventaja de privacidad de Hermes pesa menos y el coste del self-hosting no se justifica solo por ella. Sé honesto contigo mismo aquí: ¿de verdad tus datos son sensibles, o lo dices porque suena prudente? La respuesta cambia la decisión.
Coste y mantenimiento: la parte que nadie te cuenta
El coste de un asistente tipo Hermes se reparte entre montaje, infraestructura y mantenimiento continuo; el de un gateway tipo OpenClaw se concentra en la integración y el consumo de modelos. Vamos a desglosarlo con cifras orientativas marcadas como tales, porque aquí es donde más humo se vende.
Coste de montaje (orientativo)
- Gateway multi-modelo (enfoque OpenClaw): más bajo, porque no incluye ingesta de datos ni memoria. El trabajo es la integración con los proveedores de modelo y la configuración del enrutado. El grueso del gasto recurrente luego es el consumo de los modelos que orquesta.
- Asistente self-hosted con memoria y RAG (enfoque Hermes): rango orientativo de 3.000-8.000 € de montaje para una pyme, más infraestructura y API mensuales (habitualmente 30-200 €/mes según volumen y si los modelos corren en la nube o alojados). El montaje incluye una pieza que mucha gente subestima: limpiar y estructurar tus datos, que es donde se va buena parte del esfuerzo.
Estas cifras son orientaciones para que te hagas una idea del orden de magnitud, no presupuestos cerrados. El número real depende de tu caso. Exige siempre presupuesto por alcance definido, no por horas abiertas.
Coste de mantenimiento (el que olvidan)
Aquí está la trampa habitual. El montaje se ve; el mantenimiento se siente a los seis meses.
- Self-hosted (Hermes): alguien tiene que actualizar el software, hacer copias de seguridad, monitorizar que todo funcione, gestionar la infraestructura y mantener la base de conocimiento al día. La mayoría de pymes no tiene ese perfil interno, así que lo sensato es delegarlo en quien lo monta mediante soporte gestionado. Súmalo al presupuesto desde el principio.
- Gateway (OpenClaw): menor carga de mantenimiento de infraestructura si los modelos corren en la nube del proveedor, porque esa parte la lleva él. A cambio, cedes control y dependes de sus términos.
La pregunta correcta no es solo "¿cuánto cuesta montarlo?", sino "¿quién lo mantiene a los seis meses y qué cuesta eso?". Un proveedor honesto te habla del mantenimiento en la primera reunión. Si solo te habla del montaje, desconfía.
Casos de uso por sector (qué enfoque encaja)
La decisión se aterriza cuando la pones en tu sector. Estos son casos reales o muy verosímiles de qué enfoque encaja según el problema.
Despachos legales
Hermes, sin dudarlo. Datos jurídicos sensibles, necesidad de que la información no salga del perímetro, y rigor absoluto (en derecho, un dato inventado es una bomba). Un asistente self-hosted conectado a la información del despacho responde dudas frecuentes con datos reales y deriva a abogado lo que requiere criterio, todo con el control del dato blindado. Un gateway por sí solo, que enruta a modelos genéricos, no cumple ni el requisito de privacidad ni el de conocer la información real del despacho.
Clínicas y salud
Hermes. Datos clínicos, RGPD estricto, derivación obligatoria a profesional para cualquier duda médica. El self-hosting permite gestionar citas y resolver dudas administrativas con los datos reales de la clínica sin que la información sensible viaje a terceros. La privacidad no es negociable en salud, y eso decide el enfoque.
Comercio y tiendas
Depende del volumen y de cuánto importen tus datos. Si quieres que el asistente responda con tu catálogo, stock y tarifas reales y recuerde a los clientes, te interesa la capa Hermes. Si solo buscas generar descripciones de producto o contenido de marketing con varios modelos, un gateway basta. Muchos comercios acaban combinando: gateway por debajo, asistente con memoria por encima.
Empresas de servicios (reformas, consultoría, agencias)
Habitualmente Hermes, porque el valor está en responder con tus precios, filtrar lo que no haces, agendar y recordar el historial de cada solicitud. La memoria y los datos propios convierten la avalancha de "¿cuánto me costaría...?" en leads cualificados. El gateway solo no llega a ese nivel de personalización.
Equipos que experimentan con IA
OpenClaw como punto de partida. Si tu empresa aún explora qué modelo y qué casos le sirven, empezar por un gateway flexible te da margen sin comprometerte. Cuando un caso de uso concreto pide memoria y datos propios, añades la capa Hermes encima. Empezar flexible y especializar es una secuencia sensata.
El escenario real: usarlos juntos
En la mayoría de montajes serios no eliges entre Hermes y OpenClaw: usas el gateway por debajo del asistente con memoria. Esta es la conclusión técnica que más sorprende al cliente, así que la explicamos con calma.
Un asistente con memoria y datos propios (Hermes) necesita un modelo de lenguaje por debajo para generar las respuestas. Ese modelo puede venir a través de un gateway multi-modelo (OpenClaw). Resultado: el asistente conserva su memoria, sus datos y su privacidad, pero gana la flexibilidad de elegir entre GPT, Claude o Gemini según la tarea, repartir carga y evitar el lock-in. La memoria y los datos los pone Hermes; la optionalidad de modelo la pone el gateway.
Visto así, la pregunta "¿Hermes o OpenClaw?" se transforma en "¿qué capas necesito?":
- Si solo necesitas elegir entre modelos para tareas genéricas: el gateway, y poco más.
- Si necesitas que la IA conozca tus datos, recuerde y respete tu privacidad: el asistente con memoria, que internamente puede apoyarse en un gateway.
Por eso un buen montaje deja el modelo desacoplado: si mañana sale uno mejor o más barato, lo cambias sin rehacer nada. Atarte a un único proveedor por pereza es un error que se paga, y esa lección vale tanto para el enfoque Hermes como para el OpenClaw.
Cómo se ve por dentro cada enfoque (arquitectura sin jerga)
Por dentro, un gateway es una capa de enrutado entre tu aplicación y los modelos; un asistente self-hosted es esa misma idea más dos capas propias: datos (RAG) y memoria. Entender la plomería sirve para una cosa muy práctica: que nadie te cobre un Ferrari por un patinete, ni un patinete cuando pediste un Ferrari.
Lo que hace un gateway, paso a paso
Cuando una petición entra a un gateway, el recorrido es corto y limpio:
- Recibe la petición desde tu aplicación, tu web o tu herramienta interna.
- Decide el modelo según una regla que tú configuras: por tipo de tarea, por coste, por disponibilidad, o porque el usuario lo eligió.
- Reenvía la petición al proveedor elegido (OpenAI, Anthropic, Google) usando sus credenciales.
- Devuelve la respuesta a tu aplicación, a veces con métricas de coste y uso por el camino.
Fíjate en lo que NO hay en esa lista: no hay paso de "buscar en los datos de la empresa" ni de "recordar conversaciones anteriores". Un gateway, por definición, no toca tus datos ni tu memoria. Esa es su virtud (es ligero, rápido de montar) y su límite (no conoce tu negocio). Confundir un gateway con un asistente completo es el malentendido número uno del sector.
Lo que añade un asistente self-hosted
El enfoque Hermes coge esa pasarela y la envuelve en dos capas que cambian todo:
- La capa de datos (RAG). Antes de pedirle nada al modelo, el sistema busca en tu base de conocimiento los fragmentos relevantes a la pregunta y se los entrega al modelo junto con ella. Tus documentos se trocean, se convierten en representaciones numéricas que capturan su significado (embeddings) y se guardan en una base de datos preparada para búsquedas instantáneas. El efecto práctico: el modelo responde mirando tu manual, no de memoria. Y cuando cambias un documento, se reindexa y el asistente lo sabe al instante, sin reentrenar nada.
- La capa de memoria. Cada conversación deja un poso estructurado: quién preguntó, qué se resolvió, qué prefiere ese cliente o empleado. La próxima vez, el asistente recupera ese historial y parte de lo que ya sabe.
Y todo eso vive en infraestructura que tú controlas. Por eso el montaje de un asistente serio dedica buena parte del esfuerzo —en nuestra experiencia, en torno al 40%— a una tarea que el cliente no ve: limpiar y estructurar los datos. Un PDF mal escaneado con tablas que son imágenes, o dos documentos con precios contradictorios, son veneno para el asistente. "Basura entra, basura sale" se cumple sin piedad. Quien te venda la ingesta de datos como "súbelo y ya está" no ha montado uno de verdad.
Por qué la arquitectura combinada es la más limpia
Cuando juntas las dos cosas —asistente con memoria por encima, gateway por debajo— consigues lo mejor de cada lado: el asistente conserva la verdad sobre tu negocio y el control del dato, y delega en el gateway la elección del modelo. Cambias de GPT a Claude para una tarea concreta sin tocar la capa de datos ni la de memoria. Esta separación de responsabilidades es lo que hace que un montaje envejezca bien: cada pieza se cambia sin romper las demás.
Hermes, OpenClaw y la automatización: de responder a actuar
Tanto un asistente con memoria como un gateway ganan músculo cuando se conectan a la automatización: dejan de solo responder y empiezan a ejecutar acciones. Esta es la frontera que separa un asistente "que informa" de uno "que trabaja", y conviene entenderla porque cambia el retorno de la inversión.
Un asistente que responde bien es útil. Uno que, además, crea el ticket, agenda la cita, envía el presupuesto o actualiza el CRM es otra liga. Esa capacidad de actuar no viene del modelo ni del gateway: viene de conectar el asistente a herramientas de automatización (como n8n) que ejecutan los pasos. Lo desarrollamos en automatización con n8n e IA para empresas, pero la idea para esta comparativa es esta:
- Con un gateway solo, automatizar es posible pero el asistente actúa "a ciegas" sobre tu negocio: no sabe qué cliente es ni qué pasó antes, así que las acciones quedan limitadas a lo genérico.
- Con un asistente tipo Hermes, la automatización se vuelve precisa: el asistente sabe quién pregunta, recuerda el historial y consulta tus datos antes de ejecutar. Agenda la cita en el hueco correcto, manda el presupuesto con tu tarifa real, crea el ticket con el contexto completo. La memoria y los datos convierten la automatización de "robótica" en "con criterio".
Por eso, cuando el objetivo no es solo responder sino operar dentro de tu negocio, el enfoque con memoria y datos rinde más. El gateway sigue ahí, por debajo, dando flexibilidad de modelo; pero quien aporta el contexto para que las acciones tengan sentido es la capa Hermes.
Coste total de propiedad (TCO) y retorno: pensar a 12 meses
El coste que importa no es el del primer mes, sino el de los primeros doce: montaje, infraestructura, consumo de modelos y mantenimiento sumados. Hacer este cálculo a un año vista evita la sorpresa más habitual, que es presupuestar solo la puesta en marcha.
Las cuatro partidas de coste
Sea cual sea el enfoque, el gasto se reparte en cuatro cajones. Verlos por separado te permite comparar peras con peras:
- Montaje (pago único). En un gateway, integración y configuración del enrutado. En un asistente self-hosted, además, ingesta y limpieza de datos, capa de memoria y despliegue de la infraestructura. Por eso el segundo parte de un rango más alto.
- Infraestructura (recurrente). En el self-hosting, el servidor donde vive el asistente y sus datos. En un gateway en la nube, esta partida puede ser mínima porque la infra del modelo la lleva el proveedor.
- Consumo de modelos (recurrente, variable). Lo que cuesta cada llamada a GPT, Claude o Gemini. Escala con el volumen de uso. Aquí un gateway bien configurado ayuda: manda lo simple al modelo barato y reserva el caro para lo que lo necesita.
- Mantenimiento (recurrente, el olvidado). Actualizaciones, copias, monitorización, gestión de la base de conocimiento. Mayor en self-hosted; menor (pero no nulo) en gateway.
Dónde está el retorno
El retorno de un asistente de IA, cuando lo hay, viene de tres sitios concretos y medibles: tiempo de equipo liberado (consultas repetitivas que ya no atiende una persona), disponibilidad ampliada (responder 24/7 sin coste de turno) y conversión (leads que se cualifican o citas que se agendan solas fuera de horario).
La clave para decidir el enfoque: el retorno por datos propios y memoria (responder con TU precio, recordar al cliente, agendar con criterio) solo lo captura el enfoque Hermes. El retorno por flexibilidad de modelo (usar el más barato para cada tarea, no quedarte atado) lo captura el gateway. Si tu retorno esperado vive en el primer grupo, paga la capa de datos y memoria; se amortiza. Si vive en el segundo, no infles el proyecto con self-hosting que no usarás.
Un aviso honesto: si tu volumen de consultas repetitivas es bajo, ninguno de los dos enfoques renta, porque no hay suficiente trabajo que automatizar para cubrir el coste recurrente. La IA propia brilla con volumen y repetición. Sin ellos, una persona lo hace mejor y más barato. Decirlo antes de cobrar es lo mínimo.
Mitos que conviene desmontar
Hay media docena de creencias sobre estos dos enfoques que llevan a decisiones caras. Las aclaramos una a una, porque corregirlas te ahorra dinero.
"Self-hosted es más inteligente." Falso. La inteligencia la pone el modelo, y es el mismo GPT, Claude o Gemini tanto si lo usas vía gateway como dentro de un asistente self-hosted. Lo que aporta el self-hosting no es un cerebro mejor, sino control, privacidad y memoria sobre TUS datos. Pagar self-hosting esperando respuestas "más listas" es comprar lo que no vende.
"Un gateway es inseguro por definición." Falso. Un gateway que enruta a APIs de pago (que no entrenan con tus datos) y se configura con criterio puede ser perfectamente compatible con RGPD. La diferencia con el self-hosting es de grado de control, no de "seguro contra inseguro". El self-hosting da más soberanía; un gateway bien contratado sigue siendo legítimo.
"Hermes y OpenClaw compiten por el mismo trabajo." Falso, y es el malentendido central. Operan en capas distintas: uno aporta datos y memoria, el otro aporta acceso a modelos. Lo natural es combinarlos, no elegir uno descartando el otro.
"Self-hosting elimina el coste de las APIs." Falso, salvo que alojes también el modelo (lo cual tiene su propio coste de infraestructura y suele requerir hardware potente). Lo habitual es que un asistente self-hosted siga llamando a modelos en la nube vía API. El self-hosting protege tus DATOS, no necesariamente te ahorra el consumo del modelo.
"Con un gateway ya tengo un asistente de empresa." Falso. Tienes acceso flexible a modelos, que es valioso, pero no un asistente que conozca tu negocio ni recuerde nada. De cara al cliente, eso se nota: respuestas genéricas o inventadas. Para "asistente de empresa" de verdad necesitas la capa de datos y memoria por encima.
"El self-hosting lo monto y me olvido." Falso, y caro. La infraestructura propia necesita mantenimiento continuo: actualizaciones, copias, vigilancia. Si no tienes perfil técnico interno, ese mantenimiento se delega y se paga. Presupuestarlo desde el día uno es la diferencia entre un proyecto sano y uno que se degrada a los seis meses.
Migrar de un enfoque a otro: ¿se puede?
Sí, se puede migrar de un gateway a un asistente con memoria y viceversa, y planificarlo desde el inicio te ahorra rehacer trabajo. Esta es una pregunta que casi nadie hace antes de empezar y que evita arrepentimientos.
El camino más común y más sano es empezar por el gateway y añadir la capa Hermes después. Si arrancas con un gateway bien montado (modelo desacoplado, integración limpia), añadir encima la capa de datos y memoria cuando un caso de uso lo pida es una evolución natural, no una demolición. El gateway que ya tienes pasa a vivir por debajo del asistente. Empezaste flexible, especializas cuando hace falta.
El camino inverso —de self-hosted a "solo gateway"— es menos frecuente porque implica renunciar a la memoria y los datos, y rara vez quieres eso una vez que los tienes. Pero ocurre: a veces una empresa descubre que su caso de uso no necesitaba tanta especialización y simplifica. Es viable si el montaje original dejó el modelo desacoplado.
La lección de arquitectura que vale para ambos: exige desde el primer día que el modelo quede desacoplado y que los datos sean portables. Un montaje que te ata a un único modelo o que guarda tus datos en un formato propietario del que no puedes salir es deuda técnica que pagas justo cuando quieres cambiar. La portabilidad no es un capricho técnico: es tu libertad de decisión a futuro. Si exploras a fondo cómo montar la capa de gateway desde cero, lo detallamos en montar OpenClaw en tu empresa.
Marco de decisión: tres preguntas y ya
Para decidir entre Hermes y OpenClaw, responde tres preguntas. No necesitas más. Te las dejamos en orden, con la lógica de qué te dice cada respuesta.
Pregunta 1: ¿El conocimiento propio de tu empresa hace útil la respuesta?
Pregúntate: ¿la respuesta correcta depende de mis datos (precios, catálogo, procesos, historial), o me vale con conocimiento general?
- Depende de mis datos → apunta a Hermes. Necesitas la capa de datos y memoria.
- Me vale conocimiento general → un gateway basta. No montes memoria que no usarás.
Pregunta 2: ¿La privacidad y la soberanía del dato son un requisito duro?
Pregúntate: ¿tengo datos sensibles, exigencias de RGPD estrictas o una regla de "el dato no sale de aquí"?
- Sí, es un requisito → refuerza el self-hosted (Hermes). La soberanía del dato decide.
- No especialmente → la ventaja de privacidad de Hermes pesa menos; valora el coste frente al beneficio real.
Pregunta 3: ¿Solo quieres flexibilidad de modelo para tareas genéricas?
Pregúntate: ¿mi necesidad principal es usar varios modelos, evitar el lock-in y controlar coste, sin memoria ni datos propios?
- Sí, eso es lo que busco → un gateway tipo OpenClaw es exactamente tu herramienta.
- No, también necesito datos/memoria → necesitas Hermes (que por debajo puede usar un gateway).
El patrón de respuestas más común en pymes con un caso de uso real de cara al cliente es: sí a la 1, depende a la 2, y "también necesito datos" en la 3. Eso apunta a un asistente con memoria (Hermes) apoyado en un gateway (OpenClaw) por debajo. El patrón de "quiero experimentar con modelos sin más" apunta al gateway solo. Ninguno es el correcto en abstracto: el correcto es el que encaja con tus respuestas.
Errores comunes al elegir entre los dos enfoques
Después de montar ambos enfoques para distintos clientes, los fallos de decisión se repiten. Evítalos.
- Montar self-hosted por moda, sin datos propios que lo justifiquen. Pagar por memoria y privacidad que no vas a usar porque "queda más serio". Si tus tareas no tocan tus datos, es tirar el dinero.
- Quedarte solo en el gateway cuando necesitabas memoria. El error inverso: montas una pasarela barata, la pones de cara al cliente y descubres que da respuestas genéricas o inventadas porque no conoce tu negocio. Te falta la capa Hermes.
- Olvidar el coste de mantenimiento del self-hosted. Presupuestar solo el montaje y descubrir a los seis meses que nadie mantiene la infraestructura. El mantenimiento va en el presupuesto desde el día uno.
- Creer que privacidad = self-hosted siempre, y punto. El self-hosting da ventaja en privacidad, pero un gateway bien contratado también puede cumplir RGPD. No pagues self-hosted "por seguridad" si tus datos no son sensibles y una API en regla te basta.
- Atarte a un único modelo desde el principio. Pereza arquitectónica. Tanto si vas a Hermes como a OpenClaw, exige que el modelo quede desacoplado para poder cambiarlo.
- Confundir "asistente self-hosted" con "más inteligente". No lo es. La inteligencia la pone el modelo (el mismo GPT, Claude o Gemini). Lo que aporta el self-hosting es control, privacidad y memoria sobre TUS datos, no un cerebro mejor.
- No tener plan para cuando el asistente no sabe. Vale para ambos enfoques: define siempre la salida ("te paso con una persona"). Sin ella, el modelo inventará.
- Decidir por el nombre y no por el problema. "Quiero Hermes" o "quiero OpenClaw" sin haber definido el caso de uso. Primero el problema, luego la arquitectura. Siempre en ese orden.
Cómo empezar sin equivocarte de enfoque
Si has llegado hasta aquí y crees que tu empresa necesita IA de verdad, el camino sensato es este, por orden.
- Define UN problema concreto. "Atender consultas de horarios y precios fuera de horario con mis datos reales", no "tener IA". Cuanto más acotado, mejor encaja el enfoque y mejor sale el resultado.
- Pasa tu caso por las tres preguntas. Conocimiento propio, privacidad, flexibilidad de modelo. Las respuestas te dicen si vas a Hermes, a OpenClaw o a la combinación.
- Haz inventario de tu información. Si te inclinas a Hermes, ¿están tus datos ordenados? ¿En qué formato? Esto determina la mitad del coste y del éxito. Datos sucios = asistente que alucina.
- Exige presupuesto cerrado por alcance, no por horas abiertas. Y pide ver casos reales funcionando, no demos de laboratorio. Que el proveedor te enseñe algo en marcha.
- Asegura el control de tus datos por contrato. Dónde se alojan, qué proveedor de modelo, qué pasa con la privacidad, quién mantiene la infraestructura. Que conste por escrito, sea el enfoque que sea.
- Empieza pequeño y mide. Un montaje que resuelve bien una cosa y luego se amplía es infinitamente mejor que uno que pretende todo y no hace nada. Mide qué resuelve, qué deriva y qué genera quejas, y afina.
En YAG montamos los dos enfoques según lo que pida tu caso: asistentes self-hosted con memoria propia y datos reales cuando importa el dato y la continuidad, y gateways multi-modelo cuando lo que necesitas es flexibilidad sin lock-in. Y, muy a menudo, la combinación de ambos. Catorce años, más de 890 proyectos y un stack propio (Next.js, RAG, automatización con n8n y modelos GPT/Claude/Gemini) que ya da servicio a clientes en Tenerife. Si quieres saber qué enfoque renta en tu caso —y te diremos la verdad si ninguno renta todavía—, hablamos sin compromiso o miras lo que hacemos en inteligencia artificial. Y si quieres el contexto previo, empieza por qué es un asistente de IA con memoria propia.
Cómo evaluar al proveedor (las preguntas que separan a los serios)
Para distinguir a un proveedor serio de uno que improvisa, pregúntale por el mantenimiento, por la portabilidad de tus datos y por casos reales funcionando. Las respuestas a esas tres cosas te dicen más que cualquier folleto. Sea cual sea el enfoque que acabes contratando, estas son las preguntas que conviene hacer en la primera reunión, con la respuesta que deberías oír.
- "¿Quién mantiene esto a los seis meses y cuánto cuesta?" Un proveedor serio te habla del mantenimiento sin que se lo preguntes. Si solo te vende el montaje y esquiva el mantenimiento, desconfía: te está enseñando el coche y escondiendo la gasolina.
- "¿Mis datos son portables? Si mañana me voy, ¿me los llevo y en qué formato?" La respuesta correcta es sí, y en un formato abierto. Si tus datos quedan atrapados en un sistema propietario del que no puedes salir, estás comprando una jaula.
- "¿El modelo está desacoplado? ¿Puedo cambiar de GPT a Claude o Gemini sin rehacer el proyecto?" Debe ser sí. Atarte a un único proveedor de modelo es deuda técnica desde el día uno, y un proveedor serio lo evita por diseño.
- "¿Qué pasa con la privacidad? ¿Dónde se alojan mis datos y qué proveedor de modelo se usa?" Tiene que darte una respuesta concreta, no un "está todo seguro" genérico. En self-hosted, dónde está el servidor. En gateway, qué APIs y bajo qué condiciones.
- "¿Me enseñas un caso real funcionando, no una demo de laboratorio?" Un proveedor con rodaje te muestra algo en marcha. Las demos perfectas de feria suelen esconder que en producción la cosa es otra.
- "¿Qué pasa cuando el asistente no sabe algo?" Debe existir un plan de escape claro ("te paso con una persona", "abro un ticket"). Si no lo hay, el asistente inventará, y eso es peor que no tenerlo.
Estas preguntas no requieren que entiendas la tecnología. Requieren que el proveedor te respete lo bastante como para contestarlas con claridad. La forma de contestarlas ya te dice con quién estás hablando.
Gobernanza y seguridad: lo mínimo que debes exigir
En ambos enfoques, lo mínimo exigible es: control de accesos (quién puede usar el asistente y con qué permisos), trazabilidad (registro de qué se preguntó y qué se respondió) y un proveedor de modelo que no entrene con tus datos. Esto aplica tanto a Hermes como a OpenClaw, y conviene tenerlo claro porque la seguridad no es solo "dónde viven los datos".
Control de accesos. No todo el mundo debe poder preguntarle todo al asistente. Un asistente interno conectado a información sensible (nóminas, márgenes, datos de clientes) necesita que el acceso esté segmentado: cada usuario ve lo que le corresponde. En un montaje serio esto se define desde el principio, no se parchea después de un susto.
Trazabilidad. Saber qué se preguntó y qué se respondió no es espiar: es poder auditar. Si un cliente reclama que el asistente le dio un dato erróneo, necesitas poder revisar la conversación. Si el asistente empieza a responder mal, necesitas detectar el patrón. Sin registro, vuelas a ciegas.
El modelo no entrena con tus datos. Este es el punto que más se descuida con prisa. La versión gratuita de muchos servicios de IA puede usar lo que pegas para entrenar el modelo. Para empresa, eso es inaceptable con datos confidenciales. La regla es: API de pago (que por contrato no entrena con tu información) o modelo en infraestructura propia. Esto vale igual si usas un gateway (que debe enrutar a APIs en esas condiciones) que si montas self-hosted.
Transparencia con el cliente. Cuando el asistente es de cara al público, avisa de que es una IA. Esconderlo genera desconfianza cuando se descubre, y se descubre siempre. La transparencia no resta: un cliente bien atendido por una IA que se presenta como tal queda satisfecho; uno que se siente engañado, no vuelve.
La gobernanza es el aburrido pero decisivo telón de fondo de cualquier proyecto de IA en empresa. Un montaje brillante sin control de accesos ni trazabilidad es un accidente esperando a ocurrir. Y aquí, de nuevo, el self-hosting (Hermes) da más palancas de control por diseño, mientras que con un gateway hay que asegurarse de que la configuración cumple. Ninguno está exento: ambos exigen criterio.
Conclusión: no elijas el nombre, elige la capa que necesitas
Hermes y OpenClaw no son rivales: son dos capas de la misma arquitectura. Hermes aporta conocimiento de tu negocio, memoria persistente y soberanía del dato gracias al self-hosting; es lo que necesitas cuando la respuesta útil depende de TUS datos y la privacidad importa. OpenClaw aporta flexibilidad de modelo, portabilidad y control de coste; es lo que necesitas cuando solo quieres elegir entre modelos para tareas genéricas. Y lo más común en montajes serios es usar el gateway por debajo del asistente con memoria, porque se complementan.
La pregunta no es "¿Hermes o OpenClaw?". Es "¿mi respuesta útil depende de mis datos? ¿La privacidad es un requisito duro? ¿O solo quiero flexibilidad de modelo?". Responde esas tres y la arquitectura correcta se elige sola. Si te inclinas al self-hosting, presupuesta el mantenimiento, no solo el montaje. Si te inclinas al gateway, deja la puerta abierta a añadir memoria después. Y si alguien te empuja hacia un enfoque sin haberte preguntado por tu problema, desconfía: la decisión correcta empieza por tu caso, nunca por el producto. Eso es justo lo que acabamos de hacer aquí.
