Cómo montar tu propia IA privada para hacking ético con Ollama y Open WebUI

¿Alguna vez le has pedido a ChatGPT que te explique cómo funciona una herramienta de hacking y te ha dicho «lo siento, no puedo ayudarte con eso»?

A mí me ha pasado. Estoy trabajando, necesito entender cómo opera una técnica de ataque para poder detectarla o replicarla en un laboratorio, y el modelo me bloquea. Me trata igual que si fuera un atacante real. Y eso, cuando estás aprendiendo hacking ético o trabajando en ciberseguridad, te ralentiza.

Hoy te voy a enseñar cómo montar tu propia IA privada para hacking ético: un modelo sin restricciones, en tu servidor, accesible desde cualquier dispositivo. Sin censura. Sin rechazos. Una herramienta de trabajo real.

Por qué necesitas un modelo de IA sin restricciones

Los modelos comerciales como ChatGPT, Gemini o Claude tienen restricciones de seguridad. Si les preguntas algo relacionado con hacking, en muchos casos te rechazan la pregunta. Da igual que seas un profesional, que estés practicando en un laboratorio de hacking o que estés estudiando para una certificación.

El problema es que la IA no distingue entre alguien que quiere atacar un sistema real y alguien que quiere entender cómo funciona un ataque para defenderse de él. Te bloquea igual.

Y eso es un problema real cuando estás aprendiendo. Si quieres entender cómo funciona un exploit, cómo se estructura un payload, o cómo opera un keylogger para poder detectarlo, necesitas un asistente que no te ponga barreras artificiales.

La solución: correr tu propio modelo de IA en tu servidor. Sin restricciones. Privado. Accesible desde cualquier dispositivo.

Las herramientas que vamos a usar

Para montar esto necesitamos tres componentes:

Ollama – El motor de IA

Ollama es un framework de código abierto que te permite ejecutar modelos de IA en tu propia máquina. Simplifica todo el proceso: descargas el modelo, lo ejecutas, y ya puedes hablar con él desde la terminal. Es el mismo motor que Kali Linux ha integrado en sus últimas versiones para IA local.

Open WebUI – La interfaz

Open WebUI es una interfaz web para gestionar tus modelos Ollama. Funciona como un ChatGPT privado: desde el navegador, desde el móvil, desde donde quieras. Puedes subir archivos, usar dictado, gestionar varios modelos, y tener historial de conversaciones. Todo en tu servidor.

Un VPS – El servidor

Para que el modelo esté siempre activo, accesible desde cualquier dispositivo, y sin consumir la RAM y CPU de tu equipo personal. Con un VPS de 8 GB de RAM puedes correr modelos de 4B parámetros sin problemas.

Te dejo aquí el enlace para adquirir el VPS que yo mismo utilizo https://hostinger.com/rinku y usa el código RINKU en el proceso de compra para recibir un descuenti

Qué modelo usar: Gemma 4

Y ahora la parte que a todo el mundo le interesa: ¿qué modelo instalo?

Yo uso Gemma 4 de Google. Es un modelo de código abierto con licencia Apache 2.0 (totalmente libre, sin restricciones comerciales) Fue lanzado en abril de 2026 y es parte de la misma familia de investigación que Gemini 3 de Google.

¿Por qué este y no otro?

Es lo suficientemente pequeño para correr en un VPS con 8 GB de RAM sin problemas. No necesitas una máquina monstruosa.

Es lo suficientemente capaz para responder preguntas técnicas de seguridad ofensiva, generar código funcional y explicar técnicas de ataque sin rechazos.

Es multimodal: puede procesar texto, imágenes y audio, lo que lo hace útil para analizar capturas de pantalla de herramientas o outputs gráficos.

Licencia Apache 2.0: sin restricciones de uso, sin royalties, sin límites. Lo usas como quieras.

Hay modelos más grandes (Gemma 4 26B, Gemma 4 31B) que son más potentes, pero necesitan 32+ GB de RAM. Para aprender hacking ético, Gemma 4 E4B da de sobra. Es la mejor relación calidad/recursos que he encontrado.

Instalación paso a paso

Vamos con la parte práctica.

Paso 1 – Preparar el VPS

Necesitas un VPS con al menos 8 GB de RAM. Algunos proveedores ofrecen la opción de instalar Ollama y Open WebUI directamente como aplicación preconfigurada, lo que te ahorra todo el proceso de instalación manual.

Si prefieres hacerlo a mano, necesitas un VPS con Ubuntu o cualquier distribución basada en Debian.

Paso 2 – Instalar Ollama

Conéctate a tu servidor por SSH e instala Ollama:

curl -fsSL https://ollama.com/install.sh | sh

Verifica la instalación:

ollama --version

Paso 3 – Instalar Open WebUI

Open WebUI se instala automáticamente con Ollama en el VPS

Ya tienes una interfaz tipo ChatGPT corriendo en tu servidor privado.

Paso 4 – Instalar Gemma 4

Desde la interfaz de Open WebUI, ve al panel de administración, sección de modelos, y en «Pull a model» escribe:

gemma4

Dale a descargar. El modelo se descarga directamente en tu VPS. Cuando termine, selecciónalo como modelo activo y estás listo.

También puedes hacerlo desde la terminal:

ollama pull gemma4

Usando la IA privada

Vamos a probarlo. Puedes hacerle exactamente las mismas preguntas que un modelo comercial te rechazaría:

¿Cómo funciona un ataque de inyección SQL y cómo se detecta?
Genera un script de reconocimiento para un CTF
Explícame cómo opera un keylogger para poder detectarlo en un análisis forense
¿Cómo se estructura un payload de reverse shell y cómo puedo identificarlo en tráfico de red?

Respuesta directa, técnica, útil. Sin «lo siento, no puedo ayudarte con eso».

Y puedes seguir preguntando. Puedes pedirle que profundice, que te dé alternativas, que te explique cómo detectar cada técnica. Es un asistente de hacking ético que no te pone barreras.

Todo desde el navegador, desde el móvil, desde una tablet. El modelo corre en el servidor. Tú solo necesitas conexión a internet.

Casos de uso prácticos para hacking ético

Para que te hagas una idea de cómo puedes usar tu IA privada en el día a día:

Preparación de certificaciones: pregúntale sobre técnicas que aparecen en el OSCP o el eJPTv2 sin que te bloquee. Pídele escenarios de práctica, explicaciones de exploits, o que te genere preguntas de examen.

CTFs y labs: pídele ayuda con máquinas de HackTheBox, TryHackMe o Dockerlabs. Puede analizar outputs, sugerir vectores de ataque y explicarte por qué una técnica funciona.

Análisis de código: pégale código sospechoso y pídele que identifique vulnerabilidades. Sin restricciones, puede analizar payloads, shells y scripts maliciosos para ayudarte a entenderlos.

Generación de reportes: dale los hallazgos de tu pentesting y pídele que te ayude a redactar el informe.

Si quieres una guía completa de por dónde empezar en ciberseguridad y qué herramientas aprender primero, te recomiendo mi guía para iniciar en ciberseguridad.

Preguntas frecuentes sobre utilizar IA de forma local o privada

1. ¿Qué es Ollama y para qué sirve?

Ollama es un framework de código abierto que permite ejecutar modelos de inteligencia artificial (LLMs) en tu propia máquina o servidor. Simplifica la descarga, instalación y ejecución de modelos como Gemma, Llama o Qwen. A diferencia de servicios en la nube como ChatGPT, el modelo corre localmente y tus datos no salen de tu infraestructura.

2. ¿Es legal usar un modelo de IA sin restricciones para hacking?

Sí, siempre que lo uses para aprender hacking ético, practicar en entornos controlados y trabajar con autorización. La herramienta en sí es legal . lo que importa es cómo la usas. Es lo mismo que con nmap o Metasploit: herramientas legítimas que pueden usarse de forma ética o no. La responsabilidad es del usuario.

3. ¿Por qué Gemma 4 E4B y no otro modelo?

Gemma 4 E4B ofrece la mejor relación calidad/recursos para hacking ético: corre en un VPS de 8 GB de RAM, tiene licencia Apache 2.0 sin restricciones, es multimodal y responde preguntas técnicas de seguridad sin bloqueos. Modelos más grandes son más capaces pero necesitan 32+ GB de RAM, lo que encarece la infraestructura.

4. ¿Cuánto cuesta mantener un servidor con Ollama y Open WebUI?

Un VPS con 8 GB de RAM cuesta aproximadamente entre 8 y 15 euros al mes según el proveedor. El software (Ollama, Open WebUI y Gemma 4) es completamente gratuito y open source. El único coste recurrente es el servidor. Si tu equipo personal tiene 16+ GB de RAM, puedes correrlo en local sin coste adicional.

5. ¿Puedo usar Open WebUI desde el móvil?

Sí. Open WebUI es una interfaz web responsive. Accedes desde cualquier navegador: ordenador, móvil, tablet. No necesitas instalar ninguna aplicación. Solo necesitas la URL de tu servidor y tus credenciales de acceso.

6. ¿Qué diferencia hay entre esto y usar la IA de Kali Linux?

Kali Linux integra Ollama directamente en su sistema, pero lo ejecutas en la misma máquina donde trabajas. Con un VPS, el modelo está siempre encendido y accesible desde cualquier dispositivo, sin consumir recursos de tu equipo. Además, Open WebUI te da una interfaz web mucho más completa que la terminal de Ollama.

7. ¿El modelo se equivoca? ¿Puedo fiarme de sus respuestas?

Como cualquier LLM, Gemma 4 puede cometer errores, inventar datos o generar código con bugs. Nunca ejecutes código generado por IA sin revisarlo antes, especialmente en entornos de pentesting. Usa el modelo como asistente, no como oráculo. Tu criterio técnico sigue siendo imprescindible.

8. ¿Puedo instalar varios modelos en el mismo servidor?

Sí. Ollama permite tener múltiples modelos instalados y cambiar entre ellos. Open WebUI te deja seleccionar qué modelo usar en cada conversación. Puedes tener Gemma 4 para consultas técnicas y otro modelo especializado en código, por ejemplo. Solo ten en cuenta que cada modelo consume espacio en disco.

9. ¿Qué pasa si mi VPS no tiene GPU?

Gemma 4 E4B funciona bien con solo CPU en un VPS de 8 GB de RAM. Las respuestas son más lentas que con GPU, pero perfectamente usables para consultas de texto. Si necesitas velocidad o quieres correr modelos más grandes, necesitarás un servidor con GPU, lo que sube considerablemente el precio.

10. ¿Puedo compartir el acceso con compañeros de equipo?

Sí. Open WebUI tiene sistema de usuarios con roles. Puedes crear cuentas para otros usuarios, configurar permisos y gestionar quién tiene acceso a qué modelos. Esto lo hace útil para equipos de seguridad que quieran compartir un asistente de IA privado sin dar acceso de administrador a todos.