Versión Web
Sitio oficial de la marca
Herramienta de consola para ejecutar y gestionar modelos de lenguaje grandes de forma local y privada en tu ordenador.
Usuarios que buscan ollama
Usuarios que buscan local
Usuarios que buscan offline
Usuarios que buscan open source
Canales oficiales
No alojamos instaladores ni mirrors.
Sitio oficial de la marca
Instalador oficial directo
Instalador oficial directo
Documentación oficial de API/Dev
Ollama es una herramienta ligera y open-source para ejecutar modelos de inteligencia artificial (como Llama 3, Mistral o Phi 3) directamente en tu ordenador. Funciona mediante línea de comandos o levantando un servidor local API compatible, garantizando privacidad total y funcionamiento offline.
Guía editorial
Ollama responde a una necesidad específica: ejecutar modelos de lenguaje grandes directamente en tu computadora, sin enviar datos a servidores externos, sin límites de uso por suscripción y sin depender de una conexión a internet para cada consulta. Las búsquedas de "descargar Ollama para Windows", "cómo instalar Ollama en Mac" o "modelos locales con Ollama" vienen principalmente de desarrolladores, investigadores y usuarios técnicos que quieren experimentar con IA sin pasar por los servicios de nube comerciales.
A diferencia de ChatGPT, Claude o Gemini, Ollama no es una interfaz de chat: es una herramienta de línea de comandos que gestiona modelos de lenguaje localmente. Eso significa que el flujo de uso es diferente y más técnico. Si llegaste aquí buscando una app de IA fácil de usar desde el navegador, probablemente lo que buscás es otra herramienta. Si llegaste queriendo correr Llama, Mistral, Gemma o Phi directamente en tu equipo, Ollama es una de las formas más limpias de hacerlo.
Ollama se distribuye desde ollama.com, que es el único canal oficial. El instalador está disponible para macOS, Windows y Linux. En macOS la instalación es una app estándar; en Windows es un instalador ejecutable; en Linux hay un script de instalación documentado en la web oficial. El proceso en los tres casos está bien documentado y no requiere configuración compleja para empezar.
El punto de cuidado con Ollama es específico: al ser una herramienta de código abierto popular, existen múltiples repositorios, forks y redistribuciones que no son el proyecto oficial. La referencia correcta siempre es ollama.com para los instaladores y el repositorio oficial en GitHub (github.com/ollama/ollama) para el código fuente. Cualquier ejecutable que no venga de esas dos fuentes debe tratarse con precaución.
Una vez instalado, Ollama funciona como un servidor local que gestiona modelos de lenguaje. Con un comando como `ollama run llama3` podés descargar y ejecutar el modelo Llama 3 directamente en tu máquina. El catálogo disponible incluye modelos de Meta (Llama), Google (Gemma), Microsoft (Phi), Mistral AI y muchos otros, con variantes de diferentes tamaños según la memoria disponible en tu equipo.
Ollama también expone una API local compatible con el formato de OpenAI, lo que significa que podés conectarlo con clientes de escritorio como Open WebUI para tener una interfaz gráfica, o integrarlo directamente en aplicaciones propias que ya usan la API de ChatGPT. Esa compatibilidad lo convierte en una pieza de infraestructura flexible para quienes construyen sobre modelos de lenguaje.
Ejecutar modelos de lenguaje localmente tiene un costo de hardware que no existe con los servicios de nube. Los modelos más pequeños (1B-3B parámetros) pueden correr en computadoras con 8GB de RAM, aunque con velocidades moderadas. Modelos medianos (7B-13B parámetros) requieren 16GB de RAM o más para funcionar cómodamente. Los modelos grandes (70B+) necesitan GPUs dedicadas con memoria de video suficiente para ser utilizables.
Si tu equipo tiene una GPU compatible (NVIDIA con CUDA o Apple Silicon con Metal), Ollama la usa automáticamente para acelerar la inferencia. En CPU puro el rendimiento es funcional para uso personal pero puede ser lento en modelos grandes. Antes de instalar, vale la pena revisar la documentación de Ollama para entender qué modelos son realistas para el hardware disponible.
Ollama tiene sentido cuando la privacidad, el control o el costo son prioritarios. Si trabajás con datos que no pueden salir de tu organización, si querés experimentar con modelos sin límites de uso, o si preferís no depender de servicios externos para tus herramientas de desarrollo, Ollama es una opción sólida. También es la elección natural para desarrolladores que quieren integrar modelos de lenguaje en sus propias aplicaciones sin pagar por APIs de terceros.
Si preferís una interfaz gráfica para gestionar y chatear con modelos locales sin usar la línea de comandos, LM Studio es una alternativa que cubre el mismo caso de uso con una experiencia más visual. Ambas herramientas conviven bien: algunos usuarios usan Ollama para la gestión de modelos y conectan clientes de terceros para la interfaz. Lo importante es que ambas tienen canales oficiales de descarga que esta ficha enlaza directamente.
Seguridad y Descarga
Sí. Ollama es completamente gratuito y de código abierto. No requiere cuenta ni suscripción para instalarlo ni para ejecutar modelos.
El único canal oficial es ollama.com. Para el código fuente, el repositorio oficial es github.com/ollama/ollama. No uses ejecutables de repositorios no listados en la web oficial.
Ollama soporta una amplia biblioteca de modelos incluyendo Llama 3 (Meta), Gemma (Google), Phi (Microsoft), Mistral y muchos más. El catálogo completo está disponible en ollama.com/library.
Solo para descargar los modelos por primera vez. Una vez descargados, Ollama funciona completamente offline. Los datos no salen de tu equipo.