MongoDB explicado (2026): qué es, cómo funciona y cuándo usarlo

MongoDB se ha convertido en la opción predeterminada para los desarrolladores que construyen aplicaciones modernas que no encajan fácilmente en filas y columnas. En 2026, ya no es solo una “alternativa NoSQL a SQL”: es la capa de datos detrás de una gran parte de la infraestructura de agentes de IA, analítica en tiempo real, backends móviles y plataformas SaaS. Esta guía cubre qué es realmente MongoDB, qué cambió con MongoDB 8.3 (la versión actual de disponibilidad general a mayo de 2026) y cómo elegir entre Atlas, Community Edition y Enterprise Advanced. Tanto si estás evaluando MongoDB para un nuevo proyecto, migrando desde PostgreSQL o MySQL, o creando funciones de IA que necesitan búsqueda vectorial, esta es la visión práctica.

¿Qué es MongoDB?

MongoDB es una base de datos NoSQL de código abierto, orientada a documentos, construida en torno a la idea de que la mayoría de los datos de las aplicaciones modernas son jerárquicos, no relacionales. En lugar de forzar los datos a encajar en tablas con columnas fijas, MongoDB los almacena como documentos — registros parecidos a JSON que pueden contener objetos anidados, arrays y tipos de campo variados. Un perfil de usuario, una entrada de catálogo de productos o una sesión de chat viven en un solo documento, no repartidos entre seis tablas relacionadas mediante joins.

La empresa detrás de MongoDB cotiza en bolsa (NASDAQ: MDB), y el proyecto está en desarrollo continuo desde 2009. A fecha de 2026, MongoDB impulsa cargas de trabajo de producción en Adobe, Bosch, Cisco, eBay, EA, Forbes, Toyota, Verizon y decenas de miles de empresas más pequeñas. Es la base de datos documental más utilizada en la StackOverflow Developer Survey por séptimo año consecutivo.

Tres cosas explican su dominio:

  • El modelo de datos encaja con el código moderno. Los documentos se asignan directamente a objetos en Python, JavaScript, Go, Java y la mayoría de los demás lenguajes. No hace falta una capa de mapeo objeto-relacional.
  • Escala horizontalmente sin rediseños. Sharding es una función de primera clase, no una idea de última hora añadida con extensiones.
  • Integró la IA en la plataforma principal más rápido que cualquier competidor. La búsqueda vectorial, las incrustaciones semánticas y la memoria de agentes se ejecutan dentro del propio MongoDB en 2026, lo que elimina la necesidad de ensamblar varias bases de datos separadas.

Conceptos básicos: documentos, colecciones y BSON

Cuatro primitivas sustentan el modelo de datos de MongoDB. Entender esto basta para leer 80% de código de MongoDB.

  • Documento — un único registro, almacenado como BSON (Binary JSON). Puede tener campos anidados, arrays y cualquier combinación de tipos de datos. El equivalente a una fila en SQL, pero flexible.
  • Colección — un grupo de documentos. Equivalente a una tabla en SQL, salvo que los documentos de una misma colección no necesitan tener campos idénticos. Las colecciones no tienen esquema por defecto; la validación de esquema es opcional.
  • Base de datos — un contenedor de colecciones. Una única implementación de MongoDB puede alojar muchas bases de datos.
  • Campo — un par clave-valor dentro de un documento. Los valores pueden ser cadenas, números, fechas, arrays, documentos incrustados, ObjectIDs o tipos especializados como Decimal128 para datos financieros.

Un documento tiene este aspecto:

{
  "_id": ObjectId("65f3a..."),
  "email": "[email protected]",
  "profile": {
    "name": "Alice Martin",
    "roles": ["admin", "editor"]
  },
  "createdAt": ISODate("2026-05-12T10:23:00Z")
}

El _id el campo se genera automáticamente y es único dentro de la colección. Todo lo demás depende de ti. Esa flexibilidad es la clave — y la trampa. Un esquema flexible no significa ausencia de esquema; significa que el esquema reside en el código de tu aplicación y no en la base de datos. Tómatelo como una decisión de diseño, no como una licencia para saltarte el modelado de datos.

Novedades en MongoDB 8 (2026)

MongoDB 8 es la versión principal actual. La versión 8.3 alcanzó la disponibilidad general en mayo de 2026 en MongoDB.local Londres, y representa el salto más importante en rendimiento e integración de IA de los últimos años.

Mejoras de rendimiento frente a MongoDB 8.0:

  • Hasta 45% más de rendimiento de lectura
  • Hasta 35% más de rendimiento de escritura
  • Hasta 15% más de rendimiento de las transacciones ACID
  • Hasta 30% de mejora en operaciones complejas de agregación
  • Búsqueda vectorial por debajo de 100 ms y actualizaciones de contexto por debajo de 1 segundo para cargas de trabajo de IA

Estas mejoras no requieren cambios de código. Actualiza in situ, reinicia, mide. Las mejoras provienen del motor de almacenamiento WiredTiger, de refinamientos en el planificador de consultas y de la optimización de las colecciones de series temporales.

Funciones nativas de IA:

  • Búsqueda vectorial en la Community Edition (desde la 8.2). La búsqueda de texto completo y la búsqueda vectorial ahora se ejecutan dentro del propio MongoDB: no se requiere suscripción a Atlas ni un clúster externo de Elasticsearch o Pinecone. Etapas de agregación $search, $searchMeta, y $vectorSearch están disponibles en implementaciones autogestionadas.
  • Incrustaciones de Voyage AI automatizadas (vista previa pública, mayo de 2026). MongoDB adquirió Voyage AI en febrero de 2025 e integró sus modelos de incrustación directamente en Atlas Vector Search. Con el nuevo autoEmbed tipo de campo, MongoDB genera incrustaciones vectoriales automáticamente cada vez que se inserta o actualiza un documento.
  • LangGraph.js Long-Term Memory Store (GA). MongoDB es la capa de memoria persistente para los agentes de LangGraph, combinando memoria JSON, organización por espacios de nombres, búsqueda semántica y limpieza basada en TTL en un único backend.
  • Queryable Encryption mejoras en 8.2 — campos cifrados que aún puedes consultar sin descifrarlos.
LEER  Cómo detectar si tu webcam ha sido hackeada (Windows, Mac, teléfono)

Los modelos de incrustación Voyage 4 en MongoDB tienen un precio por millón de tokens: voyage-4-large a $0.12, voyage-4 a $0.06, voyage-4-lite a $0.02, y voyage-code-3 a $0.06. Los primeros 200 millones de tokens por cuenta son gratuitos, y la API Batch ofrece además un descuento adicional del 33%.

MongoDB Atlas frente a Community Edition frente a Enterprise Advanced

MongoDB se distribuye en tres variantes. Elegir la incorrecta es uno de los errores más comunes que cometen los equipos en sus primeros seis meses.

Community Edition Enterprise Advanced Atlas
Costo Gratis Licencia comercial Basado en el uso, con nivel gratuito disponible
Despliegue Autogestionado Autogestionado Nube totalmente gestionada
Búsqueda vectorial Sí (desde 8.2) Sí + autoEmbed
Copias de seguridad Manual Ops Manager Continuas y automatizadas
Multirregión Manual Manual Con un solo clic, PrivateLink
Lo mejor para Desarrollo, prototipos, producción pequeña autohospedada Sectores regulados, cargas de trabajo críticas on-premises La mayoría de las cargas de trabajo de producción en 2026

La regla práctica: empieza en Atlas a menos que tengas una razón concreta para no hacerlo. El nivel gratuito (M0) ofrece 512 MB de almacenamiento y es suficiente para prototipos y pequeños proyectos paralelos. Los niveles de pago empiezan en torno a $9/mes (M2) para clústeres compartidos y escalan hasta clústeres dedicados a partir de $57+/mes (M10 y superiores). El coste de migración de Community Edition a Atlas es real, pero asumible: el ahorro operativo suele compensarlo en pocos meses.

Community Edition tiene sentido cuando necesitas control local total, vas a desplegar dentro del entorno de un cliente o tienes requisitos estrictos de residencia de datos que la nube gestionada no puede cumplir. Enterprise Advanced está pensado para sectores regulados (finanzas, sanidad, administración pública) que necesitan MongoDB en local con soporte y herramientas de nivel empresarial como Ops Manager y autenticación Kerberos.

Primeros pasos: instalación y tu primera base de datos

Para Atlas, regístrate en mongodb.com/cloud/atlas, crea un clúster M0 gratuito, añade tu IP a la lista blanca, genera un usuario de base de datos y obtén la cadena de conexión. Tiempo total de configuración: menos de 10 minutos.

Para Community Edition en Ubuntu/Debian:

wget -qO - https://www.mongodb.org/static/pgp/server-8.0.asc | sudo apt-key add -
echo "deb [ arch=amd64,arm64 ] https://repo.mongodb.org/apt/ubuntu jammy/mongodb-org/8.0 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-8.0.list
sudo apt-get update
sudo apt-get install -y mongodb-org
sudo systemctl start mongod

En macOS, instálalo mediante Homebrew:

brew tap mongodb/brew
brew install [email protected]
brew services start [email protected]

MongoDB Shell (mongosh) es la CLI oficial desde MongoDB 5.0+. La shell heredada mongo está obsoleta. Una vez conectado, crea implícitamente una base de datos y una colección insertando un documento:

use mydb
db.users.insertOne({ email: "[email protected]", role: "admin" })

La base de datos mydb y la colección users ambos pasan a existir en el momento en que se inserta el primer documento. MongoDB no requiere declarar el esquema con antelación.

Operaciones CRUD: los comandos esenciales

Cuatro operaciones cubren ~90% del trabajo diario en MongoDB.

Crear (Insertar). Utilice insertOne para un único documento, insertMany para arrays de documentos.

db.users.insertOne({ email: "[email protected]", role: "editor", createdAt: new Date() })
db.users.insertMany([
  { email: "[email protected]", role: "viewer" },
  { email: "[email protected]", role: "viewer" }
])

Leer (Find). Las consultas utilizan una sintaxis de filtro similar a JSON. find devuelve un cursor; findOne devuelve un único documento.

db.users.find({ role: "admin" })
db.users.find({ createdAt: { $gte: ISODate("2026-01-01") } })
db.users.findOne({ email: "[email protected]" })

Actualizar. Utilice updateOne o updateMany con operadores de actualización como $set, $inc, $push, $pull.

db.users.updateOne(
  { email: "[email protected]" },
  { $set: { role: "admin", updatedAt: new Date() } }
)

Eliminar. deleteOne y deleteMany funcionan de forma simétrica a los métodos de actualización.

db.users.deleteMany({ role: "viewer", lastLogin: { $lt: ISODate("2025-01-01") } })

Para transformaciones complejas de varias etapas — group by, project, lookup, unwind — usa el Marco de agregación. Es el equivalente de MongoDB al GROUP BY y JOIN, expresado como una secuencia de etapas.

Indexación y rendimiento

Los índices son el mayor factor de rendimiento en MongoDB. Una consulta sin índice hace una análisis de colección — lee cada documento — lo que se vuelve impracticable a partir de unos pocos miles de documentos. Una consulta indexada solo toca los documentos que coinciden.

LEER  Evitar el desastre: Lecciones de los más terribles errores de comunicación de crisis durante ciberataques

MongoDB admite seis tipos principales de índice en 2026:

  • Campo único — un solo campo, ascendente o descendente. El valor predeterminado.
  • Compuesto — varios campos en un orden específico. El orden de los campos importa; el índice admite consultas sobre el prefijo inicial.
  • Multiclave — para campos que contienen matrices. MongoDB indexa cada elemento de la matriz.
  • Texto — para búsqueda de texto completo en campos de cadena. En gran medida sustituido por $search en MongoDB 8.2+ para casos de uso serios.
  • Geoespacial (2dsphere, 2d) — para consultas basadas en la ubicación.
  • Vector — para búsqueda semántica mediante embeddings. El gran cambio de 2026.

Crear un índice con createIndex:

db.users.createIndex({ email: 1 }, { unique: true })
db.users.createIndex({ role: 1, createdAt: -1 })

Las reglas cardinales de indexación: indexa los campos sobre los que consultas, indexa los campos por los que ordenas, el prefijo importa en los índices compuestos, y no indexes en exceso: cada índice tiene un coste de escritura y de almacenamiento. Usa explain("executionStats") en cualquier consulta lenta para ver si MongoDB está utilizando un índice o haciendo un escaneo de la colección.

Replicación, sharding y cómo escala MongoDB

MongoDB tiene dos estrategias de escalado distintas. Resuelven problemas diferentes y pueden combinarse.

Replicación se centra en la disponibilidad y la escalabilidad de lectura. Un conjunto de réplicas es un grupo de instancias de MongoDB: una primaria gestiona las escrituras y las secundarias replican desde la primaria. Si la primaria falla, una elección promociona a una secundaria en menos de 10 segundos. Las lecturas pueden distribuirse entre las secundarias para cargas de trabajo con muchas lecturas. La replicación es la opción predeterminada en cualquier implementación seria, incluido Atlas, que aprovisiona un conjunto de réplicas de 3 nodos de serie.

Fragmentación se centra en la escalabilidad de escritura y el volumen de datos. MongoDB particiona horizontalmente una colección entre varios conjuntos de réplicas (shards), enrutados mediante una clave de particionado que eliges tú. Cada shard gestiona un subconjunto de los datos y las escrituras correspondientes. El sharding añade complejidad operativa y debe considerarse cuando un único conjunto de réplicas ya no puede absorber el rendimiento de escritura o almacenar el volumen de datos, normalmente por encima del rango de varios terabytes.

La elección de la clave de particionado es la decisión más determinante en una implementación con sharding. Una mala clave de particionado crea puntos calientes; una buena distribuye las escrituras de forma uniforme. Usa claves de particionado hasheadas para escrituras distribuidas uniformemente cuando las consultas por rango no sean importantes, y claves de particionado por rango cuando la localidad sea relevante.

MongoDB para IA: búsqueda vectorial, embeddings de Voyage y memoria de agentes

El cambio estratégico más significativo en MongoDB en 2026 es que se ha convertido en una plataforma seria de infraestructura para IA: no solo una base de datos que usan las aplicaciones de IA, sino la capa de datos unificada que alberga datos operativos, embeddings, índices vectoriales y memoria de agentes en un solo lugar.

La idea principal: la mayoría de las aplicaciones de IA necesitan combinar el razonamiento de los LLM con contexto externo. Ese contexto procede de documentos, transcripciones, bases de conocimiento y datos empresariales en tiempo real. Tradicionalmente, eso implicaba ejecutar tres sistemas distintos: una base de datos vectorial (Pinecone, Weaviate) para los embeddings, una base de datos operativa (PostgreSQL, MongoDB) para los datos de negocio y un servicio de embeddings (OpenAI, Cohere) para generar vectores. La apuesta de MongoDB es que esos tres pueden unificarse en uno solo.

Así es como se ve en la práctica:

  • Atlas Vector Search indexa embeddings de alta dimensión (hasta 2.048 dimensiones) junto con los datos operativos en la misma colección. Una consulta puede combinar la similitud vectorial con filtros sobre campos normales —“encuentra documentos semánticamente similares a X, propiedad del usuario Y, creados después de la fecha Z”— en una sola operación.
  • autoEmbed genera embeddings de Voyage AI automáticamente cada vez que insertas o actualizas un documento con un campo de texto designado. Sin canalización externa.
  • LangGraph Memory Store almacena de forma persistente el estado de las conversaciones para agentes de IA, con búsqueda semántica integrada.
  • integración con Feast feature store conecta MongoDB con canalizaciones de características de ML.

La propia cifra de MongoDB en este momento: el 79 % de las empresas está construyendo agentes de IA y solo el 11 % tiene uno en producción. La brecha, como señaló Pablo Stern, Chief Product Officer for AI de MongoDB, no está en el modelo, sino en la infraestructura de datos que hay debajo. Ese posicionamiento no es mera palabrería de marketing; es la historia comercial más defendible que MongoDB ha tenido en cinco años.

MongoDB frente a PostgreSQL, MySQL y DynamoDB

El planteamiento de «MongoDB frente a SQL» fue útil en 2015. En 2026, la comparación real es contextual.

LEER  Las 5 mejores recomendaciones bursátiles de un analista para navegar por la nueva era de los retos de la ciberseguridad
MongoDB PostgreSQL MySQL DynamoDB
Modelo de datos Documento Relacional + JSONB Relacional Clave-valor / documento
Esquema Flexible Estricto (relajable) Estricto Flexible
Uniones $lookup (limitado) Nativo, potente Nativo Ninguno
Escalado horizontal Fragmentación nativa Manual (Citus) Manual Nativo, transparente
Búsqueda vectorial Nativo Extensión pgvector Ninguno Ninguno (usar OpenSearch)
Transacciones ACID Multidocumento, conjunto de réplicas, fragmentado Lo mejor de su clase Fuerte Limitado
Bloqueo con el proveedor Atlas se ejecuta en AWS, GCP, Azure Neutral respecto al proveedor Neutral respecto al proveedor Solo AWS

Elige MongoDB cuando tus datos son naturalmente jerárquicos, cuando la flexibilidad del esquema importa, cuando estás creando funciones de IA que necesitan búsqueda vectorial, o cuando el escalado horizontal es un requisito futuro conocido.

Elige PostgreSQL cuando tus datos son realmente relacionales, cuando las uniones complejas entre varias tablas son fundamentales, cuando las garantías ACID son innegociables, o cuando quieres una única base de datos que gestione bien tanto cargas relacionales como JSON (JSONB cierra gran parte de la brecha, y pgvector gestiona la búsqueda vectorial).

Elige MySQL cuando existe una clara adecuación al ecosistema MySQL, experiencia operativa previa, o cuando ejecutas en PlanetScale o AWS Aurora.

Elige DynamoDB cuando ya estás muy integrado en AWS, necesitas una economía totalmente serverless de escala cero, y tus patrones de acceso son consultas simples de clave-valor o de diseño de tabla única.

Mejores prácticas y errores comunes

Seis patrones separan a los equipos que tienen éxito con MongoDB de los equipos que culpan a la base de datos de problemas causados por el uso:

  1. Diseña el esquema de tus documentos antes de escribir código. Sin esquema no significa sin reflexión. Modela los documentos en función de cómo la aplicación lee los datos, no de cómo un enfoque relacional los normalizaría. Incrusta los datos relacionados cuando se lean juntos; referencia cuando sean independientes.
  2. Usa índices deliberadamente y verifícalos. Cada consulta lenta debe pasar por explain("executionStats"). Si MongoDB está realizando un escaneo de colección, tienes una carencia de indexación, no un problema de base de datos.
  3. No incrustes en exceso. Un documento con miles de elementos de matriz anidados que sigue creciendo es una trampa. MongoDB tiene un límite de tamaño de documento de 16 MB, pero el límite práctico es mucho menor.
  4. Usa transacciones solo cuando las necesites. Las transacciones ACID multi-documento funcionan, pero penalizan el rendimiento. La mayoría de los casos de uso que en SQL necesitarían una transacción pueden modelarse para encajar en un solo documento en MongoDB, eliminando así la transacción.
  5. Activa la autenticación desde el primer día. Históricamente, la edición predeterminada de MongoDB se distribuía sin autenticación: esa época ya quedó atrás, pero las instancias autogestionadas mal configuradas siguen filtrando datos con regularidad. Atlas se encarga de esto automáticamente.
  6. Supervisa antes de escalar. Las métricas integradas de Atlas (Performance Advisor, Real-Time Performance Panel) detectan el 90% de los problemas antes de que los usuarios los perciban. Las implementaciones autogestionadas necesitan una supervisión equivalente mediante Ops Manager o herramientas externas.

Preguntas frecuentes: MongoDB

¿MongoDB es gratis?

MongoDB Community Edition es gratuita y de código abierto bajo la Server Side Public License. MongoDB Atlas ofrece un nivel gratuito (M0, 512 MB) con niveles de pago a partir de 9 €/mes. MongoDB Enterprise Advanced cuenta con licencia comercial.

¿Cuál es la versión actual de MongoDB?

MongoDB 8.3 está generalmente disponible desde mayo de 2026, presentado en MongoDB.local London. La serie 8.x es la versión principal actual, con 8.0 como base de soporte a largo plazo y 8.3 añadiendo funciones centradas en IA y mejoras de rendimiento.

¿Es MongoDB más rápido que PostgreSQL?

No de forma universal. MongoDB es más rápido para cargas de trabajo con estructura de documento, alto rendimiento de escritura y necesidades de escalado horizontal. PostgreSQL es más rápido para consultas relacionales complejas con joins, agregaciones y cargas de trabajo analíticas. La respuesta correcta depende de los datos y de las consultas, no de la base de datos.

¿Qué es MongoDB Atlas?

MongoDB Atlas es la versión en la nube totalmente gestionada de MongoDB, disponible en AWS, Google Cloud y Azure. Se encarga automáticamente del aprovisionamiento, las copias de seguridad, el escalado, la supervisión y el failover. La mayoría de las implementaciones de MongoDB en producción en 2026 se ejecutan en Atlas en lugar de en la Community Edition autogestionada.

¿Puede MongoDB realizar búsquedas vectoriales?

Sí. MongoDB cuenta con búsqueda vectorial nativa en Atlas (con autoEmbed e integración con Voyage AI) y en Community Edition (desde la versión 8.2). Admite búsqueda híbrida, recuperación semántica y generación aumentada por recuperación (RAG) sin necesidad de una base de datos vectorial externa.

¿Qué empresas utilizan MongoDB?

MongoDB impulsa cargas de trabajo de producción en Adobe, Bosch, Cisco, eBay, EA, Forbes, Toyota, Verizon y decenas de miles de empresas más pequeñas de SaaS, fintech, retail, videojuegos y sanidad.

es_ESES