pgEdge lanza ColdFront, reduciendo un 90% el costo de almacenamiento de datos fríos
2026-06-19 11:46
Favoritos

es.wedoany.com Noticia: pgEdge ha anunciado el lanzamiento de pgEdge ColdFront, una solución de estratificación transparente de datos para PostgreSQL. Esta solución permite realizar operaciones UPDATE y DELETE directamente sobre datos archivados, y las aplicaciones pueden leer y escribir en la capa de datos fríos utilizando el mismo SQL que ya emplean, sin necesidad de modificar código o reactivar datos. Los datos antiguos se migran automáticamente al formato Parquet en Apache Iceberg, almacenándose en cualquier almacenamiento de objetos compatible con S3, lo que reduce el costo de almacenamiento hasta en un 90%. El conjunto completo de datos sigue siendo accesible para lectura y escritura a través de un único nombre de tabla de PostgreSQL, y el escaneo de la capa fría alcanza velocidades analíticas gracias al motor columnar vectorizado DuckDB.

Las bases de datos PostgreSQL de nivel de producción, con el tiempo, enfrentan un aumento en los costos de almacenamiento y la complejidad operativa debido a los datos históricos, incluyendo la sobrecarga de copias de seguridad, vaciado (vacuum) y retrasos en las réplicas. Los enfoques tradicionales incluyen eliminar datos antiguos, archivarlos en archivos planos que rompen las consultas, o utilizar soluciones propietarias. pgEdge ColdFront elimina estas compensaciones al mover automáticamente los datos fríos a un almacenamiento de objetos económico, manteniendo al mismo tiempo la capacidad completa de lectura y escritura a través de la interfaz estándar de Postgres, y almacenando cada capa en un formato abierto.

Un ejemplo de caso de uso es una solicitud de eliminación por GDPR para datos archivados de hace cinco años. Con ColdFront, esto se puede ejecutar con una sola sentencia SQL, sin necesidad de pasar por el ciclo de restaurar los datos a la capa activa, eliminarlos, rearchivarlos y revalidarlos.

Phillip Merrick, director de producto de pgEdge, indicó que la solución elimina la preocupación por el bloqueo de proveedores propietarios, las aplicaciones mantienen el mismo SQL, DuckDB proporciona velocidad analítica para los datos fríos dentro del proceso, la capa fría es escribible y puede ejecutarse en PostgreSQL estándar sin parches.

Las características clave de ColdFront incluyen: la única capa fría directamente escribible que admite operaciones UPDATE y DELETE a través del mismo nombre de tabla de PostgreSQL, sin necesidad de reactivación ni rutas especiales; ejecución de DuckDB dentro del proceso de PostgreSQL, con un rendimiento de escaneo de la capa fría basado en datos Parquet de 10 a 100 veces más rápido que el almacenamiento por filas; sin necesidad de cambios en el código o la arquitectura de la aplicación; todas las capas utilizan formatos de código abierto, y los datos fríos son Apache Iceberg estándar (Parquet en S3), que pueden ser leídos de forma independiente por herramientas como Spark, Trino y DuckDB.

La solución también cuenta con gestión integrada del ciclo de vida de las particiones, controlando el conjunto de trabajo de datos activos mediante un único parámetro de configuración hot_period, y puede establecer un parámetro opcional retention_period para eliminar automáticamente los datos fríos después de un tiempo especificado. En entornos de clúster multimaestro, los datos fríos son accesibles para lectura y escritura simultáneamente desde cada nodo. A través del clúster multimaestro Spock, los datos activos son replicados por Spock, mientras que los datos fríos residen en un almacenamiento de objetos compartido. El protocolo Bakery (verificado formalmente en TLA+) serializa las confirmaciones de Iceberg entre nodos, sin conflictos 409 y sin necesidad de reintentos a nivel de aplicación; en pruebas con tres nodos pequeños y 90 millones de filas, se alcanzó un rendimiento de 756.000 filas por segundo.

Dave Page, director de tecnología de pgEdge, señaló que la solución gestiona automáticamente el ciclo de vida de los datos, reduciendo los costos de almacenamiento hasta en un 90%. Su infraestructura de datos admite tuberías de IA y ML, transformando PostgreSQL en un frontend informático sin estado sobre Iceberg mediante un modelo desacoplado, permitiendo que nuevos nodos informáticos se inicien en segundos sin necesidad de sincronización de datos.

pgEdge ColdFront ofrece tres modos de operación: modo estratificado (activo + frío), modo desacoplado (solo Iceberg) y modo solo particiones (sin capa fría). El producto está disponible ahora como versión beta de nivel de producción, compatible con topologías de instancia única y malla multimaestro Spock para PostgreSQL 16, 17 y 18. ColdFront se incluirá con pgEdge Enterprise Postgres y está previsto que se integre en pgEdge Cloud en la segunda mitad de 2026. Se publica bajo la licencia de código abierto de PostgreSQL, y la documentación y las instrucciones de instalación están disponibles en el sitio web especificado.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com