Snowflake no ha parado de lanzar funciones. Repasemos las novedades de marzo de 2025, centradas en Administración, actualizaciones de SQL y actualizaciones de pipelines de datos.
Administración en Snowflake
Clasificación automática de datos sensibles
Esta función está en disponibilidad general desde el 6 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
La clasificación automática de datos sensibles es una función serverless de Snowflake que detecta y etiqueta automáticamente datos sensibles dentro de tus tablas. Basta con crear y asignar un perfil de clasificación a un esquema para que Snowflake monitoree y etiquete columnas sensibles, como PII e información financiera.
Por qué importa
Esta función ayuda a reforzar el gobierno de datos y el cumplimiento normativo. Al identificar y etiquetar datos sensibles de forma automática, las organizaciones pueden:
- Garantizar la aplicación de los controles de acceso y las medidas de protección adecuados.
- Demostrar el cumplimiento de regulaciones de privacidad como GDPR, CCPA e HIPAA.
- Reducir el riesgo de filtraciones al mantener un inventario actualizado de datos sensibles.
Automatizar este proceso reduce el esfuerzo manual, minimiza el error humano y asegura consistencia en la clasificación de datos en toda la organización.
Asignar database roles a una Snowflake Native App
Esta función está en Public Preview desde el 17 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
La asignación de database roles a una Snowflake Native App permite a los proveedores otorgar database roles a las Snowflake Native Apps. Esto incluye roles dentro de bases de datos importadas desde data shares o desde la base de datos SNOWFLAKE. Con estos roles, la native app puede acceder a objetos específicos —por ejemplo, tablas— dentro de la cuenta del consumidor.
Por qué importa
Esta capacidad refuerza la flexibilidad y la seguridad de las Snowflake Native Apps gracias a un control de acceso más granular. Los proveedores pueden definir con precisión a qué objetos accede la app, de modo que los consumidores conserven el control sobre sus datos. Resulta especialmente útil para aplicaciones que necesitan acceder a datos compartidos o interactuar con datasets concretos dentro del entorno del consumidor.
Deshabilitar la descarga de datos en la UI
Esta función está en disponibilidad general desde el 17 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
Parámetro DISABLE_UI_DOWNLOAD_BUTTON: Snowflake incorporó un nuevo parámetro de objeto llamado DISABLE_UI_DOWNLOAD_BUTTON. Este parámetro permite a los administradores controlar la disponibilidad del botón de descarga tanto en la interfaz web de Snowsight como en la Classic Console. Al configurarlo, se impide que los usuarios descarguen datos directamente desde la interfaz.
Por qué importa
Algunas organizaciones necesitan impedir la exportación de datos por motivos de seguridad (robo de información) o de gobierno de datos (shadow BI). Este control resulta especialmente útil en industrias reguladas o en escenarios con políticas estrictas de gobierno de datos.
Replicación a nivel de esquema para failover groups
Esta función está en disponibilidad general desde el 27 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
La replicación a nivel de esquema para failover groups es una función de Snowflake que permite a los administradores replicar esquemas concretos de una base de datos entre varias cuentas mediante failover groups. Esto ofrece un control más granular sobre la replicación: se pueden replicar solo las partes necesarias en lugar de la base de datos completa.
Por qué importa
Esta función es clave para organizaciones que necesitan una replicación selectiva por motivos como cumplimiento regional, soberanía de datos o intercambio dirigido de información. Al replicar únicamente los esquemas necesarios, se optimiza el uso de recursos y se mantiene un control más estricto sobre la distribución de los datos.
Actualizaciones de SQL
Jobs hijos asíncronos
Esta función está en disponibilidad general desde el 5 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
Los jobs hijos asíncronos en Snowflake Scripting permiten que los stored procedures ejecuten varias sentencias SQL de forma concurrente. Con la palabra clave ASYNC, los desarrolladores pueden lanzar consultas —como SELECT, INSERT o UPDATE— para que corran en paralelo como tareas en segundo plano dentro de un mismo stored procedure.
Por qué importa
Esta función mejora el rendimiento y la escalabilidad del procesamiento de datos en Snowflake. Al ejecutar varias operaciones en paralelo, se reduce el tiempo total de los procedimientos complejos, lo que se traduce en un procesamiento más rápido, un uso más eficiente de los recursos y, en última instancia, ahorro de costos.
Search optimization: soporte para column collations
Esta función está en disponibilidad general desde el 12 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
El soporte de Search Optimization para column collations es una mejora del servicio Search Optimization de Snowflake. Esta función eleva el rendimiento de las consultas sobre columnas que tienen definida una cláusula COLLATE. La collation determina cómo se comparan las cadenas, algo esencial para ordenar y filtrar texto según reglas lingüísticas específicas.
Por qué importa
Esta mejora extiende los beneficios de la search optimization a un abanico más amplio de consultas, sobre todo aquellas que involucran comparaciones de cadenas dependientes del idioma. Snowflake acelera las consultas sobre columnas con collation y agiliza el ordenamiento y filtrado por idioma.
Nuevo formato de archivo: XML
Esta función está en disponibilidad general desde el 27 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
El soporte para el formato de archivo XML hace referencia a la posibilidad de definir un formato de archivo de tipo XML en Snowflake. Esta función permite crear formatos de archivo con nombre que especifican cómo deben interpretarse los archivos XML al cargar datos en tablas de Snowflake o al crear tablas externas. Al definir un formato XML, se pueden configurar parámetros como STRIP_OUTER_ELEMENT y DISABLE_SNOWFLAKE_DATA, que controlan cómo se procesan los datos XML durante la ingesta.
Por qué importa
Aunque Snowflake siempre permitió parsear datos XML en columnas variant con funciones como XMLGET, el soporte para el formato de archivo XML simplifica el proceso de carga. Permite controlar cómo se cargan los archivos XML, mejorando la eficiencia y asegurando un parseo consistente en datasets grandes o variados.
Operador spread
Esta función está en disponibilidad general desde el 27 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
El operador spread (**) en SQL de Snowflake es un nuevo operador de expansión que despliega un array como una lista de valores individuales dentro de expresiones SQL. Es particularmente útil en escenarios como:
- Usar cláusulas
INcon arrays - Llamar a funciones del sistema como
COALESCE,GREATESTyLEASTcon arrays como entrada - Pasar arrays como argumentos a funciones SQL definidas por el usuario
- Utilizar arrays en stored procedures de Snowflake con bind variables
La sintaxis es directa: ** <array>.
Por qué importa
La llegada del operador spread mejora la flexibilidad y la legibilidad del código SQL en Snowflake. Simplifica el trabajo con arrays al permitir su expansión directa dentro de las sentencias SQL y reduce la necesidad de lógica iterativa o de unnesting complejo. El resultado: código más conciso y mantenible, sobre todo al trabajar con listas dinámicas de valores.
Actualizaciones de pipelines de datos
Dynamic tables: el máximo por cuenta sube a 50.000
Esta función está en disponibilidad general desde el 12 de marzo de 2025. Consulta la documentación para más detalles.
De qué se trata
Snowflake elevó el número máximo de dynamic tables permitidas por cuenta de 10.000 a 50.000. Las dynamic tables son una función de Snowflake que permite crear tablas cuyos datos se refrescan automáticamente según una consulta y una planificación definidas.
Por qué importa
Esta mejora es clave para las organizaciones que gestionan pipelines de datos a gran escala. Con hasta 50.000 dynamic tables por cuenta, Snowflake ofrece más flexibilidad y escalabilidad, lo que abre la puerta a flujos de datos más complejos y extensos sin chocar con los límites del sistema.
Jeff es Consultor de Datos y Analítica con más de 15 años de experiencia automatizando insights y usando datos para guiar procesos de negocio. En lo tecnológico, se especializa en Snowflake + dbt + Tableau. En lo sectorial, ha trabajado en servicios públicos, ensayos clínicos, editorial, CPG y manufactura. Escríbele cuando quieras a [email protected].