SELECTSELECT

Announcement

Comprende el uso de columnas y la salud del clustering

By Fernando Brito

·

Shipped by

Ian Gray

Esta página también está disponible en English, Português, Deutsch, Italiano, Français y 日本語.

Comprende el uso de columnas y la salud del clustering

Analiza la salud del clustering y las estadísticas de uso de columnas en cualquier tabla

La página de tablas ahora incluye una nueva pestaña de columnas, diseñada para ayudarte a comprender:

  1. Con qué frecuencia se accede a cada columna de una tabla
  2. La salud del clustering de cada columna en tu tabla. Un puntaje de 100% significa que la columna está bien agrupada (clustered), y por lo tanto incluir un filtro en esta columna en tu consulta probablemente resultará en una muy buena poda de consultas (query pruning). Hemos encontrado esta funcionalidad increíblemente útil en nuestra cuenta interna de Snowflake, ya que descubrimos columnas que no sabíamos que estaban bien agrupadas (por ejemplo, query_id en esta captura de pantalla). Esta funcionalidad también es muy útil para entender cómo las tablas sin clustering automático habilitado están naturalmente agrupadas.

Snowflake column clustering health

La capacidad de listar todas las columnas en una tabla y analizar su salud de clustering requiere instalar un nuevo procedimiento almacenado y otorgar acceso a tu usuario de Snowflake en SELECT. Obtén más información en nuestra documentación de configuración.

Junto con esto, ahora puedes filtrar cargas de trabajo por las columnas a las que acceden. En el ejemplo a continuación, puedes ver que todas las columnas que acceden a la columna query_id están podando muy bien. Las eficiencias de poda superiores al 90% indican que la mayoría de las micro-particiones se están eliminando automáticamente.

Snowflake columns accessed in query

El filtrado por columnas accedidas depende de la vista de historial de acceso de Snowflake, que no está disponible para clientes en la Edición Standard de Snowflake. ¡Los usuarios de la edición Standard aún pueden analizar la salud del clustering (primera captura de pantalla)!