SELECTSELECT

SELECT

Snowflake Cortex AI SQL: Überblick, Preise & Kostenkontrolle

By Jeff SkoldbergOct 9, 20257 min read

Diese Seite ist auch in English, Español, Français, Italiano, 日本語 und Português verfügbar.

Was ist Cortex AI SQL?

Mit den Cortex AISQL-Funktionen von Snowflake landet KI direkt in Ihren SQL-Abfragen. Statt Daten zu exportieren und durch ein Modell zu jagen, ergänzen Sie einfach eine Spalte in einem beliebigen select-Statement und rufen die KI genau dort auf, wo Ihre Daten liegen. Text, Bilder und Audio lassen sich gemeinsam mit Ihren strukturierten Daten analysieren – über Funktionen wie AI_COMPLETE, AI_EXTRACT, AI_CLASSIFY, AI_SUMMARIZE und weitere, betrieben mit Modellen von OpenAI, Anthropic, Meta, Mistral und anderen.

Was viele Snowflake-Kunden dabei übersehen: Die tokenbasierte Abrechnung tickt grundlegend anders als die gewohnte warehouse-basierte Preislogik. Und die Kosten können sich rasant aufsummieren, wenn man nicht aufpasst.

Ich habe Teams erlebt, die einen "schnellen Test" mit Claude Opus gestartet und an einem Nachmittag einen ordentlichen Stapel Credits verheizt haben. Ihnen war nicht bewusst, dass auch Output-Tokens zählen, sie haben ein teures Modell gewählt, obwohl ein günstigeres genauso gut gepasst hätte – und es gab kein Monitoring, das hätte gegensteuern können.

In diesem Beitrag zeigen wir Ihnen, wie Cortex AISQL bepreist wird und wie Sie die Kosten über die account_usage-Views von Snowflake punktgenau überwachen.

Wie funktioniert Cortex AI SQL?

Die Cortex AISQL-Funktionen sind denkbar einfach im Einsatz – Sie rufen sie direkt in Ihren SQL-Statements auf, wie jede andere Funktion auch. Hier ein einfaches Beispiel, das Kundenfeedback als positiv, negativ oder neutral klassifiziert:

SELECT
    customer_id,
    feedback_text,
    SNOWFLAKE.CORTEX.AI_CLASSIFY(
        feedback_text,
        ['positive', 'negative', 'neutral']
    ) as sentiment
FROM customer_feedback
LIMIT 10;

Einzige Voraussetzung: Ihre Rolle benötigt die Datenbankrolle SNOWFLAKE.CORTEX_USER. Standardmäßig ist sie der PUBLIC-Rolle zugewiesen, sodass die meisten Nutzer bereits Zugriff haben.

Das war's. Keine externen API-Keys, kein Datentransfer, kein Infrastruktur-Setup. Die KI-Modelle laufen direkt in der Snowflake-Umgebung.

Werfen Sie immer einen Blick in die Snowflake Credit Consumption Table

Bevor wir tiefer in die Cortex AISQL-Kosten einsteigen: Die Preisdetails zu allem rund um Snowflake finden Sie in der Credit Consumption Table, die laufend aktualisiert wird. Im Screenshot unten sehen Sie, wie drastisch sich die Preise der einzelnen KI-Modelle unterscheiden. Claude-4-opus schlägt mit 12 Credits pro Million Tokens zu Buche, während einige kleinere Modelle nur einen Bruchteil eines Credits pro Million Tokens kosten.

Wie ist die Preisgestaltung von Cortex AI SQL aufgebaut?

Bei Cortex-Funktionen zahlen Sie pro verarbeitetem Token (Input- + Output-Tokens bei generativen Funktionen, nur Input bei Embeddings).

Generative Funktionen wie AI_COMPLETE, AI_CLASSIFY und AI_SUMMARIZE berechnen sowohl Input-Tokens (der Text, den Sie an das Modell schicken) ALS AUCH Output-Tokens (die Antwort des Modells). Senden Sie 100 Tokens und erhalten 200 Tokens zurück, zahlen Sie für 300 Tokens insgesamt.

Die zentrale Embedding-Funktion ist AI_EMBED, die Daten wie Text oder Bilder vektorisiert. Hier werden nur die Input-Tokens berechnet, da die Ausgabe lediglich aus Zahlen besteht (kein generierter Text).

Tokens verstehen

  • 1 Token ≈ 4 Zeichen Text
  • Nutzen Sie die Funktion COUNT_TOKENS, um Kosten vor teuren Operationen abzuschätzen
  • Bei Funktionen wie AI_COMPLETE, AI_CLASSIFY, AI_SUMMARIZE zählen sowohl Input- ALS AUCH Output-Tokens
  • Bei AI_EMBED und Extraktionsfunktionen zählen nur die Input-Tokens

Preisbeispiele

Damit Sie ein Gefühl für die Größenordnung bekommen, ein paar Preisbeispiele – Snowflake passt die Preise jedoch laufend an, schauen Sie also immer in die Credit Consumption Table. Die Beispiele rechnen zur Veranschaulichung mit 3 $ pro Credit.

Kleine Modelle:

  • openai-gpt-5-mini: 0,32 Credits = 0,96 $ pro Million Tokens
  • mistral-7b: 0,12 Credits = 0,36 $ pro Million Tokens
  • Beispiel:
    • Analyse von 20.000 Produktrezensionen mit openai-gpt-5-mini
    • Durchschnittliche Rezension à 100 Tokens: 2 Mio. Tokens = ~1,92 $

Mittlere Modelle:

  • llama3.1-70b: 1,21 Credits = 3,63 $ pro Million Tokens
  • openai-gpt-4.1: 1,40 Credits = 4,20 $
  • Beispiel: Dieselben 20.000 Rezensionen mit llama3.1-70b = ~7,26 $

Große Modelle (ab 3 Credits pro Million Tokens):

  • llama-3.1-405b: 3 Credits = 9 $ pro Million Tokens
  • claude-4-opus: 12 Credits = 36 $ pro Million Tokens
  • Beispiel: Dieselben 20.000 Rezensionen mit claude-4-opus = ~72 $

Kostentreiber bei Snowflake Cortex AI SQL

Einige Faktoren lassen die Credits schneller schmelzen, als einem lieb ist. Auf diese Punkte sollten Sie ein Auge haben.

Lange Ausgaben treiben die Kosten rasant nach oben, da generative Funktionen sowohl Input- als auch Output-Tokens berechnen. Eine ausschweifende Zusammenfassung mit 500 Wörtern kostet das Fünffache einer prägnanten Variante mit 100 Wörtern. Steuern lässt sich das über sauberes Prompt Engineering.

Die Modellwahl ist wichtiger, als viele meinen: Premium-Modelle wie Claude Opus kosten das 37-Fache eines Basismodells wie GPT 5 mini – und für viele Klassifikations- oder Sentiment-Analyse-Aufgaben reicht das günstigere Modell völlig aus.

So überwachen Sie Kosten und Nutzung von Cortex AI SQL

Snowflake stellt zwei dedizierte Views für das Monitoring der Cortex AISQL-Funktionskosten bereit, die jeweils einen anderen Zweck erfüllen:

CORTEX_FUNCTIONS_USAGE_HISTORY – aggregierte stündliche Nutzungsdaten

  • Gruppiert Token- und Credit-Verbrauch nach Funktion, Modell und Stunde
  • Enthält keine Query-ID, lässt sich also nicht mit einer konkreten Abfrage, einem Nutzer, einer Rolle etc. verknüpfen
  • Ideal, um übergreifende Nutzungsmuster und Trends zu verstehen
  • Zeigt, welche Funktionen und Modelle die meisten Kosten verursachen
  • Daten in 1-Stunden-Intervallen aggregiert

CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY – Details auf Ebene der einzelnen Abfrage

  • Zeigt Token- und Credit-Verbrauch pro einzelner Abfrage
  • Unverzichtbar, um teure Einzelabfragen oder Operationen aufzuspüren
  • Enthält Query-IDs für tiefergehende Analysen
  • Hilft, Abfragen mit Optimierungspotenzial zu identifizieren

Hier ein paar Beispielabfragen für den Einstieg.

Stündliche oder tägliche Kostenübersicht nach Funktion und Modell:

-- Stündlich, einfach jede Spalte aus dem View auswählen:
select
    start_time,
    end_time,
    function_name,
    model_name,
    warehouse_id,
    token_credits,
    tokens
from
SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_USAGE_HISTORY;

--täglich, einfach aggregieren
select
    date_trunc('day',start_time) as date,

Code erweitern

Die 50 teuersten Abfragen. Kosten pro Abfrage inklusive Query-Text, Nutzer und Warehouse:

SELECT
    c.query_id,
    q.query_text as query_text,
    q.start_time,
    q.execution_time / 1000 as execution_seconds,
    c.function_name,
    c.model_name,
    c.tokens,
    c.token_credits,
    q.user_name,
    q.warehouse_name,
FROM SNOWFLAKE.ACCOUNT_USAGE.CORTEX_FUNCTIONS_QUERY_USAGE_HISTORY c
JOIN SNOWFLAKE.ACCOUNT_USAGE.QUERY_HISTORY q
    ON c.query_id = q.query_id
WHERE q.start_time >= DATEADD(day, -7, CURRENT_TIMESTAMP())

Code erweitern

Außerdem bin ich auf einen View namens snowflake.account_usage.cortex_aisql_usage_history gestoßen, zu dem ich allerdings keine Dokumentation finden konnte. Dieser View liegt auf Query-ID-Granularität und liefert usage_time, user_id und warehouse_id. Möglicherweise handelt es sich um ein noch undokumentiertes Preview-Feature.

Best Practices und Empfehlungen für den Einsatz von Cortex AI SQL

Aus der Arbeit mit Kunden rund um Cortex AISQL-Kosten haben sich für mich folgende Empfehlungen herauskristallisiert.

Alerts einrichten, nicht nur Dashboards

Die oben gezeigten Monitoring-Queries bringen nichts, wenn niemand sie ausführt. Für alles, was Sie in Snowflake überwachen möchten, können Sie das SQL in einen geplanten Task mit Notification Integration packen und so einen eigenen Monitor bauen, der Alerts an Slack oder Teams schickt. Wenn Sie es besonders komfortabel haben möchten, werfen Sie einen Blick auf Monitors in SELECT.

Token-Anzahl immer zuerst testen

Bevor Sie 100.000 Zeilen verarbeiten, lassen Sie COUNT_TOKENS auf eine Stichprobe los. Die Token-Zahlen liegen fast immer höher als gedacht. Ein schneller Test wie SELECT AVG(COUNT_TOKENS(your_column)) FROM your_table LIMIT 1000 zeigt Ihnen, womit Sie es zu tun haben.

Mit dem kleinsten passenden Modell starten

Das sehe ich ständig: Teams greifen reflexartig zu GPT-4 oder größeren Claude-Modellen, weil diese bekannt sind und Vertrauen genießen. Doch für die meisten Klassifikations- oder Sentiment-Analyse-Aufgaben liefert gpt-5-mini einwandfreie Ergebnisse – zu einem Zehntel der Kosten. Testen Sie zunächst mit einem Premium-Modell auf 100 Zeilen und probieren Sie anschließend das günstigere Modell aus. Sie werden überrascht sein, wie ähnlich die Ergebnisse oft ausfallen.

Die KI auf kurze Antworten verpflichten

Bei AI_COMPLETE oder AI_SUMMARIZE zahlen Sie sowohl für den Prompt ALS AUCH für die Antwort. Verlangt Ihr Prompt ausführliche Erklärungen und Sie verarbeiten Tausende Zeilen, summieren sich die Output-Tokens im Nu. Geben Sie explizit vor, dass Antworten kurz bleiben sollen.

Ergebnisse cachen / inkrementelle Updates nutzen

Wenn Sie jedes Mal, wenn jemand einen Report startet, dieselben Produktbeschreibungen erneut klassifizieren, verbrennen Sie schlicht Geld. Materialisieren Sie die KI-Ergebnisse in einer Tabelle. Klingt offensichtlich – machen aber längst nicht alle.

Im Auge behalten, welche Modelle tatsächlich laufen

Führen Sie die Query "Kosten nach Nutzer und Warehouse" regelmäßig aus. Häufig findet sich jemand, der in Dev mit einem teuren Modell getestet und in Production nie auf eine günstigere Option umgestellt hat. Oder schlimmer: eine außer Kontrolle geratene Abfrage, die Millionen von Zeilen mit einem der teureren Claude-Modelle abarbeitet.

Fazit

Snowflake liefert alles, was Sie zum Monitoring der AISQL-Kosten brauchen: Account-Usage-Views mit Kostendetails, transparente (wenn auch komplexe) Preise und integrierte Alerting-Funktionen. Die eigentliche Herausforderung ist, das eigene Denken auf tokenbasierte Preise umzustellen. Langjährige Snowflake-Nutzer denken instinktiv in Query-Dauer und Warehouse-Größe – jetzt kommen Token-Anzahl und Modellwahl als zentrale Stellschrauben hinzu. Behandeln Sie die ersten Wochen mit Cortex AISQL als Lernphase. Klein anfangen, intensiv monitoren und Muster etablieren, bevor Sie hochskalieren. Das Preismodell belohnt durchdachte Umsetzung und bestraft den "Wir lassen es einfach auf alles laufen und sehen, was passiert"-Ansatz. Ich habe Teams erlebt, die wegen ausufernder KI-Kosten in Panik gerieten – dabei sind die Modelle eigentlich fair bepreist, wenn man sie klug einsetzt. Wenn Sie täglich wirklich riesige Datenmengen mit KI-Funktionen verarbeiten, sprechen Sie mit Ihrem Snowflake-Account-Team über Volumenpreise. Bei Millionen Tokens pro Tag ist oft Spielraum für bessere Konditionen. Hoffentlich fühlen Sie sich jetzt sicher genug, Cortex AISQL-Funktionen einzusetzen, ohne von der Rechnung überrascht zu werden! Ich freue mich, von Ihren Erfahrungen mit diesen Features zu hören.

Jeff ist Data- und Analytics-Consultant mit über 15 Jahren Erfahrung in der Automatisierung von Insights und der datenbasierten Steuerung von Geschäftsprozessen. Technologisch ist er auf Snowflake + dbt + Tableau spezialisiert. Inhaltlich bringt er Erfahrung aus den Bereichen Energieversorgung, klinische Studien, Verlagswesen, CPG und Fertigung mit. Melden Sie sich gerne jederzeit: [email protected].