Play
上記ウェビナーのスライドはこちらからご覧いただけます。
---
SnowflakeのAI機能は非常に充実しています。SQLから直接言語モデルを実行する、アプリにセマンティック検索を組み込む、ドキュメントからデータを抽出する、ビジネスユーザーが自然言語でデータを問い合わせる——どれも手軽に実現できます。ただし厄介なのは、サービスごとに料金体系も監視ビューも異なり、知らないうちにコストが膨らむ落とし穴もそれぞれ違うという点です。
ここ数週間、SnowflakeのAI機能をじっくり検証してきました。本シリーズは、お客様の現場で実際に起きた「想定外のコスト」を皆さんが回避できるようにまとめたものです。従来のSnowflakeコスト管理はウェアハウスのサイジングとクエリ最適化が中心でしたが、AIサービスではトークン数、メッセージ単位の課金、サービング用コンピュート、エンベディングコストなど、まったく異なる発想で捉える必要があります。
本シリーズでは、Snowflakeの主要なAIサービスを一通り取り上げ、すぐ使えるSQLクエリ、実際の料金例、そして筆者なりの推奨事項を紹介します。以下はシリーズ全体の概要で、各セクションから該当記事へリンクしています。本記事を目次代わりにご活用ください。
Snowflake Cortex Search:概要とコスト監視
Cortex Searchは、RAGアプリ向けにベクター検索・キーワード検索・セマンティック検索を一括で扱えるフルマネージドのハイブリッド検索サービスです。料金体系はSnowflakeのAIサービスの中でも最も複雑で、サービング用コンピュート(インデックスデータ1GBあたりの継続コスト)、インデックス作成時のエンベディングトークン、更新用のウェアハウスコンピュート、インデックスのストレージ、クラウドサービスのオーバーヘッドが課金対象となります。こちらのガイドでは各コンポーネントを分解し、日次・時間単位の消費量を追跡する具体的なSQLクエリに加え、増分更新のための主キー活用法や、コストが急増する前に検索サービスを適切にサイジングするための推奨事項を紹介しています。
利用方法やコストの把握・監視について、さらに詳しくはこちらのブログ記事をご覧ください。
Snowflake Cortex Analystのコスト:概要と監視方法
Cortex Analystは自然言語の質問をSQLクエリに変換するサービスで、課金はトークン単位ではなくメッセージ単位です。クエリの複雑さにかかわらず、成功した1クエリ(HTTP 200レスポンス)ごとに1メッセージ分の料金が発生しますが、生成されたSQLを実際に実行するウェアハウスのコストも併せて見ておく必要があります。記事全文では、CORTEX_ANALYST_USAGE_HISTORYビューを使ってユーザー別・期間別のメッセージ消費量を追跡する方法と、Cortex Analystがほかのworkloadsとコンピュートリソースを共有している場合のウェアハウスコスト按分の進め方を解説しています。
Cortex Analystの使い方、課金の仕組み、コスト監視の詳細はこちらのブログ記事をご覧ください。
SnowflakeにおけるCortex AISQL関数のコスト監視方法
AI_COMPLETE、AI_EXTRACT、AI_CLASSIFY、AI_SUMMARIZEなどのAISQL関数を使えば、SQLクエリから直接AIモデルを呼び出せます。これらの関数はトークン単位の課金で、生成系関数では入力・出力の両方のトークンがカウントされ、選択するモデルによってコストは大きく変わります(プレミアムモデルは小型モデルの10倍に達することもあります)。この記事では、1万件の商品レビュー分析がGPT-4o-miniなら$0.96、Llama 3.1 405Bなら$9.00という具体的な料金例を示し、METERING_HISTORYビューでモデル別・ユーザー別・ウェアハウス別にコストを監視するSQLクエリも紹介しています。
トークン、モデル選択、コスト監視の細かなポイントについてはこちらのブログ記事をご覧ください。
Document AI:技術概要とコスト監視
SnowflakeのDocument AIは、SNOWFLAKE.CORTEX.PARSE_DOCUMENT関数を使ってPDF、画像、スキャン済みドキュメントから構造化データを抽出します。課金はAI Servicesのコンピュート時間(1コンピュート時間あたり8クレジット)に基づき、ページ数、ドキュメントの密度、抽出する値の数に応じてコストが増えていきます。典型的な請求書処理パイプラインはドキュメント1件あたり約$0.05ですが、密度の高い法務文書や複雑なフォームではかなり高額になることもあります。本ガイドでは、ドキュメント処理コストを追跡するSQLクエリに加え、信頼度しきい値の設定、バッチ処理の進め方、信頼度の低い抽出結果を人手レビューに回す判断基準など、実践的な推奨事項を紹介しています。
詳しくはDocument AIに関するブログ記事をご覧ください。
Snowflake Intelligence:技術概要とコスト監視
Cortex関連の機能のなかで、一般ユーザーにとっておそらく最も注目度が高いのがSnowflake Intelligenceです。ai.snowflake.comで公開されている新しいアプリで、SQLを書かなくてもビジネスユーザーが平易な英語で質問し、チャートやインサイト付きで回答を得られるAIエージェント型のインターフェースです。構造化データ(Cortex Analyst経由)、非構造化データ(Cortex Search経由)、カスタムツールを横断的にオーケストレーションし、包括的な回答を返します。コストモデルはほかのサービスよりむしろシンプルで、エージェント固有の料金は発生せず、背後で動くCortex AnalystのリクエストとCortex Searchの利用料のみが課金対象です。難しいのは、Intelligenceのコストがアカウント使用量ビュー上で複数のサービスタイプに分散している点で、本記事では関連コストをすべて集約するクエリを示し、エージェントが生成したクエリにウェアハウス実行コストを紐付ける方法も解説しています。
Snowflake Intelligenceの使い方、セットアップ方法、課金の仕組みの詳細はこちらのブログ記事をご覧ください。
どこから読むべきか
すでにいずれかのサービスを使っている方は、該当するサービスを扱った記事から読み始めてください。これからどのAI機能を採用するか検討している方には、最も汎用性が高いSnowflake IntelligenceまたはAISQL Functionsから着手することをおすすめします。
各記事についてご質問があれば、ぜひお聞かせください。皆さんがどのAI機能を使い、どのようにコストを抑えているかも教えていただけると嬉しいです。
Jeffはデータ・アナリティクスのコンサルタントで、インサイトの自動化やデータを活用したビジネスプロセス制御において15年以上の経験を持ちます。技術面ではSnowflake + dbt + Tableauを得意とし、業務領域では公益事業、臨床試験、出版、CPG、製造業に携わってきました。お気軽にご連絡ください:[email protected]。