Snowflake BUILD 2025では、AI、データ統合、開発者の生産性をテーマにした新機能やパートナーシップが数多く発表されました。主な内容を手短に振り返ります。
データ基盤 - 統合と接続性
AIプロダクトづくりは、整ったデータ基盤を整えるところから始まります。
Openflow Snowflake Deployment(GA)
構造化・非構造化データ、バッチ・ストリーミングのいずれにも対応する、オープンで拡張性のあるマネージド型マルチモーダルデータ統合サービスです。AWSとAzureの両方でSnowflakeマネージドデプロイメントがGAとなり、データ移動がぐっと手軽になりました。これまでは「Bring your own Cloud」方式のみで、openflowをAWSにデプロイしてからSnowflakeに接続する必要がありました。Snowflakeデプロイメント版では、構築も運用も格段にラクになります。週末に試してみたところ、セットアップは拍子抜けするほど簡単でしたが、使いこなすには少し慣れが必要だと感じました。
Snowflake AI Data Cloud と SAP Business Data Cloud の連携
Snowflakeは、SAP Business Data CloudとSnowflake AI Data Cloud間の双方向ゼロコピー統合を発表しました。整備済みでビジネスにすぐ使えるSAPデータに、ビジネスコンテキストを保ったままシンプルにアクセスでき、AIや分析を加速できます。SAP BDCはSAPアプリ間のデータを統一する役割を担います。現時点でSnowflakeを利用していないSAPユーザーも、SAP BDCに組み込まれたSnowflake製品「SAP Snowflake」を利用できるようになります。
Snowflakeは現在、Workday(開発中)、Salesforce、Oracle(まもなくPublic Preview)、SAPとのゼロコピー統合を提供しています。
Snowflake AI 関連の発表
Snowflake Intelligence(GA)
Snowflake Intelligenceは「働き方の未来」と銘打たれた、非エンジニアのビジネスユーザー向けのchatGPT風インターフェースです。SELECTでもたびたび取り上げてきた機能ですが、すべてのSnowflakeクラウドでGAとなりました。
Cortex Code(Private Preview)
Cortex Codeは、Snowsightに直接組み込まれたAIアシスタントで、Snowflakeインフラのコーディングや調査をサポートします。管理タスクやセキュリティ・ガバナンスを支援し、自然言語で使えるAIコーディングアシスタントとしても機能します。
Cortex Agents API(GA)
Snowflakeのマネージド型AIエージェントは、堅牢な推論モデルを用いて構造化・非構造化データの両方を取得・分析します。統一されたセキュリティとガバナンスを備えた使い勝手のよいREST APIを通じて、精度の高いインサイトを提供します。
Cortex Knowledge Extensions(GA)
Snowflake CKEは、Cortex Search Serviceでインデックス化されたドキュメントを安全に共有することで、サードパーティの非構造化データをエージェント型システムに取り込めるようにします。ニュースや調査レポートなどライセンスコンテンツにほぼリアルタイムでアクセスしつつ、プロンプトは自社アカウント内に留めておけます。本機能はPublic PreviewからGAに移行しました。
Snowflake Managed MCP Server(GA)
Snowflakeマネージド型MCPを使えば、Model Context Protocolを介して、お好みのAIツールからSnowflake上の資産をまとめて管理できます。Claude、ChatGPTをはじめとするLLMベースのアプリケーションが、Snowflakeのデータやインフラに安全にアクセスして操作できるようになります。Snowflakeはオープンな MCP標準を採用することで、カスタム連携を作り込まなくても、お好みのAIアシスタントからデータのクエリ、スキーマの把握、SQLの実行、Snowflake上の各種資産の活用が可能になります。
Snowflakeアカウント内でMCPサーバーを作成する方法の詳細はこちらをご覧ください。
Online Feature Store for ML(Public Preview)
不正検知やリアルタイムレコメンドなど、オンライン推論のユースケースに向けて、ML特徴量を低レイテンシ(P90で50ms未満)で提供します。オフラインの特徴量パイプラインとの整合性を自動で保ち、インフラ管理不要で高可用性を実現します。
AISQL向けコストガバナンス制御(まもなくGA)
管理者がAIの支出予算を追跡・管理し、自動で制御できるカスタムタグフレームワークです。支出が一定のしきい値を超えた際に、通知やカスタムアクションを発火するように設定できます。
Snowflake と Vercel のパートナーシップ
Snowflakeは、VercelのAI搭載開発ツールv0との統合を発表しました。これにより、自然言語でデータドリブンなNext.jsアプリケーションを構築し、Snowpark Container Servicesにデプロイできます。コンピュートとデータはSnowflake側に保持し、アプリケーションと認証層はVercel側が管理する分離アーキテクチャを採用しており、既存のSnowflakeセキュリティポリシーも自動で引き継がれます。v0とチャットしながらデータをクエリし、APIルートを含む完成形のアプリケーションを生成、ワンクリックでデプロイできます。本統合は現在ウェイトリスト受付中です。
個人的な印象としては、これによってSnowflake上にモダンで見栄えのするAIアプリを手軽に構築できるようになりそうです。
データプラットフォームとインフラ
Storage Lifecycle Policies
データエンジニアならぜひ押さえておきたい新機能です。Storage Lifecycle Policiesでは、設定したポリシーとレコードの経過日数に応じて、データをCOOLまたはCOLDストレージへ自動的に移動したり、行を削除したりできます。データ保持ポリシーをストアドプロシージャで実装する必要がなくなるうえ、低コストのストレージティアを活用できるメリットも得られます。百聞は一見にしかずなので、Snowflakeのドキュメントに掲載されている画像をご覧ください。
Snowflake Storage Lifecycle Policiesに関わるコスト要素を一通り見ていきましょう。
ストレージ:
- COOLストレージはAWSで$4/TB/月。データはクエリ可能な状態で保持されます。一度移動したデータは90日間保持する必要があり、それより早く削除すると最小保持期間料金が発生します。
- COLDストレージは$1/TB/月。COLDティアからのデータ取得には最大48時間かかる場合があります。最小アーカイブ期間は180日で、それより早く削除すると料金が発生します。
ポリシー実行コスト / アーカイブコスト:
- ポリシーは24時間ごとに1回、Snowflakeマネージド型のサーバーレスコンピュートを用いてデータを移動します。このサーバーレスコンピュートのクレジット倍率は50%で、通常のウェアハウスの半分のコストで利用できます。コンピュートサイズはSnowflakeが自動で決定します。
- あわせて、アーカイブされたファイル1,000件ごとに0.05クレジットが課金されます。
データ取得コスト:
- 取得したファイル1,000件ごとに0.05クレジットが課金されます。
Snowflake Postgres(まもなくPublic Preview、対応リージョン限定)
Snowflake AI Data Cloud上で提供される、高速かつ大量のトランザクション処理(OLTP)向けに設計されたフルマネージド型PostgreSQLサービスです。数分で立ち上げでき、管理・運用の負担も最小限です。PG VectorやPGISといった人気のPostgres拡張機能も標準で含まれています。
pg_lake(GA)
「pg_lake」は、PostgreSQLからIcebergカタログを管理できるようにするオープンソースのPostgreSQL拡張機能群です。これを最初に実現したのはDucklakeでしたが、Icebergカタログをリレーショナルデータベースで管理するという発想は理にかなっています。バージョンやタイムトラベルの探索が容易になり、Icebergメタデータ層のパフォーマンス向上も期待できます。詳しくはGitHubリポジトリをご覧ください。
Hybrid Tables on Azure(GA)
トランザクション機能と分析機能を兼ね備えたHybrid Tablesが、Azure上で一般提供開始となりました。
Horizon Catalog: 任意のIcebergへの書き込み(GA)
Apache PolarisがHorizon Catalogに組み込まれ、同等のタグ付け・ガバナンス・リネージ機能を保ったまま、任意のIcebergテーブルへの書き込みが可能になりました。
Snowflakeマネージド型Icebergテーブルの事業継続性とディザスタリカバリ(GA)
BDCRが、Snowflakeマネージド型Icebergテーブルでも利用可能になりました。
Interactive Tables と Warehouses(まもなくGA)
Interactive Tablesは、リアルタイムのストリーミング取り込みとクエリに最適化されています。プレウォーム済みのキャッシュを備え、常時稼働しているInteractive Warehousesを活用する仕組みで、低レイテンシかつ高い同時実行性が求められるサブ秒分析に向けて設計されています。
開発者エクスペリエンス
Workspaces(GA)
WorkspacesがついにGAとなりました。ご存じない方のために補足すると、WorkspacesはSnowsight内に用意されたファイルベースの集中型開発環境で、コード編集とバージョン管理を一元化できます。Gitと連携してバージョン管理やコラボレーションが行えるほか、dbtの実行にも対応します。あわせてShared Workspacesも発表され、ワークスペースをチームで共有できるようになりました。
Git統合の強化(GA)
Snowsightがセルフホスト型リポジトリに対応し、Git連携が大幅に強化されました。CI/CD連携を効率化するGitHub ActionsアプリもMarketplaceで提供されています。
dbt Projects on Snowflake(GA)
dbtによるデータ変換プロジェクトを、Snowflake上で直接構築・テスト・デプロイ・監視できます。dbt Coreのインフラを自前で管理する必要はありません。既存プロジェクトをインポートすることも、Snowsight Workspaces内で新規に作成することも可能です。6月のSnowflake Summit以降Public Previewでしたが、今回GAとなりました。
Snowpark Connect for Apache Spark™(GA)
既存のApache Spark(DataFrame、SQL)コードを、最小限の移行作業でSnowflake上で直接実行できます。Snowpark Connectなら、Sparkクラスタの運用や下り(egress)料金から解放されつつ、平均で5.6倍の高速化と41%のTCO削減を実現します。前回の「What's New in Snowflake」のまとめ以降Previewでしたが、このたびGAに移行しました。
Snowflake Optima(GA)
利用パターンから自動かつ継続的に学習するワークロード最適化エンジンです。インデックス作成やメタデータ収集を任せられるので、クエリパフォーマンス改善のための手動チューニングが不要になります。
データ共有とコラボレーション
セマンティックビューの共有(GA)
データプロバイダーが構造化データと併せてセマンティックビューを共有できるようになり、自然言語によるクエリが可能になります。開発者は追加の前処理なしで、共有されたデータをAIアプリやエージェント型システムに簡単に組み込めます。
オープンテーブルフォーマットの共有(GA)
Icebergをはじめとするオープンテーブルフォーマットで保存されたデータを、Snowflakeプラットフォーム全体で共有できます。
まとめ
本記事ではSnowflake Build 2025のハイライトをお届けしました。LinkedInに見やすいサマリースライドを公開してくださったVino Duraisamy氏に感謝します。スライドにはここで触れていない発表もいくつか含まれています。
Jeffはデータ&アナリティクスのコンサルタントとして15年以上の経験を持ち、インサイトの自動化やデータを使った業務プロセスの最適化を得意としています。技術面ではSnowflake + dbt + Tableau、業務領域では公益事業、臨床試験、出版、CPG、製造業での経験があります。お気軽にご連絡ください: [email protected]。