【Data & AI Summit 2025 セッションレポート】 レイクハウスの次なる一手!OLTPデータベース「Lakebase」登場

はじめに

本記事はData & AI Summit 2025 セッションのSummit Live: OLTP for the Lakehouseの発表をまとめたものです。
データ分析基盤と業務 DB が分かれていることにより、開発者はデータ複製と整合性担保に全体の 30 % 近い時間を費やすと言われます。123
AI エージェントなどリアルタイム応答が求められるアプリでは、この分断がボトルネックです。 Databricks Data + AI Summit 2025 で発表された 「Lakebase」 は、 Lakehouse 上で運用系 OLTP を直接処理できる初のサービスとして、こうした課題を根本から解決します。

Lakebaseとは:分析と運用のための統合DB

Lakebaseは、Databricksレイクハウスプラットフォームにネイティブ統合された、PostgreSQL互換のサーバレスOLTP(オンライントランザクション処理)データベースです。

OLTPとは、ECサイトの決済処理や銀行の入出金管理のように、リアルタイムで発生する多数の短期的な処理を指します。Lakebaseは、高い即時性が求められる「運用」のワークロードを、データ分析基盤であるレイクハウス上で直接扱えるようにする画期的なサービスです。

その技術基盤には、サーバレスPostgresで高い評価を得ているNeonの革新的なアーキテクチャが採用されています。運用ワークロードに求められる厳しい性能要件に応えるため、Lakebaseは10ミリ秒以下の低レイテンシ数万QPS(秒間クエリ数) を実現することを目指して設計されています。

Lakebaseを支える3つの主要技術

Lakebaseには、3つの技術的特徴があります。

1. コンピューティングとストレージの分離

モダンなクラウドDBの標準とも言えるアーキテクチャです。データを安価なオブジェクトストレージに保持しつつ、ワークロードに応じてコンピュートリソースを独立してスケールさせることができ、コスト効率を最大化します。

2. 開発体験を革新する「Zero-Copy Clone」

Lakebaseの最も強力な機能が、「Zero-Copy Clone」です。セッションで示されたように、例えば2TBもの巨大なデータベースでも、瞬時に、低コストでコピー(ブランチ)を作成できます。

この画期的な機能は、基盤技術であるNeonのCopy-on-Writeアーキテクチャによって実現されています。物理的なデータ複製を伴わず、メタデータの操作だけでブランチを作成するため、コストと時間を劇的に削減可能です。

従来の開発フロー (Before) Lakebaseを活用した開発フロー (After)
開発環境のために本番DBのサブセットを作成・マスキングするのに時間がかかる 1コマンドで本番DBのブランチを瞬時に作成し、開発環境として利用開始
ステージング環境の構築にインフラチームへの依頼とコスト承認が必要 開発者自身がセルフサービスで、必要な時にステージング環境を構築
CI/CDでのDBテストは、データの準備とクリーンアップが複雑 PRごとにDBブランチを自動生成し、本番同等のデータで安全かつ確実なテストを実行
障害発生時の復旧は、バックアップからのリストアに長時間を要する ポイントインタイムリカバリで、特定の時点の状態へ迅速に復旧

3. 効率的なサーバレスコンピューティング

コンピュートはサーバレスで提供されるため、リクエストがない間は自動的に停止し、コストが発生しません。これは、使用頻度が変動する開発環境や社内ツールにとって大きなメリットとなります。

まとめ:Databricksの戦略とLakebaseの位置づけ

Lakebaseの登場は、Databricksが「データ分析プラットフォーム」から、AIアプリケーション開発・運用のための統合プラットフォームへと進化を遂げたことを明確に示します。

これまで分断されていた分析データと運用データをLakehouse上で一元管理することで、企業はリアルタイムの洞察に基づいたインテリジェントなアプリケーションを、より迅速かつ低コストで構築できるようになります。これは、Databricksの掲げる、すべての企業が「データとAIの会社」になることを支援するという壮大なビジョンに向けた大きな一歩です。

本サービスは既にパブリックプレビューが開始されています。次世代のデータアーキテクチャの可能性を、ぜひご自身の目でお確かめください。

Databricks Summit 2025の最新情報をさらに知りたい方へ

Lakebase以外にも、Databricks Summit 2025では数多くの革新的な発表がありました。AIモデルの進化、データガバナンスの新機能、業界別ソリューションなど、データとAIの最前線に関する貴重な情報が満載です。

これらの最新情報を総合的に理解し、ビジネスに活かすための詳細な解説と資料は、ナレコムDAIS特設サイト でご覧いただけます。Databricksエキスパートによる解説セミナーの情報も掲載していますので、ぜひアクセスしてください。

 

  1. https://www.soda.io/resources/introducing-soda-core-the-new-way-for-data-reliability 

  2. https://www.sonarsource.com/blog/how-much-time-do-developers-spend-actually-writing-code/ 

  3. https://www.montecarlodata.com/blog-2022-data-quality-survey/ 

この記事を書いた人

aws-recipe-user