DatabricksでDelta tableを触ってみた

はじめに

前記事(URL)ではDatabricksでDelta tableの構築を行いました。
今回は構築したDelta tableを実際に使用していきたいと思います。

以下の流れでDelta tableを触っていきます。
・データの中身の確認
・クエリの実装
・可視化

データの中身の確認

前回作成したテーブルの中身を実際に見ていきます。
image.png

クエリの実装

クエリを使用して、データの整理を行っていきます。
今回は、時系列に沿って全国の人口の推移を総人口、男女別で抜き出すようなクエリを作成していきます。
実際のコードと実行結果が以下の画像です。
image.png

欲しい情報だけを抽出することができました。

可視化

Databricksでは出力されたテーブルの可視化も行えます。
先ほどの画像のテーブルの下にあるグラフのマークをクリックし、Plot Optionsをクリックすることによってグラフをカスタマイズできます。
今回はX軸に年、Y軸に総人口、女性の人口、男性の人口を指定して折れ線グラフを作成してみました。
カスタマイズを終えれば右下のApplyをクリックします。
image.png

最終的に以下のような画像が出力されます。
image.png
Plot Optionsを以下のように変更すると異なるグラフにもなります。
image.png
image.png

これで時系列に沿った全国の人口の推移を総人口、男女別で可視化することができました。
このようにDatabricksでは作成したDelta tableを使用することができます。

この記事を書いた人

aws-recipe-user