【導入事例を大紹介!】ナレッジコミュニケーションのdatabricks導入支援について

はじめに

d4474-22-282332-0.png
ナレッジコミュニケーションではdatabricksのソリューションパートナーとして、
これまで数多くのお客様に導入支援を実施させていただきました。
今回は代表的な導入事例や導入に伴う費用感についてご紹介させていただきます。

 

databricksとは?

databricks とはdatabricks社が開発したApache Spark をベースにした統合データ分析プラットフォームです。
米国ではデータ活用のプラットフォームとして databricks が第一の選択肢に上がるようになっており、Gartner社が選ぶデータサイエンスおよび機械学習プラットフォームの2020マジッククアドラントでリーダーに位置しています。
主な特徴として以下が挙げられます。
・クイックにデータ統合・分析環境の立ち上げが可能
・自動スケール、自動停止が可能
・複数のデータサイエンティストの生産性向上が見込める

 

 

トヨタ情報システム愛知様との事例

d4474-11-747650-1.png
テラバイト級のデータに対する処理機構としてdatabricksをご採用いただき、
30倍の処理速度向上と8割以上の運用コスト圧縮を実現しました。
【参考URL】
https://prtimes.jp/main/html/rd/p/000000011.000004474.html

 

 

電通デジタル様との事例

20201204.jpg
データサイエンティストチームの分析環境の統合基盤として databricks を採用していただきました。
分析の知見を社内で共有することが可能となり、顧客からの分析オーダーに対して導入前の2倍以上の速度でアウトプットが出来るようになりました。
【参考URL】
https://prtimes.jp/main/html/rd/p/000000023.000004474.html

 

 

某教育業界のお客様との事例

取り扱いに注意が必要なデータを扱う分析環境の導入をパブリッククラウドのアーキテクチャ設計も含めてご支援しました。
AWS、Azure といったクラウドと同様の第三者認証セキュリティを持つ databricks を採用することで、セキュアでありながらビッグデータ分析にも対応した分析環境を実装しました。

 

ナレッジコミュニケーションでの導入支援プラン

2021-02-26_09h50_56.png

ナレッジコミュニケーションではdatabricks の導入から、その後の運用までご支援可能です。
以下のホームページからお問い合わせが可能でございますので、ぜひご検討くださいませ。
【お問い合わせHP】
https://www.knowledgecommunication.jp/product/databricks.html

 

 

参考ランニングコスト

databricks のランニングコストは状況によってまちまちですが、
参考までに過去の利用ケースを基に、月額費用例を算出させていただきます。

■稼働状況
・データサイエンティスト4人が業務時間中フル稼働で利用​
・1人あたり1ヶ月約230時間分の仮想マシンを稼働
■分析対象データ
・60GB (契約データ、WEBマーケデータ、契約情報などのCRMデータ)​

2021-02-25_20h00_41.png

終わりに

近年データ分析を実施する際に
データの増大による処理時間の遅延や
エンジニア同士の共同作業の難しさから発生するタイムロス

が発生するケースが増えてきております。

もしお客様が上記のような問題を抱えているなら、
databricks の導入はその高性能処理能力や複数人での使いやすさから非常に有効なソリューションとなりうるのではないでしょうか。
ぜひ導入をご検討くださいませ。

この記事を書いた人

aws-recipe-user