こんにちは!HALです。
前回、『データ加工ツールtalend』という記事で、オープンソースの高性能データ収集・整理・変換・統合ができる「talend」というツールを紹介させていただきました。
今回はそのtalendについて、もう少し詳細を記載していきたいと思います。
特に、従来製品と比べたtalendの魅力という切り口でご紹介いたします。
ビッグデータを取り扱うにあたり、いくつか課題があると考えられます。
その1:多種多様なデータソースに対応できない
従来製品の場合は、コネクトの数が十分ではなかったり、製品のソースが読めないようになっていて、独自で作成ができず、多種多様なデータソースに対応することが難しいという課題がありました。
これに対してtalendは、ほとんどの情報ソースに接続することができて、Javaコードが見れるようになっています。
その2:ビッグデータ関連の技術習得が難しい
Hadoopをはじめとして、ビッグデータ関連の技術を習得するのは難しく、エンジニアリソースも不足がちな分野だと思います。
talendは様々なビッグデータのコンポーネンツとAPI接続ができるので、そのような課題に対応することができます。
※実装済みのコネクト、コンポーネント例
●Hadoop :AnazonEMR/cloudera/Hadoopなど
●NoSQLDB :mongoDB/google bigquery/cassandraなど
●DWH :AmazonRedshift/SAP HANA/hp VERTICAなど
その3:ビッグデータの高速処理
従来製品は性能限界がハードウェアに依存してしまいましたが、talendはHadoop上で稼働するので、性能限界がほとんどないようです。
その4:ライセンスの費用対効果
talendは有償版もあり、従来の製品のライセンスモデルは、サーバ数やCPU数など、データの増加に応じてライセンス費用も高くなってしまうモデルが多く、費用対効果を維持できないケースがありました。
これに対して、talendの有償版のライセンスモデルは利用者の数であるため、データ量に比例しないモデルになっております。また、新しいコネクタも無償で提供されるそうです。
いかがでしたでしょうか。
次回はもっと機能的な魅力についてご案内していきたいと思います。
お楽しみに!!