はじめに
この記事は株式会社ナレッジコミュニケーションが運営する クラウドAI by ナレコム Advent Calendar 2022 の19日目にあたる記事になります。
昨年に続き令和4年12月時点のAmazon SageMakerのサービスをまとめてみようと思います。この記事では、SageMakerのサービスは、「Amazon SageMaker○○○」となっているものを対象としています。
また、2022年11月28日 -12月2日で開催された「AWS re:Invent2022」のアップデート情報も追記しています。
各SageMakerサービスの位置づけ
令和4年12月時点のAmazon SageMakerのサービス一覧をMLワークフローに合わせて以下図にまとめてみます。
各SageMakerのサービス概要
Amazon SageMaker
機械学習を実施するうえで必要なモデル開発、学習、推論をトータルで実施することできるフルマネージド型サービスです。
【アップデート】シャドーテストをサポート。新しい機械学習のモデルと本番モデルの比較検証可能
Amazon SageMaker Data Wrangler
AWS の各種サービスからデータをインポートし、リアルタイムでデータの可視化や変換の処理を GUI 上で行えるサービス
【アップデート】40以上のサードパーティ製アプリケーションをデータソースとしてサポート開始
Amazon SageMaker Clarify
各特徴量が予測結果にどのくらい寄与しているか可視化できるなど、機械学習モデルの解釈可能性・公平性というところが視覚的にわかりやすく確認できることができるサービス
Amazon SageMaker Data Labeling
Ground TruthとGround Truth Plusの総称
Amazon SageMaker Training Compiler
既存のトレーニング用Pythonの訓練コードを自動でコンパイルして、自然言語処理やコンピュータービジョンタスクのトレーニングや調整に必要な時間を大幅に短縮することができるサービス
Amazon SageMaker Inference Recommender
機械学習の推論フェーズで最適な推論パフォーマンスとコストを実現するためにモデルデプロイに最適なMLインスタンスの構成を推奨するサービス。
Amazon SageMaker Serverless Inference
推論のMLモデルをデプロイするインスタンスをサーバレスで構成し、推論リクエストの量に基づき、コンピュート容量のプロビジョニング、スケーリングを自動で行うサービスです。
Amazon SageMaker Feature Store
インフラを管理することなく、特徴データを安全に保管および取得することができるサービス。特徴データにタグ付けしたりインデックスをつけて検索できたりします。
Amazon SageMaker Processing
機械学習のためのデータ前処理などをバッチで実行するためのインフラ環境を提供するサービス。
Amazon SageMaker Studio
機械学習のための統合開発環境(IDE)でNotebookで行う方法よりも簡単に、そして可視化された状態で機械学習が行えるようになるサービスです。
【アップデート】ノートブックコードの準本番状態のジョブへの自動変換をサポート開始。リアルタイムコラボレーションに対応。
Amazon SageMaker Notebooks
Amazon SageMaker Studio に組み込まれている共同作業用ノートブックで、すばやく起動ができ、ノートブックの共有が安全に簡単にできます。
Amazon SageMaker Studio Lab
AWSアカウントが不要で無料で機械学習の学習ができるサービス。数クリックで機械学習を学習するインフラの構築ができます。
Amazon SageMaker JumpStart
機械学習の知識がなくとも数クリックでプリセットされている学習済みの機械学習のモデルをデプロイできる。また、時系列予測、金融取引の不正検知などさまざまなジャンルのユースケースに合わせたSageMaker周辺の構成がCloudFormationでデプロイできるサービスです。
【アップデート】MLアーティファクト共有機能を強化。
Amazon SageMaker Autopilot
回帰/分類問題に対して、自動で機械学習モデルの準備、トレーニングおよびパラメータ調整を行ってくれるAoutoMLサービスです。
【アップデート】継続的デリバリー (CI/CD) 専用サービスの Amazon SageMaker Pipelines に統合されました。これにより、SageMaker Autopilot を使用して ML モデルを構築し、それに続く CI/CD ステップにモデルを統合するエンドツーエンドフローを自動化できます。
Amazon SageMaker Debugger
トレーニング中のモデルの問題を自動で検知し、モデル内部を可視化し、問題を調査することができ、トレーニング中の問題を素早く検知し解決することを支援するサービスです。
Amazon SageMaker Model Monitor
Amazon SageMakerの機械学習モデルと推論データの品質を監視し、推論時に投入されるデータの質が、モデルを学習した時と変化した場合にアラートを発砲したりするサービスです。
Amazon SageMaker Edge
スマートカメラ、ロボット、産業用機械などのエッジデバイスにデプロイされたモデルの管理・モニタリングができるサービスです。
Amazon SageMaker Neo
機械学習モデルをコンパイルし、任意のデバイスで動作させることができる。モデルのコンパイルを行うことで特定のデバイスに最適化を行うことが出来るサービスです。
Amazon SageMaker Canvas
ノーコードでエンジニアではないビジネスユーザーがコードを記述せずに機械学習モデルを構築できるサービスです。
Amazon SageMaker Pipelines
エンドツーエンドの機械学習ワークフローを管理するための CI/CD サービスです。
【アップデート】継続的デリバリー (CI/CD) 専用サービスの Amazon SageMaker Pipelines に統合されました。これにより、SageMaker Autopilot を使用して ML モデルを構築し、それに続く CI/CD ステップにモデルを統合するエンドツーエンドフローを自動化できます。
Amazon SageMaker ML Governance
「Role Manager」、「Model Cards」、「Model Dashboard」から構成されており、権限の管理やモデルの情報を一元的に監視する機能があります。