概要¶
この章では、MMDetection のフレームワークを紹介し、MMDetection に関する詳細なチュートリアルへのリンクを提供します。
MMDetection とは¶
MMDetection は、豊富なオブジェクト検出、インスタンスセグメンテーション、パノプティックセグメンテーションの手法と、関連するコンポーネントやモジュールを含むオブジェクト検出ツールボックスです。以下にそのフレームワーク全体を示します。
MMDetection は、apis、structures、datasets、models、engine、evaluation、visualization の 7 つの主要部分で構成されています。
apis は、モデル推論のための高レベル API を提供します。
structures は、bbox、mask、DetDataSample などのデータ構造を提供します。
datasets は、オブジェクト検出、インスタンスセグメンテーション、パノプティックセグメンテーションのためのさまざまなデータセットをサポートします。
transforms は、多くの有用なデータ拡張変換を含んでいます。
samplers は、さまざまなデータローダーのサンプリング戦略を定義します。
models は、検出器にとって最も重要な部分であり、検出器のさまざまなコンポーネントが含まれています。
detectors は、すべての検出モデルクラスを定義します。
data_preprocessors は、モデルの入力データを前処理するためのものです。
backbones は、さまざまなバックボーンネットワークを含んでいます。
necks は、さまざまなネックコンポーネントを含んでいます。
dense_heads は、密な予測を実行するさまざまな検出ヘッドを含んでいます。
roi_heads は、RoI から予測するさまざまな検出ヘッドを含んでいます。
seg_heads は、さまざまなセグメンテーションヘッドを含んでいます。
losses は、さまざまな損失関数を含んでいます。
task_modules は、検出タスクのためのモジュールを提供します。たとえば、アサイナー、サンプラー、ボックスコーダー、プライアジェネレーターなどです。
layers は、いくつかの基本的なニューラルネットワーク層を提供します。
engine は、ランタイムコンポーネントの部分です。
runner は、MMEngine のランナーの拡張機能を提供します。
schedulers は、最適化ハイパーパラメータを調整するためのスケジューラーを提供します。
optimizers は、オプティマイザーとオプティマイザーラッパーを提供します。
hooks は、ランナーのさまざまなフックを提供します。
evaluation は、モデルのパフォーマンスを評価するためのさまざまな指標を提供します。
visualization は、検出結果を視覚化するためのものです。
このガイドの使い方¶
MMDetection についてさらに学ぶための詳細なステップバイステップガイドは以下のとおりです。
インストール手順については、get_started を参照してください。
MMDetection の基本的な使い方については、以下のチュートリアルを参照してください。
さらに深く掘り下げるには、以下のチュートリアルを参照してください。
MMDetection 2.x バージョンのユーザー向けに、新しいバージョンに適応するためのガイドを提供しています。移行ガイド を参照してください。