From Valve Developer Community
Jump to: navigation, search
A gameinfo.gi
from
- Набор данных DOTA с OBB
- Основные характеристики
- Версии набора данных
- DOTA-v1.0
- DOTA-v1.5
- DOTA-v2.0
- Структура набора данных
- Приложения
- Набор данных YAML
- Разделенные изображения DOTA
- Использование
- Образцы данных и аннотации
- Цитаты и благодарности
- ВОПРОСЫ И ОТВЕТЫ
- Что такое набор данных DOTA и почему он важен для обнаружения объектов на аэроснимках?
- Как набор данных DOTA справляется с разными масштабами и ориентацией изображений?
- Как я могу обучить модель, используя набор данных DOTA?
- Чем отличаются DOTA-v1.0, DOTA-v1.5 и DOTA-v2.0?
- Как подготовить изображения DOTA высокого разрешения для тренировки?
Набор данных DOTA с OBB
DOTA — это специализированный набор данных, в котором особое внимание уделяется обнаружению объектов на аэрофотоснимках. Этот набор возник из серии наборов данных DOTA и предлагает аннотированные изображения, на которых запечатлены разнообразные воздушные сцены с ориентированными ограничительными рамками (OBB).
Основные характеристики
- Коллекция с различных датчиков и платформ, размер изображений варьируется от 800 × 800 до 20 000 × 20 000 пикселей.
- В ней более 1,7 миллиона ориентированных боксов (Oriented Bounding Boxes) из 18 категорий.
- Включает в себя многомасштабное обнаружение объектов.
- Экземпляры аннотируются экспертами с помощью произвольного (8 d.o.f.) четырехугольника, захватывающего объекты разного масштаба, ориентации и формы.
Версии набора данных
DOTA-v1.0
- Содержит 15 общих категорий.
- Состоит из 2 806 изображений с 188 282 экземплярами.
- Соотношение частей: 1/2 для тренировки, 1/6 для валидации и 1/3 для тестирования.
DOTA-v1.5
- Воплощает в себе те же образы, что и DOTA-v1.0.
- Очень маленькие экземпляры (менее 10 пикселей) также аннотируются.
- Добавление новой категории: «контейнерный кран».
- В общей сложности 403 318 экземпляров.
- Выпущено для DOAI Challenge 2019 по обнаружению объектов на аэрофотоснимках.
DOTA-v2.0
- Коллекции с сайта Google Earth, спутника GF-2 и других аэрофотоснимков.
- Содержит 18 общих категорий.
- Состоит из 11 268 изображений с огромным количеством экземпляров — 1 793 658.
- Введены новые категории: «аэропорт» и «вертолетная площадка».
- Расщепление изображения:
- Обучение: 1 830 изображений с 268 627 экземплярами.
- Валидация: 593 изображения с 81 048 экземплярами.
- Test-dev: 2 792 изображения с 353 346 экземплярами.
- Тест-вызов: 6 053 изображения с 1 090 637 экземплярами.
Структура набора данных
DOTA демонстрирует структурированную схему, предназначенную для решения задач по обнаружению объектов OBB:
- Изображения: Огромная коллекция аэрофотоснимков высокого разрешения, на которых запечатлены различные местности и строения.
- Ориентированные ограничительные рамки: Аннотации в виде повернутых прямоугольников, заключающих в себе объекты вне зависимости от их ориентации, идеально подходят для захвата таких объектов, как самолеты, корабли и здания.
Приложения
DOTA служит эталоном для обучения и оценки моделей, специально предназначенных для анализа аэрофотоснимков. Благодаря включению аннотаций OBB она представляет собой уникальную задачу, позволяющую разрабатывать специализированные модели обнаружения объектов, учитывающие нюансы аэрофотосъемки.
Набор данных YAML
Обычно наборы данных включают в себя файл YAML (Yet Another Markup Language), в котором подробно описана конфигурация набора данных. Для DOTA v1 и DOTA v1.5 на сайте Ultralytics представлены DOTAv1.yaml
и DOTAv1.5.yaml
файлы. За дополнительной информацией по ним, а также по DOTA v2 обращайся к официальному репозиторию и документации DOTA.
# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA 1.0 dataset https://captain-whu.github.io/DOTA/index.html for object detection in aerial images by Wuhan University
# Documentation: https://docs.ultralytics.com/datasets/obb/dota-v2/
# Example usage: yolo train model=yolov8n-obb.pt data=DOTAv1.yaml
# ├── ultralytics
# └── datasets
# dataset root dir
# train images (relative to 'path') 1411 images
# val images (relative to 'path') 458 images
# test images (optional) 937 images
# Classes for DOTA 1.0
ground track field
soccer ball field
# Download script/URL (optional)
Разделенные изображения DOTA
Чтобы обучить набор данных DOTA, мы разбили оригинальные изображения DOTA с высоким разрешением на изображения с разрешением 1024×1024 многомасштабным способом.
# split train and val set, with labels.
# split test set, without labels.
Использование
Чтобы обучить модель на наборе данных DOTA v1, ты можешь воспользоваться следующими фрагментами кода. Всегда обращайся к документации своей модели за подробным списком доступных аргументов.
Обрати внимание, что все изображения и связанные с ними аннотации в наборе данных DOTAv1 можно использовать в академических целях, но коммерческое использование запрещено. Твое понимание и уважение к пожеланиям создателей датасета очень ценятся!
# Create a new YOLOv8n-OBB model from scratch
# Train the model on the DOTAv2 dataset
# Train a new YOLOv8n-OBB model on the DOTAv2 dataset
yoloobbtrainDOTAv1.yamlyolov8n-obb.pt
Образцы данных и аннотации
Один взгляд на набор данных иллюстрирует его глубину:
- Примеры из DOTA: Этот снимок подчеркивает сложность воздушных сцен и важность аннотаций Oriented Bounding Box, захватывающих объекты в их естественной ориентации.
Богатство набора данных позволяет получить неоценимое представление о проблемах обнаружения объектов, характерных исключительно для аэрофотосъемки.
Цитаты и благодарности
Для тех, кто использует DOTA в своих начинаниях, уместно привести ссылки на соответствующие научные работы:
Отдельная благодарность команде, стоящей за набором данных DOTA, за их похвальные усилия по курированию этого набора данных. Чтобы получить исчерпывающее представление о наборе данных и его нюансах, посети официальный сайт DOTA.
ВОПРОСЫ И ОТВЕТЫ
Что такое набор данных DOTA и почему он важен для обнаружения объектов на аэроснимках?
Набор данных DOTA — это специализированный набор данных, ориентированный на обнаружение объектов на аэрофотоснимках. В нем используются ориентированные граничные боксы (OBB), которые представляют собой аннотированные изображения различных воздушных сцен. Благодаря разнообразию ориентации, масштаба и формы объектов в 1,7 миллионах аннотаций и 18 категориях DOTA идеально подходит для разработки и оценки моделей, предназначенных для анализа аэрофотоснимков, например, для наблюдения, мониторинга окружающей среды и ликвидации последствий стихийных бедствий.
Как набор данных DOTA справляется с разными масштабами и ориентацией изображений?
В DOTA для аннотации используются ориентированные ограничительные рамки (Oriented Bounding Boxes, OBB), которые представлены в виде повернутых прямоугольников, заключающих в себе объекты независимо от их ориентации. Этот метод гарантирует, что объекты, будь они маленькими или расположенными под разными углами, будут точно запечатлены. Многомасштабные изображения в наборе данных — от 800 × 800 до 20 000 × 20 000 пикселей — позволяют эффективно обнаруживать как маленькие, так и большие объекты.
Как я могу обучить модель, используя набор данных DOTA?
Чтобы обучить модель на наборе данных DOTA, ты можешь использовать следующий пример с Ultralytics YOLO :
# Create a new YOLOv8n-OBB model from scratch
# Train the model on the DOTAv1 dataset
# Train a new YOLOv8n-OBB model on the DOTAv1 dataset
yoloobbtrainDOTAv1.yamlyolov8n-obb.pt
Подробнее о том, как разделить и предварительно обработать изображения DOTA, читай в разделе «Разделение изображений DOTA«.
Чем отличаются DOTA-v1.0, DOTA-v1.5 и DOTA-v2.0?
-
DOTA-v1.0: включает в себя 15 общих категорий на 2 806 изображениях с 188 282 экземплярами. Набор данных разделен на тренировочный, валидационный и тестовый наборы.
-
DOTA-v1.5: Развивает DOTA-v1.0, аннотируя очень маленькие экземпляры (менее 10 пикселей) и добавляя новую категорию «контейнерный кран», всего 403 318 экземпляров.
-
DOTA-v2.0: Расширяется за счет аннотаций с Google Earth и GF-2 Satellite, в нем 11 268 изображений и 1 793 658 экземпляров. В него вошли новые категории, такие как «аэропорт» и «вертолетная площадка».
Подробное сравнение и дополнительные подробности можно найти в разделе «Версии датасетов«.
Как подготовить изображения DOTA высокого разрешения для тренировки?
Изображения DOTA, которые могут быть очень большими, разбиваются на более мелкие разрешения для удобного обучения. Вот фрагмент Python для разделения изображений:
# split train and val set, with labels.
# split test set, without labels.
Этот процесс способствует повышению эффективности тренировок и производительности модели. Подробные инструкции можно найти в разделе «Раздельные изображения DOTA«.