MaGGIe представляет наборы данных I-HIM50K и M-HIM2K, содержащие более 180 000 синтезированных масок людей для оценки устойчивости матирования экземпляров.MaGGIe представляет наборы данных I-HIM50K и M-HIM2K, содержащие более 180 000 синтезированных масок людей для оценки устойчивости матирования экземпляров.

Синтез данных многоэкземплярного матирования человека с использованием MaskRCNN и BG20K

2025/12/20 02:30

Резюме и 1. Введение

  1. Связанные работы

  2. MaGGIe

    3.1. Эффективное маскированное управляемое извлечение экземпляров

    3.2. Временная согласованность матовых признаков

  3. Наборы данных для извлечения экземпляров

    4.1. Извлечение экземпляров изображений и 4.2. Извлечение экземпляров видео

  4. Эксперименты

    5.1. Предварительное обучение на данных изображений

    5.2. Обучение на видеоданных

  5. Обсуждение и ссылки

\ Дополнительный материал

  1. Детали архитектуры

  2. Извлечение изображений

    8.1. Генерация и подготовка набора данных

    8.2. Детали обучения

    8.3. Количественные детали

    8.4. Дополнительные качественные результаты на естественных изображениях

  3. Извлечение видео

    9.1. Генерация набора данных

    9.2. Детали обучения

    9.3. Количественные детали

    9.4. Дополнительные качественные результаты

8. Извлечение изображений

Этот раздел расширяет процесс извлечения изображений, предоставляя дополнительную информацию о генерации набора данных и всесторонние сравнения с существующими методами. Мы углубляемся в создание наборов данных I-HIM50K и M-HIM2K, предлагаем подробный количественный анализ и представляем дополнительные качественные результаты, чтобы подчеркнуть эффективность нашего подхода.

8.1. Генерация и подготовка набора данных

Набор данных I-HIM50K был синтезирован из набора данных HHM50K [50], который известен своей обширной коллекцией матовых изображений людей. Мы использовали модель MaskRCNN [14] Resnet-50 FPN 3x, обученную на наборе данных COCO, для фильтрации изображений с одним человеком, в результате чего получилось подмножество из 35 053 изображений. Следуя методологии InstMatt [49], эти изображения были скомпонованы на разнообразных фонах из набора данных BG20K [29], создавая многоэкземплярные сценарии с 2-5 субъектами на изображение. Субъекты были изменены в размере и расположены для сохранения реалистичного масштаба и избежания чрезмерного перекрытия, о чем свидетельствует IoU экземпляров, не превышающий 30%. Этот процесс дал 49 737 изображений в среднем по 2,28 экземпляра на изображение. Во время обучения маски управления генерировались путем бинаризации альфа-матов и применения операций случайного исключения, расширения и эрозии. Примеры изображений из I-HIM50K показаны на рис. 10.

\ Набор данных M-HIM2K был разработан для проверки устойчивости модели к различным качествам масок. Он включает десять масок на экземпляр, сгенерированных с использованием различных моделей MaskRCNN. Дополнительная информация о моделях, используемых для этого процесса генерации, показана в таблице 8. Маски были сопоставлены с экземплярами на основе наивысшего IoU с эталонными альфа-матами, обеспечивая минимальный порог IoU в 70%. Маски, которые не соответствовали этому порогу, были искусственно сгенерированы из эталонных данных. Этот процесс привел к созданию комплексного набора из 134 240 масок, из которых 117 660 для композитных и 16 600 для естественных изображений, обеспечивая надежный эталон для оценки маскированного управляемого извлечения экземпляров. Полный набор данных I-HIM50K и M-HIM2K будет выпущен после принятия этой работы.

\ Рисунок 10. Примеры набора данных I-HIM50K. (Лучше просматривать в цвете).

\ Таблица 8. Десять моделей с различным качеством масок используются в MHIM2K. Модели MaskRCNN взяты из detectron2, обученных на COCO с различными настройками.

\

:::info Авторы:

(1) Chuong Huynh, University of Maryland, College Park ([email protected]);

(2) Seoung Wug Oh, Adobe Research (seoh,[email protected]);

(3) Abhinav Shrivastava, University of Maryland, College Park ([email protected]);

(4) Joon-Young Lee, Adobe Research ([email protected]).

:::


:::info Эта статья доступна на arxiv под лицензией CC by 4.0 Deed (Attribution 4.0 International).

:::

\

Возможности рынка
Логотип Multichain
Multichain Курс (MULTI)
$0.03828
$0.03828$0.03828
+2.84%
USD
График цены Multichain (MULTI) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Почему Питер Брандт говорит, что криптозаконопроект США не станет переломным моментом

Почему Питер Брандт говорит, что криптозаконопроект США не станет переломным моментом

Статья «Почему Питер Брандт считает, что американский законопроект о криптовалюте не станет прорывом» появилась на BitcoinEthereumNews.com. Приведет ли знаковый американский законопроект о криптовалюте к взлету Bitcoin
Поделиться
BitcoinEthereumNews2025/12/20 08:21
Неудержимая криптовалюта: Как финансовая система трансформируется к 2026 году, согласно Coinbase

Неудержимая криптовалюта: Как финансовая система трансформируется к 2026 году, согласно Coinbase

BitcoinWorld Неостановимая криптовалюта: Как финансовая система трансформируется к 2026 году по мнению Coinbase Наконец ли криптовалюта переходит из маргинальной в
Поделиться
Coinstats2025/12/20 08:00
Акции США закрылись ростом по всем направлениям, акции технологических и блокчейн-компаний в целом выросли.

Акции США закрылись ростом по всем направлениям, акции технологических и блокчейн-компаний в целом выросли.

PANews, 20 декабря — Согласно Cailian Press, три основных фондовых индекса США закрылись с ростом. Индекс Dow Jones Industrial Average вырос на 0,38%, снизившись на 0,67
Поделиться
PANews2025/12/20 09:02