Генерация "искусственных" изображений для обучения CNN


Я пытаюсь идентифицировать различные типы транспортных средств и логотипов и т. д. Как и в случае большинства усилий в этой области, проблема заключалась в нехватке обучающих изображений.

Пробовал ли кто-нибудь создавать искусственные образы? "Рисуя" логотип поверх (скажем) капота автомобиля, задней части автомобиля и выполняя искажения (например, изменение цвета, формы и т. д.) дать ему более разнообразный набор тренировок.

Существуют ли руководящие принципы и / или передовая практика в этом подходе?

Редактировать: downvoters, по крайней мере пожалуйста, прокомментируйте, почему вы понизили голос, чтобы я мог узнать. Я не пытаюсь троллить этот форум и искренне задал вопрос. Если вы не согласны, пожалуйста, поделитесь своими мыслями.

1   2  

1 ответ:

Увеличение данных-это хорошо известный метод решения проблемы избыточной подгонки. Желательно, чтобы вы делали это, выполняя эти искажения на исходных обучающих изображениях. Это может быть сделано путем добавления шума, выполнения перекоса, вращения, обрезки случайных окон и обучения на этих окнах. Это лишь некоторые примеры.

Делать это с сгенерированными изображениями было бы не лучшим вариантом, потому что сгенерированные изображения не были бы так хороши, как доступное обучение. изображения.

Начните с этой статьи она объясняет AlexNet и упоминает некоторые из трюков, которые они использовали, которые включают в себя некоторое увеличение данных.