Узнайте, как сегментация экземпляров улучшает обнаружение объектов с точностью до пикселя, позволяя создавать детальные маски объектов для приложений искусственного интеллекта.
Сегментация объектов - это сложная техника компьютерного зрения (CV), которая идентифицирует объекты на изображении и определяет точные границы каждого отдельного объекта на пиксельном уровне. В отличие от методов, которые только размещают рамки вокруг объектов, сегментация экземпляров обеспечивает гораздо более детальное понимание сцены, создавая уникальную маску для каждого обнаруженного объекта, даже если они принадлежат к одному классу. Эта возможность очень важна для современных приложений искусственного интеллекта (ИИ), где необходимо знать точную форму, размер и пространственную протяженность отдельных объектов, особенно когда объекты перекрываются.
Модели сегментации объектов анализируют изображение, чтобы сначала найти потенциальные объекты, а затем, для каждого обнаруженного объекта, предсказать, какие пиксели принадлежат данному конкретному объекту. Традиционные подходы, такие как влиятельная архитектура Mask R-CNN, часто используют двухэтапный процесс: во-первых, они выполняют обнаружение объектов для создания предложений ограничивающих рамок, а во-вторых, они генерируют маску сегментации в пределах каждой предложенной рамки. Несмотря на свою эффективность, эти методы могут быть требовательны к вычислительным ресурсам.
Более современные подходы, включая такие модели, как Ultralytics YOLO, часто используют одноэтапные конвейеры. Эти модели одновременно предсказывают ограничительные рамки, метки классов и маски экземпляров за один проход через нейронную сеть (НС), что приводит к значительному повышению скорости, делая их пригодными для выводов в режиме реального времени. Для обучения этих моделей требуются большие наборы данных с аннотациями на уровне пикселей, такие как широко используемый набор данных COCO, в частности его аннотации к сегментации. В этом процессе обычно используются методы глубокого обучения (DL), использующие конволюционные нейронные сети (CNN) для изучения сложных визуальных характеристик.
Важно отличать сегментацию экземпляров от других задач сегментации изображений:
Сегментация объектов направлена на обнаружение и выделение отдельных экземпляров объектов, обеспечивая высокую точность определения границ и разделения объектов.
Способность точно идентифицировать и изолировать отдельные объекты делает сегментацию экземпляров неоценимой во многих областях:
Ultralytics предлагает современные модели, способные эффективно выполнять сегментацию экземпляров. Такие модели, как YOLOv8 и YOLO11, разработаны для обеспечения высокой производительности в различных задачах компьютерного зрения, включая сегментацию экземпляров(см. подробности задачи сегментации). Пользователи могут использовать предварительно обученные модели или выполнять тонкую настройку на пользовательских наборах данных с помощью таких инструментов, как платформа Ultralytics HUB, которая упрощает рабочий процесс машинного обучения (ML) от управления данными до развертывания моделей. Для практического применения доступны такие ресурсы, как учебные пособия по сегментации с помощью предварительно обученных моделей Ultralytics YOLOv8 или руководства по выделению объектов сегментации. Вы также можете узнать , как использовать Ultralytics YOLO11 для сегментации экземпляров. Для разработки и развертывания этих моделей обычно используются такие популярные фреймворки, как PyTorch и TensorFlow.