[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

블로그

[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지 본문

공부/DL

[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지

beenu 2024. 4. 4. 17:07

Object Detection

컴퓨터는 동영상을 프레임 단위로 인식함
물체 A가 오른쪽에서 왼쪽으로 이동하면 사람은 바로 인지할 수 있지만, 컴퓨터는 오른쪽 A와 왼쪽 A를 같은 것이라고 인지하지 못함 => 인식이 됐다가 안됐다가 함
Localization : 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음
Object Detection : 여러 개의 Object들의 위치를 Bounding Box로 지정하여 찾음
Bounding Box
- 하나의 Object가 포함된 최소 크기 박스
- 구성 요소 : x, y(좌표), w, h(크기) => 모두 합쳐서 위치 정보라고 할 수 있음
- Ground-truth Bounding Box : 정답 박스
- Prediction Bounding Box : 모델이 예측한 박스
  - 구성 요소 : 예측값 (x햇, y햇, w햇, h햇)
모델이 Object가 있는 위치를 잘 예측 -> Regression으로 접근
- x와 x햇, y와 y햇이 비슷 : Bounding Box 꼭짓점 예측을 잘했다
- w와 w햇, h와 h햇이 비슷 : Bounding Box 크기 예측을 잘했다
Object가 Bounding Box 안에 있다면 Classification으로 접근 가능
Confidence Score : Object가 Bounding Box 안에 있는지에 대한 확신의 정도
- 0에 가까울수록 Object가 없다고 추측
- 1에 가까울수록 Object가 있다고 추측
- 모델마다 IoU 정의가 다름
  1. 단순히 Object가 있을 확률
  2. Object가 있을 확률 * IoU
  3. Object가 특정 클래스일 확률 * IoU
IoU (Intersection over Union)
- 두 박스의 중복 영역 크기를 통해 측정 -> 겹치는 영역이 넓을수록 좋은 예측
NMS (Non-Maximum Suppression)
- IoU가 일정 값 이상이면 같은 Object를 가리키는 것이라고 판단, 상대적으로 Confidence Score가 낮은 Bounding Box를 제거하는 것
  1. 일정 Confidence Score 이하의 Bounding Box 제거
  2. 남은 Bounding Box들을 Confidence Score 내림차순으로정렬
  3. 첫 Bounding Box(Confidence Score가 가장 높은!)와의 IoU 값이 일정 이상인 박스들을 제거
  4. Bounding Box가 하나 될 때까지 반복
- Confidence Score Threshold가 높을수록, IoU Threshold가 낮을수록, 박스에 대한 중복 판단이 깐깐해지는 것
- Confidence Score Threshold와 IoU Threshold는 사용자 조절 = HyperParameter
IoU Threshold 값에 따라 Precision, Recall 변화
Average Precision (AP)
- Precision - Recall Curve 그래프 아래의 면적
mean Average Precision (mAP)
- 각 클래스 별 AP를 합산하여 평균을 낸 것
Annotation
- 이미지 내 Detection 정보를 별도의 설명 파일로 제공되는 것을 Annotation이라고 함
- Annotation은 Object의 Bounding Box 위치나 Object 이름 등을 특정 포맷으로 제공
roboflow : 컴퓨터 비전 커뮤니티
- 남의 데이터셋 가져다가 써보기
- 직접 데이터셋 구성하기
Object Detection에서의 CNN의 역할
- Feature Representation이란 ? 위치 정보를 보존하여 이미지를 훼손하지 않은 채로 feature representation
- box bounding regression에서 위치 정보 파악이 필요함
  - CNN 기반 모델을 Backbone으로 사용 + (Neck) + 우리 문제에 맞게 변형 (Head)

728x90

'공부 > DL' 카테고리의 다른 글

[LM] 언어지능 딥러닝 #1 TF-IDF, 비지도 학습, Word Embedding, 정보 검색, 추천 시스템 (0)	2024.04.15
[CV] 시각지능 딥러닝 #5 YOLO 실습 (0)	2024.04.08
[CV] 시각지능 딥러닝 #3 Transfer Learning 전이 학습 (0)	2024.04.03
[CV] 시각지능 딥러닝 #2 Image Data Augmentation 이미지 데이터 증강 (0)	2024.04.02
[CV] 시각지능 딥러닝 #1 CNN (Convolutional Neural Networks) (0)	2024.04.02

'공부/DL' Related Articles

블로그

[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지 본문

[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지

'공부 > DL' 카테고리의 다른 글

티스토리툴바