반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 모델링
- 머신러닝
- pmf
- 언어지능딥러닝
- product
- nlp
- ERD
- DACON
- 시각화
- 데이터분석
- tableau
- 그로스해킹
- dl
- Market
- fit
- omtm
- productmarketfit
- 인공지능
- 데이터시각화
- 딥러닝
- OKR
- 태블로
- 파인튜닝
- 자연어처리
- 데이콘
- Computer Vision
- 데이터모델링
- 컴퓨터비전
Archives
- Today
- Total
블로그
[CV] 시각지능 딥러닝 #4 Object Detection 객체 탐지 본문
반응형
Object Detection
- 컴퓨터는 동영상을 프레임 단위로 인식함
- 물체 A가 오른쪽에서 왼쪽으로 이동하면 사람은 바로 인지할 수 있지만, 컴퓨터는 오른쪽 A와 왼쪽 A를 같은 것이라고 인지하지 못함 => 인식이 됐다가 안됐다가 함
- Localization : 단 하나의 Object 위치를 Bounding Box로 지정하여 찾음
- Object Detection : 여러 개의 Object들의 위치를 Bounding Box로 지정하여 찾음
- Bounding Box
- 하나의 Object가 포함된 최소 크기 박스
- 구성 요소 : x, y(좌표), w, h(크기) => 모두 합쳐서 위치 정보라고 할 수 있음
- Ground-truth Bounding Box : 정답 박스
- Prediction Bounding Box : 모델이 예측한 박스
- 구성 요소 : 예측값 (x햇, y햇, w햇, h햇)
- 모델이 Object가 있는 위치를 잘 예측 -> Regression으로 접근
- x와 x햇, y와 y햇이 비슷 : Bounding Box 꼭짓점 예측을 잘했다
- w와 w햇, h와 h햇이 비슷 : Bounding Box 크기 예측을 잘했다
- Object가 Bounding Box 안에 있다면 Classification으로 접근 가능
- Confidence Score : Object가 Bounding Box 안에 있는지에 대한 확신의 정도
- 0에 가까울수록 Object가 없다고 추측
- 1에 가까울수록 Object가 있다고 추측
- 모델마다 IoU 정의가 다름
- 단순히 Object가 있을 확률
- Object가 있을 확률 * IoU
- Object가 특정 클래스일 확률 * IoU
- IoU (Intersection over Union)
- 두 박스의 중복 영역 크기를 통해 측정 -> 겹치는 영역이 넓을수록 좋은 예측
- NMS (Non-Maximum Suppression)
- IoU가 일정 값 이상이면 같은 Object를 가리키는 것이라고 판단, 상대적으로 Confidence Score가 낮은 Bounding Box를 제거하는 것
- 일정 Confidence Score 이하의 Bounding Box 제거
- 남은 Bounding Box들을 Confidence Score 내림차순으로정렬
- 첫 Bounding Box(Confidence Score가 가장 높은!)와의 IoU 값이 일정 이상인 박스들을 제거
- Bounding Box가 하나 될 때까지 반복
- Confidence Score Threshold가 높을수록, IoU Threshold가 낮을수록, 박스에 대한 중복 판단이 깐깐해지는 것
- Confidence Score Threshold와 IoU Threshold는 사용자 조절 = HyperParameter
- IoU가 일정 값 이상이면 같은 Object를 가리키는 것이라고 판단, 상대적으로 Confidence Score가 낮은 Bounding Box를 제거하는 것
- IoU Threshold 값에 따라 Precision, Recall 변화
- Average Precision (AP)
- Precision - Recall Curve 그래프 아래의 면적
- mean Average Precision (mAP)
- 각 클래스 별 AP를 합산하여 평균을 낸 것
- Annotation
- 이미지 내 Detection 정보를 별도의 설명 파일로 제공되는 것을 Annotation이라고 함
- Annotation은 Object의 Bounding Box 위치나 Object 이름 등을 특정 포맷으로 제공
- roboflow : 컴퓨터 비전 커뮤니티
- 남의 데이터셋 가져다가 써보기
- 직접 데이터셋 구성하기
- Object Detection에서의 CNN의 역할
- Feature Representation이란 ? 위치 정보를 보존하여 이미지를 훼손하지 않은 채로 feature representation
- box bounding regression에서 위치 정보 파악이 필요함
- CNN 기반 모델을 Backbone으로 사용 + (Neck) + 우리 문제에 맞게 변형 (Head)
728x90
반응형
'공부 > DL' 카테고리의 다른 글
[LM] 언어지능 딥러닝 #1 TF-IDF, 비지도 학습, Word Embedding, 정보 검색, 추천 시스템 (0) | 2024.04.15 |
---|---|
[CV] 시각지능 딥러닝 #5 YOLO 실습 (0) | 2024.04.08 |
[CV] 시각지능 딥러닝 #3 Transfer Learning 전이 학습 (0) | 2024.04.03 |
[CV] 시각지능 딥러닝 #2 Image Data Augmentation 이미지 데이터 증강 (0) | 2024.04.02 |
[CV] 시각지능 딥러닝 #1 CNN (Convolutional Neural Networks) (0) | 2024.04.02 |