728x90
반응형
YOLO 공식문서 번역 및 학습
- 구글 번역기를 통한 정리라서 해석의 오류가 있을 수 있음
1. YOLO란
- You Only Look Once의 줄임말
- 최첨단 실시간 객체 감지 시스템
- COCO test-dev에서 57.9%의 mAP 성능을 보임
! COCO test-dev 과 mAP 가 무엇이냐?
- COCO test-dev 이란?
- Common Object in COntext
- 큰 규모의 객체 탐색, 분류, 세분화 등의 data-set
- 객체 탐지 성능 테스트로 주로 사용한다고 함
- mAP 란?
- mean Average Precision (평균 정확도들의 평균)
- CNN 모델을 평가시에 주로 사용
- 값이 높을수록 전체적인 알고리즘 성능이 우수하다고 판단(정확도, 검출률 등등)
- FPS 란?
- 초당 프레임, 1초당 몇 개의 프레임을 처리하는 지
- 60FPS는 1초에 60장의 프레임을 처리함을 의미
2. 다른 검출기와 비교
- Focal loss(RetinaNet)와 mAP는 비슷하지만 속도가 약 4배 더 빠름
- 모델의 크기를 변경하기만 하면 재교육 없이 속도와 정확도를 절충할 수 있음
3. COCO data-set 성능 비교
- CFG는 Control Flow Graph, 제어 흐름 그래프를 의미
- Weights는 가중치를 의미(기존 학습이라고 이해)
4. 작동 방식
- 이전 다른 detection 시스템은 classifier나 localizer를 변경해서 기능을 찾아가는 방법
- CNN은 슬라이딩 윈도우를 해서 하나의 객체를 찾을 때는 효과적, 하지만 2개 이상 객체는 어려움
- YOLO는 하나에 신경망에 전체 이미지를 적용
- 단일 단계 방식의 객체 탐지(이미지를 한 번만 보고 예측한다는 의미)
- 1) 이미지를 지역으로 나눔
2) 각 지역의 bounding box 가능성(확률, probabailities)을 예측
3) 도출된 확률에 의해 가중치 부여
5. 그래서 장점이?
- 속도가 매우 빠름 : R-CNN보다 1000배 이상, Fast R-CNN보다 100배 더 빠름
- 그 이유는 단일 단계 방식과 평가 기능이 있어 필요한 이미지 개수가 적음
6. 실전 연습 코드 (코랩) / YOLOv5
https://colab.research.google.com/drive/1UImtuMqBuMZMNynO9Nzct1Pl-YMdF3-M?usp=sharing
- 위 코랩을 따라가면서 실제로 사용해볼 수 있음
- 드라이브 사본 저장 후 사용하는 것을 추천
- 도움말에 맞춰 진행하면 수월함
출처 =
- https://www.youtube.com/watch?v=T0DO1C8uYP8 = 해당 유튜브 영상이 위 코랩을 만드는 데 가장 베이스 역할
- https://www.youtube.com/watch?v=kbMfgVZn05U&t=1s = YOLOv7 을 통해서 이미지, 동영상, 실시간 웹캠을 이용하는 방법을 알려주는 영상
- https://www.youtube.com/watch?v=fdWx3QV5n44 = 아래 영상은 YOLO를 글로만 이해하기 어렵다면 꼭 참고해서 보는 것을 추천
728x90
반응형
'개발 > (3) 머신러닝(ML), 딥러닝(DL)' 카테고리의 다른 글
부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 2 (0) | 2023.03.27 |
---|---|
부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 1 (0) | 2023.03.27 |
추천시스템 분석 입문하기 (T아카데미) 정리 (0) | 2023.02.15 |
K-MOOC 파이썬 머신러닝 공부 2일차 오전 (0) | 2022.11.22 |
K-MOOC 파이썬 머신러닝 공부 1일차 (0) | 2022.11.21 |