YOLO 공식문서 번역 및 학습
YOLO 공식문서 번역 및 학습
- 구글 번역기를 통한 정리라서 해석의 오류가 있을 수 있음
1. YOLO란
- You Only Look Once의 줄임말
- 최첨단 실시간 객체 감지 시스템
- COCO test-dev에서 57.9%의 mAP 성능을 보임
! COCO test-dev 과 mAP 가 무엇이냐?
- COCO test-dev 이란?
- Common Object in COntext
- 큰 규모의 객체 탐색, 분류, 세분화 등의 data-set
- 객체 탐지 성능 테스트로 주로 사용한다고 함
- mAP 란?
- mean Average Precision (평균 정확도들의 평균)
- CNN 모델을 평가시에 주로 사용
- 값이 높을수록 전체적인 알고리즘 성능이 우수하다고 판단(정확도, 검출률 등등)
- FPS 란?
- 초당 프레임, 1초당 몇 개의 프레임을 처리하는 지
- 60FPS는 1초에 60장의 프레임을 처리함을 의미
2. 다른 검출기와 비교
- Focal loss(RetinaNet)와 mAP는 비슷하지만 속도가 약 4배 더 빠름
- 모델의 크기를 변경하기만 하면 재교육 없이 속도와 정확도를 절충할 수 있음
3. COCO data-set 성능 비교
- CFG는 Control Flow Graph, 제어 흐름 그래프를 의미
- Weights는 가중치를 의미(기존 학습이라고 이해)
4. 작동 방식
- 이전 다른 detection 시스템은 classifier나 localizer를 변경해서 기능을 찾아가는 방법
- CNN은 슬라이딩 윈도우를 해서 하나의 객체를 찾을 때는 효과적, 하지만 2개 이상 객체는 어려움
- YOLO는 하나에 신경망에 전체 이미지를 적용
- 단일 단계 방식의 객체 탐지(이미지를 한 번만 보고 예측한다는 의미)
- 1) 이미지를 지역으로 나눔
2) 각 지역의 bounding box 가능성(확률, probabailities)을 예측
3) 도출된 확률에 의해 가중치 부여
5. 그래서 장점이?
- 속도가 매우 빠름 : R-CNN보다 1000배 이상, Fast R-CNN보다 100배 더 빠름
- 그 이유는 단일 단계 방식과 평가 기능이 있어 필요한 이미지 개수가 적음
6. 실전 연습 코드 (코랩) / YOLOv5
https://colab.research.google.com/drive/1UImtuMqBuMZMNynO9Nzct1Pl-YMdF3-M?usp=sharing
YOLOv5_training_Wook.ipynb
Colaboratory notebook
colab.research.google.com
- 위 코랩을 따라가면서 실제로 사용해볼 수 있음
- 드라이브 사본 저장 후 사용하는 것을 추천
- 도움말에 맞춰 진행하면 수월함
출처 =
GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite
YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite. Contribute to ultralytics/yolov5 development by creating an account on GitHub.
github.com
Computer Vision Datasets
Download free, open source datasets for computer vision machine learning models in a variety of formats.
public.roboflow.com
[YOLO] Darknet 공식문서 번역
무언가 프로젝트를 시작하기 전에 꼭 해야하는게 있다. 바로 기초 스터디..! 여기를 잘 하지 않고 일단 얼레벌레 넘어가서 시작부터 하면 언젠간은 꼬인 곳을 풀어내지 못해 다시 처음으로 돌아
iagreebut.tistory.com
mAP(Mean Average Precision) 정리
☞ 문서의 내용은 가장 하단 참고문헌 및 사이트를 참고하여 필자가 보기 쉽도록 정리한 내용입니다. ☞ 틀린 내용 및 저작권 관련 문의가 있는 경우 문의하시면 수정 및 삭제 조치하겠습니다. m
ctkim.tistory.com
제어 흐름 그래프 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. CFG 예시: (a) if-then-else (b) while loop (c) 자연적인 루프 두개 (예를 들면 중앙의 while과 an if...break; 구조화되지 않았지만, 축소 가능한 (d) 축소 불가능한 CFG: 2개의 엔
ko.wikipedia.org
[AI/딥러닝] 객체 검출(Object Detection) 모델의 종류 R-CNN, YOLO, SSD
지금까지 딥러닝의 모델과 그 중에서 CNN의 세부 모델까지 알아보았습니다. 2021.07.10 - [SW programming/Computer Vision] - AI, 머신러닝, 딥러닝 이란? 그리고 딥러닝 모델 종류 2021.07.11 - [SW programming/Computer
rubber-tree.tistory.com
- https://www.youtube.com/watch?v=T0DO1C8uYP8 = 해당 유튜브 영상이 위 코랩을 만드는 데 가장 베이스 역할
- https://www.youtube.com/watch?v=kbMfgVZn05U&t=1s = YOLOv7 을 통해서 이미지, 동영상, 실시간 웹캠을 이용하는 방법을 알려주는 영상
- https://www.youtube.com/watch?v=fdWx3QV5n44 = 아래 영상은 YOLO를 글로만 이해하기 어렵다면 꼭 참고해서 보는 것을 추천