개발/(3) 머신러닝(ML), 딥러닝(DL) 7

[도서 추천] 데이터 분석 입문해보기

데이터 분석 입문해보기 서론 '멋쟁이 사자처럼 인공지능' 부츠캠프를 마치고 함께 수강한 동료들과 전자책을 집필했습니다. 과거의 저희처럼 데이터 초보자 입장에서 생각하고 집필했습니다. 때문에 이해하는 데 있어 더 쉬울 것이라고 생각합니다. 본론 목차는 데이터 직무와 분석을 소개하고 간단한 통계학과 데이터 분석에 사용하는 도구들을 소개합니다. 이후 데이터 수집은 어떻게 하는지 수집된 데이터는 어떻게 전처리 하는지 그 데이터들을 어떻게 시각화 하는지 데이터 분석은 어떻게 하는지에 대해 수록되어 있습니다. 결론 함께 고생한 동료분들 너무나도 감사합니다. 살면서 책 집필하는데 도움이 됐다는게 너무나도 큰 경험입니다. 앞으로도 다양한 공부와 경험을 토대로 좋은 지식을 나누어 갈 예정입니다. 다시 한번 감사드립니다!..

부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 2

부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 Object Detection Library MMDetection : Pytorch 기반의 Object Detection 오픈소스 라이브러리 Detectron2 : Facebook AI Research의 Pytorch 기반 라이브러리, Object Detection 외에도 Segmentation, Pose prediction 등 알고리즘도 제공 MMDetection Config file configs를 통해 데이터셋부터 모델, scheduler, optimizer 정의 가능 특히, configs에는 다양한 object detection 모델들의 config 파일들이 정의돼 있음 그 중, configs/base/ 폴더에 가장 기본이 되는 config 파일..

부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 1

부스트코스 재활용 쓰레기를 활용한 딥러닝 강의 정리 컴퓨터 비전의 태스크 종류 Classification : 사진이 주어졌을 때 무엇인지 예측하는 태스크 Object Detection : 이미지 속에서 객체를 식별해내는 태스크. 객체가 어디에 있는 지 찾고, 해당 객체가 무엇인지 식별하는 것 Semantic Segmentation : 객체의 영역을 구분하는 태스크, 같은 클래스를 갖는 객체끼리는 구분이 없음 Instance Segmentation : 객체의 영역을 구분하는 태스크, 같은 클래스의 객체 역시 구분함 Object Detection의 평가 지표 mAP (mean average precision): 각 클래스당 AP의 평균 mAP를 계산하기 위해 필요한 개념 Confusion matrix: Pr..

추천시스템 분석 입문하기 (T아카데미) 정리

추천시스템 분석 입문하기 (T아카데미) 정리 추천시스템의 이해 강의 목차 추천시스템이란? 사용자에게 상품을 제안하는 소프트웨어 도구이자 기술 어떤 사용자에게 어떤 상품을 어떻게 추천할지? 기업에서의 추천시스템 당근마켓 = 다른 사람들이 같이 본 상품을 추천 카카오 = 해당 글과 유사한 글들을 추천 추천시스템의 역사 (역사 순서에 따라 설명 진행) 연관분석 연관분석이란 룰기반의 모델, 상품과 상품 사이에 어떠한 연관이 있는지 찾아내는 알고리즘 얼마나(frequent) 같이 구매됐는가? A 라는 아이템을 구매한 사용자는 B 라는 아이템도 구매를 하는가? 연관분석의 규칙 평가 지표 support (지지도) 조건절 A에서 얼마나 구매할지의 확률 (단순히 선택된 것이라고 생각하자.) confidence (신뢰도)..

YOLO 공식문서 번역 및 학습

YOLO 공식문서 번역 및 학습 - 구글 번역기를 통한 정리라서 해석의 오류가 있을 수 있음 1. YOLO란 You Only Look Once의 줄임말 최첨단 실시간 객체 감지 시스템 COCO test-dev에서 57.9%의 mAP 성능을 보임 ! COCO test-dev 과 mAP 가 무엇이냐? COCO test-dev 이란? Common Object in COntext 큰 규모의 객체 탐색, 분류, 세분화 등의 data-set 객체 탐지 성능 테스트로 주로 사용한다고 함 mAP 란? mean Average Precision (평균 정확도들의 평균) CNN 모델을 평가시에 주로 사용 값이 높을수록 전체적인 알고리즘 성능이 우수하다고 판단(정확도, 검출률 등등) FPS 란? 초당 프레임, 1초당 몇 개의..

K-MOOC 파이썬 머신러닝 공부 2일차 오전

머신러닝의 기초와 용어 K-Nearest Neighbors 1. K는 임의의 숫자를 의미(Hyperparameter) 2. 두 관측치의 거리가 가까우면 Y도 비슷함 3. K 개의 주변 관측치의 Class에 대한 majority voting(다수결) 4. Distance-based model, instance-based learning 1) 거리가 가장 가까운 관측치 3개를 골라 봤더니 그림처럼 발생 2) 두 관측치 사이의 거리를 측정할 수 있는 방법 5. K의 영향 - K는 KNN에서 Hyperparameter를 의미 - K가 클수록 Underfitting, 작을수록 Overfitting (K가 적을 때는 설정값이 적기 때문에 자세하게 분해해서 학습을 하는 것이면, K가 크다면 설정값이 많아서 설정한대로..

K-MOOC 파이썬 머신러닝 공부 1일차

머신러닝의 기초와 용어 1. 머신러닝이란(개념) - 데이터를 컴퓨터를 통해 함수를 사용해서 스스로 학습시키고 예측을 하는 것을 의미 - 딥러닝도 머신러닝의 일종 - CPU와 GPU(그래픽카드, 병렬 계산) computing - Learning system의 구성 요소 ==> 환경(E, Enviroment), 데이터(D, data), 함수(M, model), 평가(P, Performance) - 평가 기준 : MSE(제곱 편차 평균) 2. 머신러닝 학습 개념 - Linear Regression : 선형 분석 (input과 out이 관계가 있다.) - MSE ==> 선형적인 관계이므로 ax = y 의 모양으로 발생 ==> 완벽히 그리는 것은 불가능에 가깝고, 오차가 적도록 만드는 것이 목표 ==> Learn..