일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 파워셀
- 논문
- 딥러닝
- 프로그래머
- 호흡분석
- 게임개발
- C언어
- connx
- 설치
- ctypes
- 개발자
- python
- pyqt5
- Detectron2
- 언리얼엔진
- 파이썬
- NPY
- CycleGAN
- 이터널리턴
- 욜로
- ChatGPT
- TensorFlow
- 논문리뷰
- 텐서플로우
- yolo
- 리뷰
- 헬스케어
- 딜러닝
- V3
- 언어모델
- Today
- Total
목록딥러닝 (23)
사냥꾼의 IT 노트
이전 글: https://it-the-hunter.tistory.com/28 TensorFlow를 이용한 YOLO v1 논문 구현 #3 - loss.py 구현할 논문: https://arxiv.org/pdf/1506.02640v1.pdf loss.py 목표: YOLO v1의 loss function 구현 기본 로직: 사람이 예측한 bounding box와 YOLO 모델이 예측한 bounding box간의 차이를 계산 오차를 최소화.. it-the-hunter.tistory.com datasets.py 목표: 데이터 전처리 및 batch 단위로 묶는 로직 필요한 모듈 import import tensorflow as tf import numpy as np 상세 코드 #train.py에서 처리하는 데이터를 ..
You Only Look Once 기본 컨셉: 이미지를 S x S grid cell로 나누고, grid cell별로 B개의 bounding box를 예측 최종 output: S x S x (5 * B + C) (5 : x, y, w, h, confidence) (x, y, w, h, confidence) 각 인자들의 범위는 전부 0~1 x: grid cell내의 x의 위치 y: grid cell내의 y의 위치 w: 전체 이미지 대비의 width y: 전체 이미지 대비의 height confidence: 이미지 내에 오브젝트가 있다고 확신하는 정도 Non-Maximum Suppression (NMS) confidence =0.5라면, confidence가 작은 bounding box를 제거 제거되지 않은 ..
IOU? Intersection Over Union? Intersection Over Union은 object detection에서 성능 평가를 위해 사용되는 도구다. 정답 영역 및 예측 영역은 대부분 직사각형으로 설정한다. 정의는 아래 사진과 같다. 위 사진과 같이 정답 영역과 예측 영역이 직사각형의 형태로 존재하는데, 이 두 영역이 겹치는 부분이 많을수록 정확도가 올라가고 IOU의 값은 크다고 본다. 즉, IOU의 값이 클수록 "오브젝트 검출이 잘 되고 있다"라고 보는 것이다. IOU의 값 IOU의 최대값은 정답 영역과 예측 영역이 완전히 겹치는 정도이며, 값은 1이다. 반대로 정답 영역과 예측 영역이 완전히 겹치지 않는 정도가 최소값이며, 이 값은 0이다. IOU의 계산 방법 IOU를 계산하기 위해..
구현할 논문: https://arxiv.org/pdf/1506.02640v1.pdf loss.py 목표: YOLO v1의 loss function 구현 기본 로직: 사람이 예측한 bounding box와 YOLO 모델이 예측한 bounding box간의 차이를 계산 오차를 최소화하기 위해 루트 적용 grid cell별로 IOU 계산을 했을 때, 신뢰도가 높은 bounding box의 차이를 coordinate에 적용 필요한 module import import tensorflow as tf import numpy as np from utils import iou iou: 두 개의 bounding box의 iou 함수를 utils 에서 불러옴 각 인자 설명 ''' Args: predict: 3 - D te..
카메라에 비춰진 사물의 영역을 표시하고 인식된 사물이 무엇인가에 대해 알려주는 모델이 바로 YOLO이며, You Only Look Once의 약자이다. 현재 YOLO 모델은 버전이 5까지 나와있지만, 학술적으로는 4까지만 인정이 된다고 한다.. [Object Detection] 객체 검출은 영상처리 분야에서 기본적으로 많이 쓰이는 분야이다. 얼굴 인식, 음성 인식 같은 분야에서 자주 보인다. 개념적으로는 여러 사물을 '어떤 것이다'라고 분류하는 (Multi-Labeled) Classification과 그 사물이 어디 있는지 박스를 통해 위치 정보를 나타내는 localization 문제를 해결하는 부분이다. 원래는 CNN을 통해 위와 같은 문제를 해결할 수 있으나, 하나의 물체를 분류하고 다시 전체 이미지..