목록Head/인공지능 (24)
Head vs breakz
https://arxiv.org/abs/1708.02002 Focal Loss for Dense Object Detection The highest accuracy object detectors to date are based on a two-stage approach popularized by R-CNN, where a classifier is applied to a sparse set of candidate object locations. In contrast, one-stage detectors that are applied over a regular, dense sampl arxiv.org Abstract two stage detection은 높은 정확도를 보여주며, one stage detect..
Gradient Clipping는 깊은 신경망에서 발생하는 gradient exploding를 막기 위해 사용한다. 깊은 신경망에서 역전파 과정에서 기울기가 점차 작아지거나 비 정상적으로 큰 값이 되면서 기울기에 대한 문제가 발생하는데, Gradient Clipping는 깊은 신경망에서 발생하는 gradient exploding를 줄이기 위해 사용한다. Gradient Clipping는 말 그대로, 기울기 값을 잘라내는 방법으로, 특정 임계값을 설정하여 그 값을 넘지 못하도록 잘라내는 방법이다. Tensorflow에서는 Optimizer의 compute_gradients 를 먼저 호출하고, 그 다음 clip_by_value() 함수를 사용하여 Clipping하는 연산을 생성한다. 그리고 apply_gra..
One shot learning with Siamese Networks using keras - Harshall lamba https://towardsdatascience.com/one-shot-learning-with-siamese-networks-using-keras-17f34e75bb3d 를 공부하기 위해 번역과 정리 하는 글입니다. Base Line 1 — Nearest Neighbor Model 간단한 baseline 모델을 만들고 그 결과를 만들려고하는 복잡한 모델과 비교하는 것이 좋다. 첫번째 기본 모델은 Nearest Neighbor model이다. 벡터 X와 다른 벡터들 간의 L2 distance를 비교하여, 거리가 가장 작은 벡터를 확인한다. 거리가 가까울수록 유사성이 높기 떄문에, 그..
One shot learning with Siamese Networks using keras - Harshall lamba https://towardsdatascience.com/one-shot-learning-with-siamese-networks-using-keras-17f34e75bb3d 를 공부하기 위해 번역과 정리 하는 글입니다. Model Architecture and Training 이 코드는 Gregory Koch et al. 의 research paper에 나와있는 방법론을 구현하였다. 모델의 구조와 하이퍼파라미터 값은 논문에 있는 값을 사용하였다. 구조를 먼저 들어다 본다면, Convolutional Neural Networks는 다른 네트워크가 아닌 동일한 네트워크이다. 매개 변수 값..