본문 바로가기

Deep Learning/2023 DL 기초 이론 공부

[Standford_cs231n] Lecture 4 ) Introduction to Neural Networks

by 제룽 2023. 7. 8.

728x90

4-1) Computational graphs

4-2) Backpropagation

4-3) Gradient for vectorized code

앞에서 한 내용들은 어떤 한 변수 값으로 Gradient을 계산

하지만 우리가 실제로 사용하는 입력값은 scaler 값 이 아닌 vector값

이러한 vector를 사용하기 위해서는 다변수 벡터 함수(vector-valued function of multiple variables) 에 대한 일차미분값이 필요

이를 Jacobian (야코비안) matrix 라고 함.

4-4) Neural Networks

Neural Networks(인공 신경망)은 앞에서 배운 Linear Classifier을 2개 이상 쌓아올리는 형태.

이 사이에 Non-linear function을 사용.⇒ 기존에는 선형 레이어 하나만 쌓아서 빨간색 자동차만 찾음⇒ 이러한 방법으로 레이어를 쌓아가면서 여러 특징을 추출할 수 있다는 것을 확인.
⇒ NN을 사용하면 빨간색, 노란색 자동차와 같이 여러 색을 찾을 수 있는 모델을 구축함.

이처럼 여러겹층의 선형 분류기로 구성된 Nerual Network 활성함수(자료에서는 sigmoid 예제)를 사용해 0과 1의 사이 값으로 분류해 score를 표현.

이외에도 아래과 같이 다양한 활성함수를 이용해 분류를 함

728x90

'Deep Learning > 2023 DL 기초 이론 공부' 카테고리의 다른 글

[Standford_cs231n] Lecture 2 ) Image Classification (0)	2023.07.08
[Standford_cs231n] Lecture 3 ) Loss Functions and Optimization (0)	2023.07.08
[Standford_cs231n] Lecture 5 ) Convolutional Neural Networks (0)	2023.07.07
[Standford_cs231n] Lecture 6 ) Training Neural Networks I (0)	2023.07.07
[Standford_cs231n] Lecture 7 ) Training Neural Networks II (0)	2023.07.07

티스토리툴바