๋ ์ง: 2023๋ 7์ 15์ผ
Part 1. Introduction to Deep Neural Networks
1. Deep Learning
: ์ ๊ฒฝ์ธํฌ๋ค์ด ๋ง์ ์ด๋ฃจ์ด์ ์ ๋ณด๋ฅผ ๊ตํํ๊ณ ์ฒ๋ฆฌํ๋ ๊ณผ์ ์ ๋ณธ๋ฐ์ ๋ง๋ ๋ฐฉ์์ ์๋ฏธํจ
2. ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๊ธฐ๋ณธ ๋์ ๊ณผ์
- Big Data์ ํ์
- GPU Acceleration
- Algorithm Improvements
3. Perceptron
- ํผ์ ํธ๋ก ์ ์๋ฌผํ์ ์ธ ์ ๊ฒฝ๊ณ(Neual Network)์ ๊ธฐ๋ณธ ๋จ์์ธ ์ ๊ฒฝ์ธํฌ(=๋ด๋ฐ)์ ๋์ ๊ณผ์ ์ ํต๊ณํ์ ์ผ๋ก ๋ชจ๋ธ๋งํ ์๊ณ ๋ฆฌ์ฆ
4. Forward Propagation
- ํ๋ ฌ ๊ณฑ์ ํตํด sigmoid function๊ณผ ๊ฐ์ actiavtion function์ ์ง๋๋ฉด ๊ฒฐ๊ณผ ๊ฐ์ด ๋์ด
5. MSE
- ์๋ฌ ์ ๊ณฑ์ ํ๊ท
- ์ด์์น์ ๋ฏผ๊ฐ
6. Softmax ํจ์
Part 2. Training Neural Networks
1. Gradient descent
- Neural network์์ ์ ํฌ๊ฐ ์ต์ ํ ํ๊ณ ์ ํ๋ parameter์ด ์กด์ฌ
- parameter๊ณผ ํ์ต data๋ฅผ ํด๋น parameter๋ค๋ก ์ด๋ฃจ์ด์ง neural network์ ์ ๋ ฅ์ผ๋ก ๋ฃ์ด ground truth ๊ฐ๊ณผ ๋น๊ตํจ์ผ๋ก์จ ์ฐจ์ด๋ฅผ ์ต์ํํ๋๋ก ํ๋ ํ๋ผ๋ฏธํฐ๋ค์ ์ฐพ๋ ๊ฒ
- loss function์ ๋ํด ๊ฐ๊ฐ ํ๋ผ๋ฏธํฐ๋ค์ ๋ํ ๋ฏธ๋ถ๊ฐ์ ๊ตฌํจ
- ๋ฏธ๋ถ ๊ฐ์ ์ฌ์ฉํด์ ํ์ฌ ์ฃผ์ด์ง parameter ๊ฐ์ ๊ฐ์ง๊ณ ๋ฏธ๋ถ ๋ฐฉํฅ์ ๋ง์ด๋์ค ๋ฐฉํฅ์ผ๋ก ํน์ step size ํน์ learning rate๋ฅผ ๊ณฑํด์ ํด๋น ํ๋ผ๋ฏธํฐ๋ค์ ์ ๋ฐ์ดํธ ํ๋ ์์ผ๋ก ํ์ต์ ์งํ
- w๋ผ๋ ์ต์ ํํ๊ณ ์ ํ๋ ํ๋ผ๋ฏธํฐ๊ฐ ํจ์์ ์ ๋ ฅ๋๊ณ , loss๊ฐ ๊ฒฐ๊ตญ ์์์ง๋ ์ชฝ์ผ๋ก ์ด๋ํ๊ฒ ๋จ
- 1์ฐจ์์ ํจ์๋ฅผ ์ ๋ ๊ฒ ๋ฑ๊ณ ์ ์ผ๋ก ํ์ํ๋ฉด ์ ๋ ๊ฒ ํํ๋จ
- ์ง๊ทธ์ฌ๊ทธ ํ์์ ์ผ๋ถ ์์ค ํจ์์์ ๊ฒฝ์ฌํ๊ฐ๋ฒ์ด ์๋ ดํ์ง ์๊ณ , ํ๋ผ๋ฏธํฐ ๊ฐ์ด ๋งค๋ฒ ํ๊ฒจ ๋๊ฐ๋ ํ์์ ๋งํ๋ค๊ณ .
- ์ธํ1๊ณผ, ์ธํ2๋ neural network์ ๊ฐ์ค์น ๊ฐ๋ค์
- ์ธํ 1์ ๋ํ ํจ์๋ฅผ ๊ทธ๋ ธ์ ๋์๋, ์๋งํ๊ฒ ์ค์ด๋ค์ง๋ง ์ธํ2์ ๋ํ ํจ์๋ฅผ ๊ทธ๋ฆฌ๊ฒ ๋๋ฉด ๊ธ๊ฒฉํ๊ฒ ํจ์๊ฐ ์ค์ด๋ค๊ฒ๋จ
- ๊ทธ๋์ ์ง๊ทธ์ฌ๊ทธ๋ก ์ด๋ํ๋ ๊ฒ์
- ๋ง์ฝ ์ง๊ทธ์ฌ๊ทธ ํ์์ด ์ ๋ค๋ฉด, ๋ ๊ฐ์ ํ๋ผ๋ฏธํฐ์ ๋ํ ํจ์์ ๊ธฐ์ธ๊ธฐ ๋ณ๋์ด ์๋์ ์ผ๋ก ์ผ์ ํ๊ฑฐ๋ ๋ถ๋๋ฝ๊ฒ ๋ณํ๋ ๊ฒ์ ์๋ฏธ. ์ด ๊ฒฝ์ฐ, ๋ ํจ์๋ ๋น์ทํ ํํ๋ฅผ ๊ฐ์ง๋ฉฐ ํ๋ผ๋ฏธํฐ์ ๋ณํ์ ๋ฐ๋ฅธ ์์ค ํจ์ ๊ฐ์ ๋ณํ๋ ๋น์ทํ๊ฒ ๋ ์ ์์
2. ์ญ์ ํ
- ์๋ต
3. Sigmoid Activation
- sigmoid activation
: ์์ชฝ์ ์๋ ํ๋ผ๋ฏธํฐ๋ค์ ๊ธฐ์ธ๊ธฐ ๊ฐ์ด ์์์ผ๋ก ์ธํด ํ๋ผ๋ฏธํฐ์ ์ ๋ฐ์ดํธ๊ฐ ๊ฑฐ์ ์ผ์ด๋์ง ์๊ฒ ๋จ -> ํ์ต์ด ๋๋ ค์ง
- Tanh activation
: -1 ~ 1์ฌ์ด
: gradient๊ฐ์ด 0์์ 1/2๊น์ง ๋ฐ์ ๋์ง ์์ -> ๊ฒฐ๊ตญ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฐ์
- ReLU activation
: max(0,x)
: 0๋ณด๋ค ์์ ๊ฒฝ์ฐ 0์ผ๋ก, 0๋ณด๋ค ํฐ ๊ฒฝ์ฐ ๊ฐ ๊ทธ๋๋ก
4. Batch Normalization
batch normalization์ ํ๋ ์ด์
Batch Normalization์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์์ ์ฌ์ฉ๋๋ ๊ธฐ๋ฒ ์ค ํ๋๋ก, ๊ฐ ๋ฏธ๋๋ฐฐ์น ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ๊ทํ(normalize)ํ์ฌ ํ์ต์ ์์ ํ์ํค๋ ์ญํ ์ ํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ์ต ๊ณผ์ ์ ๋ ๋น ๋ฅด๊ณ ์์ ์ ์ผ๋ก ๋ง๋ค๊ณ , ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
Batch Normalization์ ์ฌ์ฉํ๋ ์ฃผ์ํ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
1. ๊ทธ๋๋์ธํธ ์์ค ๋๋ ํญ์ฃผ ๋ฌธ์ ์ํ: ๋ฅ๋ฌ๋ ๋ชจ๋ธ์์๋ ์ฌ๋ฌ ์ธต์ ๊ฑฐ์น๋ฉด์ ๊ทธ๋๋์ธํธ ๊ฐ์ด ์ง๋์น๊ฒ ์์์ง๊ฑฐ๋ ํฌ๊ฒ ์ฆ๊ฐํ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์์ต๋๋ค. Batch Normalization์ ๊ฐ ๋ฏธ๋๋ฐฐ์น ๋ฐ์ดํฐ์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ์ ๊ทํํ์ฌ ๊ทธ๋๋์ธํธ์ ํฌ๊ธฐ๋ฅผ ์กฐ์ ํ๊ณ , ์ด๋ฅผ ํตํด ๊ทธ๋๋์ธํธ ์์ค๊ณผ ํญ์ฃผ ๋ฌธ์ ๋ฅผ ์ํํ ์ ์์ต๋๋ค.
2. ํ์ต ์๋ ํฅ์: Batch Normalization์ ๊ฐ ๋ฏธ๋๋ฐฐ์น ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ๊ทํํ๊ธฐ ๋๋ฌธ์ ํ์ต ๊ณผ์ ์์ ๋ ์์ ์ ์ธ ๊ทธ๋๋์ธํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ด๋ก ์ธํด ํ์ต ์๋๊ฐ ํฅ์๋๊ณ , ์๋ ดํ๋๋ฐ ๊ฑธ๋ฆฌ๋ ์๊ฐ์ด ์ค์ด๋ค ์ ์์ต๋๋ค.
3. ์ด๊ธฐํ์ ๋ ๋ฏผ๊ฐ: Batch Normalization์ ์
๋ ฅ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ๊ทํํ๊ธฐ ๋๋ฌธ์ ์ด๊ธฐ ๊ฐ์ค์น ์ค์ ์ ๋ํ ์ํฅ์ ์ค์ผ ์ ์์ต๋๋ค. ์ด๋ ๋ชจ๋ธ์ ํ์ต์ ์์ ํ์ํค๊ณ ์ด๊ธฐํ์ ๋ํ ์์กด์ฑ์ ๊ฐ์์ํต๋๋ค.
4. ์ผ๋ฐํ ๋ฅ๋ ฅ ํฅ์: Batch Normalization์ ๊ฐ ์ธต๋ง๋ค ์
๋ ฅ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ๊ทํํ๋ฏ๋ก, ๋ชจ๋ธ์ด ๋ ์ผ๋ฐํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค. ์ด๋ ๊ณผ์ ํฉ์ ๋ฐฉ์งํ๊ณ , ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
Batch Normalization์ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ธต ์ ๊ฒฝ๋ง์์ ์ฌ์ฉ๋๋ฉฐ, ํ์ต ๊ณผ์ ์ ์์ ํ์ํค๊ณ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐ์ ํฐ ๋์์ ์ค๋๋ค.
- mini batch๊ฐ 10์ผ ๊ฒฝ์ฐ, tanh ๋ ธ๋๋ฅผ ํต๊ณผํ๊ธฐ ์ง์ ์ ์ ๋ ฅ์ผ๋ก ๋ฐ์๋๋ ๊ฐ์ด 10๊ฐ์ mini batch ๋ด์ data item๋ง๋ค ํ๋์ฉ ๋ค ์กด์ฌ
- ๋ฐ์๋๋ 10๊ฐ์ tanh ์ ๋ ฅ์ผ๋ก ์ฃผ์ด์ง๋ ๊ฐ๋ค์ ๋ชจ์์ ํ๊ท ๋ถ์ฐ์ ๊ตฌํ ๊ฒ์
-> ํ๊ท 0, ๋ถ์ฐ1์ด ๋๋๋ก ํ๋ ์ ๊ทํ ๊ณผ์ ์ ์ํํ๊ฒ ๋๋ฉด tanh ์ ๋ ฅ์ผ๋ก ์ฃผ์ด์ง๋ ๋๋ต์ ์ธ ๋ฒ์๋ฅผ 0์ ์ค์ฌ์ผ๋ก ํ๋ ๋ถํฌ๋ฅผ ๋ง๋ค ์ ์๊ฒ ๋จ
- y=ax+b => ํด๋น data๊ฐ ๊ฐ์ง๋ ๊ณ ์ ์ ํ๊ท ๊ณผ ๋ถ์ฐ ๋ํ ๋ณต์ํด๋ผ ์ ์๋ ๋ฅ๋ ฅ์ด ๋ถ์ฌ๋จ
: ์ด๊ฐ ๊ฐ์ ํ๊ท ๊ฐ์ ์ฌ๊ธฐ์ ๊ฒฐ์ ๋ b๋ผ๋ ๊ฐ์ผ๋ก ํ๊ท ๊ฐ์ด ๋ฐ๋๊ฒ ๋จ
: ๋ถ์ฐ์ ๊ฒฝ์ฐ, a์ ๊ณฑ์ ํด๋นํ๋ ๋ถ์ฐ๊ฐ์ ๊ฐ์ง๊ฒ ๋จ
- ์ดํ, ์ ํ๋๋ฅผ ๋ ์์ฑํจ์ผ๋ก์จ, ์ต์ ์ ํ๊ท ๋ถ์ฐ ๊ฐ์ ์ค์ค๋ก ๊ฒฐ์ ํ ์ ์๋๋ก ํจ
Part 3. Convolutional Neural Networksand Image Classification
- ConvNet์ด ๋์จ ์ดํ๋ก ๋ถํฐ ๋ง์ด ๋ฐ์ ํ๊ฒ ๋จ
- ํน์ class์ ์กด์ฌํ ์ ์๋ ์์ ํน์ ํจํด๋ค์ ์ ์ํ๊ณ , ํจํด๋ค์ด ์ฃผ์ด์ง ์ด๋ฏธ์ง ์์ ์๋์ง๋ฅผ ํ๋จ
- ๊ฐ layer์์ ์ ๋ ฅ ๋ ธ๋๊ฐ ์ถ๋ ฅ ๋ ธ๋ ๋ชจ๋์ ํน์ ํ ๊ฐ์ค์น์ ํํ๋ก ์ฐ๊ฒฐ์ด ๋ network๋ฅผ fully-connected layer ํน์ fully connected neural network๋ผ๊ณ ๋ถ๋ฆ
- CNN: Computer vision์์ ์ฌ์ฉ (์ด๋ฏธ์ง ๋ฑ)
- RNN: ์๊ณ์ด ๋ฐ์ดํฐ์ ์ ํฉํ ๋ชจ๋ธ
1. Basic Idea of ConvNets
- ๊ณ ์์ด๊ฐ ์ด๋ฐ ์์ธ๋ฅผ ์ทจํ๊ณ ์ด๋ฐ ์๊น์ ๊ฐ์ง๊ณ , ์ด๋ฐ ๋ฐฐ๊ฒฝ์ด ์์์ ๋์ ๋ชจ๋ ์์๋ค์ ์ผ์ผ์ด ๊ท์ ํด์ ๊ณ ์์ด๋ผ๋ ํน์ฑ์ ์ ์ํ๋ ค๊ณ ํ๊ธฐ ๋ณด๋ค๋ ๊ณ ์์ด์์ ์ผ๊ด๋๊ฒ ๋ํ๋๋ ๋ถ๋ถ, ๋ถ๋ถ ๋ณ๋ก์ ํน์ง๋ค์ bottom up ๋ฐฉ์์ผ๋ก ์ ๊ฒ์ถํด๋ด๊ณ , ์ ๋ณด๋ค์ ์กฐํฉํด์ ์ต์ข ์ ์ผ๋ก ๊ณ ์์ด๋ค ๋ผ๊ณ ์ผ๊ด๋๊ฒ ์ธ์ํ ์ ์๋๋ก ํ๋ ๋ฐฉ์์ผ๋ก Convnet์ด ๋์ํจ
2. Conv layer
- ๋ค์ layer๋ก ์ ์ฉ๋๋ conv filter๋ ์ฌ๊ธฐ์ ์ฃผ์ด์ง ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ฑ๋ ์์ ๊ฐ์ ์ฑ๋ ์๋ฅผ ๊ฐ์ ธ์ผ ํจ
- ์ต์ข ์ ์ผ๋ก ํ ์ฅ์ output activation map์ ์ป๊ฒ ๋จ
3. Pooling
- ์ ํด์ง ํฌ๊ธฐ ์์์ ๊ฐ์ฅ ํฐ ๊ฐ๋ง ๋ฝ์๋
4. ReLU
- ์ ํ๊ฒฐํฉ ํ ํ, activation function์ ์ ์ฉํด์ค
- ์ด์ conv layer์์ ๋์จ ๊ฐ์ ์ ์ฉํ๋ฉด ์์๋ 0, ์์๋ ์์ ๊ทธ๋๋ ์ ์ฉํจ
5. Various CNN Architectures
- AlexNet
- VGGNet
- GoogLeNet
- ResNet
Part 4. Seq2Seq with Attention for Natural Language Understanding and Generation
1. RNN
- sequence data์ ์ ์ฉ
- hidden state๋ฅผ ๋ฐ์์ ํ์ฌ time step์ RNN module์ output์ธ ht ํน์ current hidden state vector์ ๋ง๋ค์ด์ฃผ๊ฒ ๋จ
2. RNN์ ๋ค์ํ ํํ
- one to one
- one to many: image captioning(์ด๋ฏธ์ง ๋ฃ์ผ๋ฉด ๋จ์ด๋ก ์ถ๋ ฅ)
- many to one (๋ฌธ์ฅ ๋ถ๋ฅ)
- many to many(๊ธฐ๊ณ ๋ฒ์ญ)
3. LSTM
- cell state๊ฐ ์๋ก ์๊น
4. seq2seq
- Seq2Seq๋ "Sequence-to-Sequence"์ ์ฝ์ด๋ก, ์ ๋ ฅ ์ํ์ค์ ์ถ๋ ฅ ์ํ์ค๋ฅผ ๋ชจ๋ ์ฒ๋ฆฌํ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๊ตฌ์กฐ.
์ฃผ๋ก ์์ฐ์ด ์ฒ๋ฆฌ(Natural Language Processing)์์ ์ฌ์ฉ๋๋ฉฐ, ๋ฒ์ญ, ์์ฝ, ์ฑ๋ด ๋ฑ ๋ค์ํ ์์
์ ์ ์ฉ.
- Seq2Seq ๋ชจ๋ธ์ ๋ ๊ฐ์ ์ฃผ์ ๊ตฌ์ฑ ์์๋ก ์ด๋ฃจ์ด์ ธ ์์.
์ฒซ ๋ฒ์งธ๋ ์ธ์ฝ๋(Encoder)๋ก ์ ๋ ฅ ์ํ์ค๋ฅผ ๊ณ ์ ๋ ๊ธธ์ด์ ๋ฒกํฐ ํํ์ผ๋ก ์์ถํจ. ์ด ๋ฒกํฐ๋ ์ ๋ ฅ ์ํ์ค์ ์๋ฏธ๋ฅผ ๋ด๊ณ ์์
๋ ๋ฒ์งธ๋ ๋์ฝ๋(Decoder)๋ก ์ธ์ฝ๋์ ๋ฒกํฐ ํํ์ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ ฅ ์ํ์ค๋ฅผ ์์ฑํจ. ๋์ฝ๋๋ ์์ ํ ํฐ์ ์
๋ ฅ์ผ๋ก ๋ฐ์ ์์ฐจ์ ์ผ๋ก ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋ฉด์ ์ถ๋ ฅ ์ํ์ค๋ฅผ ์์ฑ.
- Seq2Seq ๋ชจ๋ธ์ ์
๋ ฅ๊ณผ ์ถ๋ ฅ ์ํ์ค์ ๊ธธ์ด๊ฐ ๋ค๋ฅผ ์ ์์ผ๋ฉฐ, ์
๋ ฅ๊ณผ ์ถ๋ ฅ์ ์ํ์ค ๊ธธ์ด์ ์๊ด์์ด ์ ์ฐํ๊ฒ ์์
์ ์ํํ ์ ์์. ์ด๋ฅผ ํตํด ๋ฒ์ญ์ด๋ ์ฑ๋ด๊ณผ ๊ฐ์ ์์
์์ ๋ฌธ์ฅ ๊ธธ์ด์ ๋ณํ์ ๋์ํ ์ ์์.
- Seq2Seq ๋ชจ๋ธ์ ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด LSTM(Long Short-Term Memory)๊ณผ ๊ฐ์ ์ํ ์ ๊ฒฝ๋ง(RNN) ์ํคํ
์ฒ๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์. LSTM์ ์
๋ ฅ ์ํ์ค์ ์ฅ๊ธฐ ์์กด์ฑ์ ์บก์ฒํ์ฌ ๋ฒ์ญ์ด๋ ๋ค๋ฅธ ์ํ์ค ์์ฑ ์์
์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค.
- ์์ฝํ์๋ฉด, Seq2Seq๋ ์
๋ ฅ ์ํ์ค๋ฅผ ์์ถํ๋ ์ธ์ฝ๋์ ์์ถ๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ถ๋ ฅ ์ํ์ค๋ฅผ ์์ฑํ๋ ๋์ฝ๋๋ก ๊ตฌ์ฑ๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ๊ตฌ์กฐ์.
5. Attention
- ์๋ต
Part 5. Transformer
- Transformer
- ์๋ต
Part 6. Self-Supervised Learning andLarge-Scale Pre-Trained Models
- Bert
- GPT
-> ์๋ต
- One-shot, Few-shot learning์ ๋ชจ๋ธ์ ํ์ตํ๋๋ฐ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์์ ๋ํ๋ -> ์ด๋ฏธ์ง ์ธ์, ์์ฐ์ด ์ฒ๋ฆฌ, ๊ฒ์ ๋ฑ์ ๋ถ์ผ์์ ์ฌ์ฉ๋จ
2. One Shot
- ํ๋์ ์์๋ง์ผ๋ก์ผ๋ก ์๋ก์ด ํด๋์ค๋ฅผ ์ธ์ํ๋ ๊ฒ์ ์๋ฏธํจ
ex) ์์ญ์ด์ ์ฌ์ง์ ๊ฐ๋ฅด์ณ์ฃผ๋ฉด ๋ค๋ฅธ ๋ชจ์์ ์์ญ์ด์ฌ์ง์ ๋ณด์ฌ์ฃผ์ด๋ ์์ญ์ด๋ผ๊ณ ๋ง์ถ์๊ฐ ์๋ค
"The animal was a zebra. It had black and white stripes. What is the name of this animal?"๋ผ๋ ๋ฌธ์ฅ์์ "zebra"๋ผ๋ ๋จ์ด๋ฅผ ๋ชจ๋ธ์ด ํ ๋ฒ์ ์์๋ก ์ถ๋ก ํ๋ ๊ฒ์ ์๋ฏธ
3. Few Shot
- ํ ํด๋์ค ๋น ์ผ๋ถ ์ํ ์ด๋ฏธ์ง๋ง ์ฌ์ฉํด์ ์๋ก์ด ํด๋์ค๋ฅผ ์ธ์
- ๋ช ๊ฐ์ ์์๋ฅผ ํตํด ์๋ก์ด ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ
- ๋ชจ๋ธ์ ์ด์ ์ ๋ณธ ์ ์ด ์๋ ๋จ์ด์ ๋ํด ํ์ต๋์ด ์์ง ์์ง๋ง, ์ ํ๋ ์์ ์์๋ฅผ ํตํด ํด๋น ๋จ์ด์ ์๋ฏธ๋ฅผ ํ์ ํ๊ณ ์์ธกํ ์ ์์
ex) ์ฌ๋ฌ ์ข ๋ฅ์ ๊ฐ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉด์ ๊ฐ๋ฅด์ณ์ฃผ๊ณ , ์๋ก์ด ์ข ์ ๊ฐ๋ฅผ ๋ณด์ฌ์ฃผ๋ฉด ๊ฐ๋ผ๋ ๊ฒ์ ๋ง์ถ ์ ์๋ ๊ฒ
-> ์ ์ฒด ๋ฐ์ดํฐ ์ ํ์ตํ๋ ๊ฒ๋ณด๋ค๋ ํจ์จ์ ์.
ex) "The animal was a zebra. It had black and white stripes. It was similar to a horse. What is the name of this animal?"๋ผ๋ ๋ฌธ์ฅ์์ "zebra"๋ผ๋ ๋จ์ด๋ฅผ ๋ชจ๋ธ์ด ๋ช ๊ฐ์ ์์๋ก ์ถ๋ก ํ๋ ๊ฒ์ ์๋ฏธ
1. Zero Shot
- ๋ผ๋ฒจ๋ง ๋์ง ์์ ์๋ก์ด ํด๋์ค์ ๋ํ ๋ถ๋ฅ ์์ ์ ์ํํ ๋, ์ด์ ์ ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํด์ ๋ถ๋ฅํ๋ ๊ธฐ์
- ๋ชจ๋ธ์ด ์ด์ ์ ๋ณธ ์ ์ด ์๋ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ์ ๋งํจ.
- ์ด ๋ฐฉ๋ฒ์ ๋ชจ๋ธ์ด ํ๋ จ ๊ณผ์ ์์ ํด๋น ๋จ์ด์ ๋ํ ์ด๋ ํ ์ ๋ณด๋ ๋ฐ์ง ์์์์๋ ๋ถ๊ตฌํ๊ณ , ๋ฌธ๋งฅ๊ณผ ์ง์์ ํ์ฉํ์ฌ ๋จ์ด๋ฅผ ์ถ๋ก ํ๋ ค๋ ๊ฒ์ ์๋ฏธํจ
ex) ์์ด์๊ฒ ์์ ๋ง์ ๊ฐ๋ฅด์ณ์ฃผ๊ณ , ์ผ๋ฃฉ๋ง์ ๊ฐ๋ฅด์ณ์ค ๋๋ฌผ๋ค์ ํน์ง์ ํฉ์ณ๋ ๊ฒ์ด๋ผ๊ณ ์ค๋ช ์ ํด์ค๋ค. ๊ทธ๋ฌ๋ฉด ์์ด๋ ์ผ๋ฃฉ๋ง์ ๋ณธ์ ์ ์์ง๋ง ์ผ๋ฃฉ๋ง์ด๋ผ๊ณ ๋ง์ถ ์๊ฐ ์๋ ๊ฒ์ด๋ค
The animal was a zebra. It had black and white stripes. It was similar to a horse. What is another animal that has spots?"๋ผ๋ ๋ฌธ์ฅ์์ "spots"๋ผ๋ ๋จ์ด๋ฅผ ๋ชจ๋ธ์ด ์ถ๋ก ํ๋ ๊ฒ์ ์๋ฏธ
ex) ์ฒ์ ๋ณด๋ ๋จ์ด๊ฐ ๋์์ ๋, ์ด ๋จ์ด์ ๋ฒ์ญ ver์ ์๋ ค์ค
'๋์ธํ๋ > 2023 LG Aimers 3๊ธฐ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
LG Aimers 3๊ธฐ ์๋ฃ (0) | 2023.12.31 |
---|---|
Module 6. ๊ฐํํ์ต (Reinforcement Learning) (๊ณ ๋ ค๋ํ๊ต ์ด๋ณ์ค ๊ต์) (0) | 2023.07.15 |
Module 5. ์ง๋ํ์ต (๋ถ๋ฅ/ํ๊ท) (์ดํ์ฌ์๋ํ๊ต ๊ฐ์ ์ ๊ต์) (0) | 2023.07.08 |
Module 4. Bayesian (๊ณ ๋ ค๋ํ๊ต ๊น์ฌํ) (0) | 2023.07.04 |
Module 3. SCM & ์์์์ธก (๊ณ ๋ ค๋ํ๊ต ์ดํ์ ๊ต์) (0) | 2023.07.04 |