์ฌ์ ์ง์
1.๋จ์ ์ ํํ๊ท
๋จ ํ๋์ ํน์ฑ(feature)์ ๊ฐ์ง๊ณ ๋ผ๋ฒจ๊ฐ(label) ๋๋ ํ๊น(target)์ ์์ธกํ๊ธฐ ์ํ ํ๊ท ๋ชจ๋ธ์ ์ฐพ๋ ๊ฒ
= scattor plot์์ ํน์ฑ x ์ ๋ผ๋ฒจ๊ฐ y ์ฌ์ด์ ๊ด๊ณ๋ฅผ ์ค๋ช
ํ ์ ์๋ '์ '์ ์ฐพ๋ ๊ฒ
= ์ต๋ํ ํน์ฑ๊ณผ ๋ผ๋ฒจ๊ฐ์ ๊ด๊ณ๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํด์ค ์ ์๋ ์ผ์ฐจํจ์์์ ์ฐพ์๋ด๋ ๊ฒ
= ์๋ก์ด ๋ฐ์ดํฐ์ ํน์ฑ๊ฐ์ด ์ฃผ์ด์ก์ ๋ ๊ทธ์ ํด๋นํ๋ ๋ผ๋ฒจ๊ฐ์ ์์ธกํด๋ผ ์ ์๋ค.
y = w[0] * x[0] + b
y : ์์ธก๊ฐ
x[0] : ํน์ฑ
w[0] : ๊ฐ์ค์น(weight) ๋๋ ๊ณ์(coefficient) (์ผ์ฐจํจ์์์ ๊ธฐ์ธ๊ธฐ)
b : ํธํฅ(offset) (์ผ์ฐจํจ์์์ y์ ํธ)
์ฌ๋ฌ ๊ฐ์ ์ํ๋ค์ ํน์ฑ๊ฐ๋ค๊ณผ ๋ผ๋ฒจ๊ฐ๋ค์ ์ด์ฉํด์ ๊ฐ์ฅ ์ ํฉํ w[0] ์ b๋ฅผ ์ฐพ์์ผ ํจ.
-> ์ด๋ป๊ฒ? ๊ฒฝ์ฌ๊ฐ์๋ฒ(๊ฒฝ์ฌํ๊ฐ๋ฒ)
ํ์ง๋ง ํ๋์ ํน์ฑ์ผ๋ก ์ข์ ์์ธก๋ฅ๋ ฅ์ ๋ณด์ด๋ ๋ชจ๋ธ์ ๋ง๋ค๊ธฐ ์ฝ์ง ์๋ค.
->๊ทธ๋์ -> ๋ค์ค์ ํํ๊ท
2. ๋ค์ค์ ํํ๊ท
ํ๋์ ํน์ฑ์ด ์๋ ์ฌ๋ฌ ๊ฐ์ ํน์ฑ์ ํ์ฉํด์ ํ๊ท๋ชจ๋ธ์ ๋ง๋ ๋ค.
y = w[0]*x[0] + w[1]*x[1] + ... + w[p]*x[p] + b
ํน์ฑ์ ๊ฐ์ : p+1๊ฐ
ํ์ํ ๊ฐ์ค์น์ ๊ฐ์ : p+1 ๊ฐ
:p+1๊ฐ์ ํน์ฑ(x[0], x[1], ...,x[p]) ์ ๋ผ๋ฒจ๊ฐ(y)์ ์ฌ์์ ๊ด๊ณ๋ฅผ ์ ์ค๋ช ํ ์ ์๋
w[0],w[1],...,w[p] ์ b๋ฅผ ์ฐพ์์ผํ๋ค.
-> ์ด๊ฑธ ์ฐพ์ผ๋ฉด ๋ผ๋ฒจ๊ฐ์ด ์๋ ์๋ก์ด ๋ฐ์ดํฐ์ ์์ธก๊ฐ์ ๊ตฌํ ์ ์๋ค.
ํน์ฑ์ด ํ๋์์ ๋๋ ์ ํ ๋ชจ๋ธ์ด ์ง์ ์ด ๋์์ง๋ง, ํน์ฑ์ด ๋๊ฐ๋ฉด ํ๋ฉด, ๋ ๋์ ์ฐจ์์์๋ ์ดํ๋ฉด(hyperplane)์ด ๋๋ ํน์ง์ ๊ฐ์ง๊ณ ์๋ค.
3. ํ๊ท ์ ๊ณฑ์ค์ฐจ (mean squared error, MSE)
๋จ์ ์ ํํ๊ท์ ๋ค์ค์ ํํ๊ท์์ ์ ์ ํ ๊ฐ์ค์น์ ํธํฅ์ ์ฐพ์๋ด๋ ๋ฐฉ๋ฒ
์ ํํ๊ท๋ ๋ผ๋ฒจ๊ฐ๊ณผ ์์ธก๊ฐ ์ฌ์ด์ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE) ๋ฅผ ์ต์ํํ๋ ํ๋ผ๋ฏธํฐ w์ b๋ฅผ ์ฐพ๋๋ค.
:๋ผ๋ฒจ๊ฐ(์ ๋ต), ์์ธก๊ฐ์ ์ฐจ์ด๊ฐ ์์ผ๋ฉด ์์ ์๋ก ์ฑ๋ฅ์ด ์ข์ ๊ฒ์ด๊ธฐ ๋๋ฌธ!
๋ฌธ์ : ๋ค์ค ์ ํ ํ๊ท ๋ชจ๋ธ์ ๊ณผ๋์ ํฉ(overfitting) ๋ ๋๊ฐ ์ข ์ข ์๋ค (๊ณผํ๊ฒ ํ์ตํ์ฌ ์ผ๋ฐํ ๋ฅ๋ ฅ์ด ๋จ์ด์ง๋ค.)
-> ๋ฆฟ์ง(Ridge)์ ๋ผ์(Lasso) ์ ์
๋ผ์ (Lasso) ๋?
์ ํ ํ๊ท์์ ์ ์ ํ ๊ฐ์ค์น์ ํธํฅ์ ์ฐพ๋ ์ต์์ ๊ณฑ๋ฒ + ์ถ๊ฐ ์ ์ฝ ์กฐ๊ฑด(L1 Norm)
์ผ๋ฐ์ ์ผ๋ก ๋ฅ๋ฌ๋์์ ๋คํธ์ํฌ์ Overfitting(๊ณผ์ ํฉ) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ค์๊ณผ ๊ฐ์ 3๊ฐ์ง ๋ฐฉ๋ฒ์ ์ ์
- ๋ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ ๊ฒ
- Cross Validation
- Regularization
Regularization ๋ฐฉ๋ฒ ์ค ํ๋์ธ L1 Norm
๋ฒกํฐ์ ์์์ ๋ํ ์ ๋๊ฐ์ ํฉ
x = [1,2,3,4,5]
||x|| = (|1|+|2|+|3|+|4|+|5|) = 15
m์ ๊ฐ์ค์น์ ๊ฐ์๋ฅผ ์๋ฏธํ๊ณ (๋ฐ๋ผ์ ํน์ฑ์ ๊ฐ์๋ ๋จ),
α : ํ๋ํฐ์ ํจ๊ณผ๋ฅผ ์กฐ์ ํด์ฃผ๋ ํ๋ผ๋ฏธํฐ
α์ ๊ฐ์ด ์ปค์ง๋ฉด ํจ๋ํฐ ํญ์ ์ํฅ๋ ฅ์ด ์ปค์ง๊ณ , α์ ๊ฐ์ด ์์์ ธ์ ๊ฑฐ์ 0์ด ๋๋ฉด ์ ํ ํ๊ท์ ๊ฐ์์ง.
๋ผ์์ ๋ชฉ์ : MSE์ penalty ํญ์ ํฉ์ด ์ต์๊ฐ ๋๊ฒ ํ๋ w ์ b๋ฅผ ์ฐพ๋ ๊ฒ
์ฐธ๊ณ ์๋ฃ
'ML > ML' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ ๋ณด์ด๋ก ํบ์๋ณด๊ธฐ (0) | 2021.11.08 |
---|---|
[ํ๊ท๋ชจ๋ธ ์ฑ๋ฅํ๊ฐ์งํ] MAE, MSE, RMSE, R2 Score (0) | 2021.09.27 |
[๋ถ๋ฅ๋ชจ๋ธ ์ฑ๋ฅํ๊ฐ์งํ] Accuracy, Precision, Recall, F1 score ๊ฐ๋ ์ ๋ฆฌ (0) | 2020.10.07 |