Projects/COVID-19 analysis
ํธ์ํฐ ๋ฐ์ดํฐ KoBERT ๊ฐ์ ๋ถ๋ฅ ๊ฒฐ๊ณผ์ ๋ฆฌ
1.KoBERT ์๊ฐ KoBERT๋ BERT ์ ํ๊ตญ์ด๋ฒ์ ์
๋๋ค. BERT(Bidirectional Encoder Representations from Transformers)๋ ๊ตฌ๊ธ์ด ๊ณต๊ฐํ ์ธ๊ณต์ง๋ฅ(AI) ์ธ์ด๋ชจ๋ธ์ธ๋ฐ์, ์ผ๋ถ ์ฑ๋ฅ ํ๊ฐ์์ ์ธ๊ฐ๋ณด๋ค ๋ ๋์ ์ ํ๋๋ฅผ ๋ณด์ด๋ฉฐ 2018๋
๋ง์ ์์ฐ ์ธ์ด ์ฒ๋ฆฌ(NLP)์์ SOTA๋ฅผ ๋ฌ์ฑํ ๋ชจ๋ธ์
๋๋ค. BERT์ ํน์ง์ผ๋ก๋ ์ธ ๊ฐ์ง๊ฐ ์์ต๋๋ค. - ์ธ์ดํํ ์ฌ์ ํ์ต์ ์๋ก์ด ๋ฐฉ๋ฒ Wikipedia ๋ BooksCorpus์ ๊ฐ์ ๋์ฉ๋์ ๋ผ๋ฒจ๋ง ๋์ด ์์ง ์์ ๋ฐ์ดํฐ(์ ๋ต์ด ์๋)๋ก ๋ชจ๋ธ์ pretraining ์ํจ ํ, ํน์ task๋ฅผ ๊ฐ์ง๊ณ ์๋ labeled data๋ก transfer learning์ ํ๋ ๋ชจ๋ธ์
๋๋ค. - Bidirectional ..