๋ฐ์ดํฐ์ ์ค๋น
Hatespeech Dataset ์ ๋จผ์ ๋ค์ด๋ฐ์์ผํ๋ค.
Dataset์ ์ด๊ณณ์ ์ฐธ๊ณ ํ๋ค.
์ฌ์ฉํ ๋ฐ์ดํฐ์ ์ ์
์์ด๋ก๋๊ณ , ํธ์ํฐ์์ ์ถ์ถํ ๋ฐ์ดํฐ์ ๋ง์ ์ถ๋ ค๋ณด๋,
Hatebase, Kaggle, Wassem & Hovy ๋ฑ์ด ์๋ค.
์ด๋ค ์ค, Hate speech detection ๋ ผ๋ฌธ์์ ๊ฐ์ฅ ๋ง์ด ๋ณด์๋ Wasseem & Hovy ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ๊ธฐ๋ก ์ ํํ๋ค.
Class |
Size |
Origin Source |
Language |
|
Hatebase |
Hate Offensive Neither |
24,000 |
|
English |
Kaggle |
Insulting Not insulting |
6,000 |
|
English |
Wassem & Hovy |
Sexism Racism None |
16,000 |
|
English |
'Projects > Hate Speech Detection' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ํ ๋ ๊ทธ๋จ ์ฑ๋ด] ํ์ด์ฌ ํ ๋ ๊ทธ๋จ ์ฑ๋ด ๋ง๋ค๊ธฐ (0) | 2021.07.16 |
---|---|
[๋ถ์ ๋ฐฉ๋ฒ] HAN(Hierarchical Attention Network) ์ด๋? (0) | 2019.12.23 |
[์์ด๋์ด ์๊ฐ] Hate speech detection (0) | 2019.12.23 |