<aside> ๐ก
์ด ํ๋ก์ ํธ๋ ์ด๋ฒ ์คํฐ๋์ ๊ฑฐ์ ๋ง์ง๋ง์ ๋๋ค!! ์ง๊ธ๊ป ๊ณต๋ถํ ๊ฑธ ์์์ด ์จ๋ณธ๋ค๋ ๋ง์๊ฐ์ง์ผ๋ก, ๋๋ ์๋๋ ์ต๋ํ ๋ถ๋ชํ ๋ณด์๊ณ ๋จธ๋ฆฌ๋ฅผ ์ง๋ด ๋ณด์ธ์!! ๋น์ฐํ ์ด๋ ต๊ฒ ์ง๋ง (์ ๋ ์ด๋ ค์์) ์ด๊ฒ๋ง์ ๊นจ ๋ถ์ ๋ณธ๋ค๋ ์์ธ๋ก ๋์ ํด๋ณด์๋ฉด์ ๋ง์ ๊ฑธ ๋ฐฐ์๊ฐ์๊ธธ ์์ํ๊ฒ ์ต๋๋ค! ์ ๋ ๊ฐ์ด ํ๋ด์ ์ฝ๋ฉํ๊ณ , ์๋์ ๋ ์ฐ๊ฒ ์ง๋ง, ์ฑ๊ณต์ ์ผ๋ก ํ๋ก์ ํธ ๋ง์น์๋๋ก ์ง์ํด๋๋ฆฌ๊ฒ ์ต๋๋ค!!
</aside>
์ด ๋ ธํธ๋ถ์ ์๋ TODO๋ฅผ ์ฑ์ ๋๊ฐ๋ ์์ผ๋ก ์ฝ๋ฉํ์๋ฉด ๋๊ฒ ์ต๋๋ค!
์ด๋ฒ ํ๋ก์ ํธ๋ฅผ ๋ค ์ฝ๋ฉํ์๋ฉด ์๋ kaggle competition์ ์ ์ถํ๊ฒ ๋ฉ๋๋ค. competition์์ ๋ฐ์ public score/private score๋ฅผ ์ ์ถํ๋ ๊ฒ์ด ๊ณผ์ ์ ์ต์ข ๋ง๋ฌด๋ฆฌ๊ฐ ๋๊ฒ ์ต๋๋ค.
Attention-Based Speech Recognition
public github repository์ ์์ ํ๊ณ ์๋ ๋ด์ฉ์ ์ฌ๋ฆฐ ๋ค์,
์๋ ์ง๋ฌธ DB์ ์ ํ์ด์ง๋ฅผ ํ์, ๊นํ๋ธ ๋งํฌ๋ฅผ ๊ฑธ์ด์ฃผ์๊ณ , โOOํจ์ ์ด๋ป๊ฒ ์ง์ผํ ์ง ๊ฐ์ด ์์จ๋ค..โ, โ๋ด๊ฐ attention์ด๋ฐ์์ผ๋ก ์งฐ๋๋ฐ loss๊ฐ ์ ์ค์ด๋ ๋ค ์๊ทธ๋ฌ๋?โ ์ด๋ฐ์์ผ๋ก ์ฌ๋ ค์ฃผ์๋ฉด ์ ๊ฐ
์ด๋ฒ์ฃผ, ๋ค์์ฃผ๋ ๋ชธ์ด ๋ถ์ ์ง๋ ํ์ด ์์ด๋ ํ์ผ 8์ ์ดํ, ํ /์ผ์ ํํ์์ผ๋ก ๋ฐ๋์ ๋ํ ์ผํ ๋ต๋ณ/๊ฐ์ด๋๋ฅผ ๋๋ฆฌ๋๋ก ํ๊ฒ ์ต๋๋ค.
์ง์ง ์ผํ ๋นํ ์์ ์ด๋ณด์ ์ธ ์ง๋ฌธ์ด์ด๋ ๋ํ ์ผํ๊ฒ ๋ต๋ณํ๊ฒ ์ต๋๋ค. ์์ปจ๋ torch์์ LSTM์ด๋ป๊ฒ ์จ์,,, pyramidal encoder ์ด๋ป๊ฒ ์ง๋์ง ์ ํ ๋ชจ๋ฅด๊ฒ ์ด์.. ์ด๋ฐ ๊ฒ๋ ๊ด์ฐฎ์ต๋๋ค
โ ๊ทธ๋ฆฌ๊ณ BEST๋ ์ ๊ฐ ์ง๋ฌธ์ ์ผํ๋๋ผ ๋์ณ๋ ๋ค๋ฅธ ๋ถ๋ค๋ ๊พธ์คํ ์ด DBํ์ธํ์๋ฉด์ ๋ต๋ณํ ์ ์๋ ๋ถ๋ถ์ ๋ต๋ณ ํด์ฃผ์๋ ๊ฒ๋๋ค