๐ย ์์ฝ
- **์ด๋ฏธ์ง์ ํจ๊ป ์ด๋ฏธ์ง๋ฅผ ๋ฌ์ฌํ๋ ๋ฌธ์ฅ์ผ๋ก ๊ตฌ์ฑ(**sentence-based image description)๋์ด ์๋ ๋ฐ์ดํฐ์
์
๋๋ค.
- ์จ๋ผ์ธ ์ฌ์ง ๊ณต์ ์๋น์ค Flickr(flickr.com)์์ ์์งํ 31,783์ฅ์ ์ด๋ฏธ์ง + ๊ฐ ์ด๋ฏธ์ง ๋น 5 reference **๋ฌธ์ฅ(์ด 158,915๊ฐ)**์ผ๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
- Flickr์์ ์์งํ ์ผ์์ ์ธ ์ฌ์ง(everyday activities)์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค.
- ์คํ์์ค๋ก ๊ณต๊ฐ๋์ด ์์ผ๋ฉฐ, ๋ฌด๋ฃ์ด๊ณ ์๋์ ์ผ๋ก ๋ฐ์ดํฐ์
์ ํฌ๊ธฐ๊ฐ ์์ต๋๋ค.

์ฌ์ง ์ถ์ฒ: Young, P., Lai, A., Hodosh, M., & Hockenmaier, J. (2014). From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions.ย Transactions of the Association for Computational Linguistics,ย 2, 67-78.
๐ย Flickr ๋ฐ์ดํฐ์
์ ์ญ์ฌ
Flick8K ๋ฐ์ดํฐ์
์ ์ด๊ธฐ ๊ตฌ์ถ
2010๋
University of Illinois at Urbana-Champaign ๋ํ์์ Collecting Image Annotations Using Amazonโs Mechanical Turk ์ด๋ผ๋ ์ ๋ชฉ์ ๋
ผ๋ฌธ์ ๋ฐํํฉ๋๋ค.
- ์ด ๋
ผ๋ฌธ์ ์์ง๋ ์ด๋ฏธ์ง์ ๊ทธ ์ด๋ฏธ์ง๋ฅผ ์ค๋ช
ํ๋ ๋ฌธ์ฅ(annotation) ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ์ผ๋ฉฐ, ๋ ์ข์ ํ์ง์ ๋ฐ์ดํฐ์
์ ๊ตฌ์ถํ๊ธฐ ์ํด ์ด๋ป๊ฒ ๋
ธ๋ ฅํ๋์ง ์ ๊ทผ์ ์ค๋ช
ํ ๋ฐ์ ์์ต๋๋ค.
- Amazon Mechanical Turk์ ์ด์ฉํ์ฌ ์ด 8108์ฅ์ ์ด๋ฏธ์ง์ ๊ฐ ์ด๋ฏธ์ง ๋น 5๊ฐ์ ์จ์ ํ ๋ฌธ์ฅ(image caption) corpus๋ฅผ ๊ตฌ์ถํ๋ค๊ณ ํฉ๋๋ค.
๋
ผ๋ฌธ์ ํต์ฌ ๊ณผ์ , image annotation๊ณผ ๊ทธ ํ๊ณ