1์ฅ. ๋ผ๋ง(LLaMa)๋ ๋ฌด์์ธ๊ฐ
"Meta AI released a new open-source language model called LLaMA."
์์ฑํ ๊ฒฝ์์ ๊ฐ์ฅ ํต์ฌ์ด ๋๋ ๊ฑฐ๋ ์ธ์ด๋ชจ๋ธLLM์ ์ฃผ๋ ฅํ๋ ๋ฉํ.
2์ฅ. ๋ผ๋ง์ ํน์งย
- 175 billion (GPT3) โ 65 billion (LLaMa)
" ๋ ์๊ณ ๊ฐ๋ ฅํ ๋ชจ๋ธ๋ก, ๊ฒฝ์ ๋ชจ๋ธ๊ณผ ๋น์ทํ ์์ค์ ์ฑ๋ฅ์ ๋ด๋ฉด์๋ ์ปดํจํ ์ฑ๋ฅ์ ๋ ์ ๊ฒ ์๋นํด ํ๊ฒฝ์ ๋ฏธ์น๋ ์ํฅ๋ ๋ ์๋ค "
- LLaMA: open source
์คํ์์ค ์ปค๋ฎค๋ํฐ ๊นํ๋ธ์ ๋ผ๋ง ์์ค์ฝ๋๋ฅผ ์
๋ฐ์ดํธ
(ํ์ต ํจ๋ฌ๋ฏธํฐ - '๊ณต์์ ์ผ๋ก๋' ์น์ธ ์ ์ฐ๊ตฌ๋ชฉ์ ์ผ๋ก ์ ๊ณต)
๋ผ๋ง๋ ํ๋ฐ์ฃผ์, ๋๋ถ๋ถ ์คํํ์ผ๋ก.
(ํ์ต ํจ๋ฌ๋ฏธํฐ - '๊ณต์์ ์ผ๋ก๋' ์น์ธ ์ ์ฐ๊ตฌ๋ชฉ์ ์ผ๋ก ์ ๊ณต)
๋ผ๋ง๋ ํ๋ฐ์ฃผ์, ๋๋ถ๋ถ ์คํํ์ผ๋ก.
open ai๋ apiํํ ์ ๋ฃ๋ชจ๋ธ.
ย
โ ๋ง์ดํฌ๋ก์ํํธ VS ๊ตฌ๊ธ VS ๋ฉํ 3ํ์
3์ฅ. ๋ผ๋ง์ ์ญ์ฌ๋ 3์ฃผ
- 2023.02.24
๋ฉํ๋ ์ง๋๋ฌ 24์ผ ์ด ๋ชจ๋ธ์ ๊ฐ๋ฐ์ ๋ฐํํ๋ฉด์ ์ฐ๊ตฌ ๋ชฉ์ ์ผ๋ก ์น์ธ๋ฐ์ ์ฌ๋์๊ฒ๋ง ์ ๊ณตํ๊ฒ ๋ค๊ณ ๋ฐํ๋ค. ๊ทธ๋ฌ๋ ๋๊ตฐ๊ฐ๊ฐ ๋นํธํ ๋ ํธ๋ฅผ ํตํด โ๋ผ๋งโ๊ฐ ์ฌ์ฉํ๋ ๊ฐ์ค์น๋ฅผ ์ ์ถํ๋ค.ย
LLM์ Stable Diffusion Moment๊ฐ ์ค๊ณ ์๋ค
1 week of Stable Diffusion | multimodal.art
์คํ ์ด๋ธ ๋ํจ์ (Stable Diffusion) : ์คํ์์ค ํ ์คํธ ์ด๋ฏธ์ง ์์ฑ๊ธฐ
2022๋ 8์์ Stable Diffuion(SD) ๊ณต๊ฐ๋ก ์ธํ 'ํญ๋ฐ์ ์ธ ํ์ '์ ์๋ฏธํ๋ ๊ฒ
GPT-3 ๊ธ์ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ธ ๋ ธํธ๋ถ์์ ์คํ๊ฐ๋ฅ
Large language models are having their Stable Diffusion moment (simonwillison.net)
1 week of Stable Diffusion | multimodal.art
์คํ ์ด๋ธ ๋ํจ์ (Stable Diffusion) : ์คํ์์ค ํ ์คํธ ์ด๋ฏธ์ง ์์ฑ๊ธฐ
2022๋ 8์์ Stable Diffuion(SD) ๊ณต๊ฐ๋ก ์ธํ 'ํญ๋ฐ์ ์ธ ํ์ '์ ์๋ฏธํ๋ ๊ฒ
GPT-3 ๊ธ์ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ธ ๋ ธํธ๋ถ์์ ์คํ๊ฐ๋ฅ
Large language models are having their Stable Diffusion moment (simonwillison.net)
LLaMA is easy to run on your own hardware, large enough to be useful, and open-source enough to be tinkered with,
- 2023.03.10
Georgi Gerganov's Home Page (ggerganov.com)
Georgi Gerganov(์กฐ์ง ๊ฒ๋ฅด๊ฐ๋ ธํ)๋ผ๋ ๊ฐ๋ฐ์๊ฐ M1 ์นฉ์ ๊ตฌ๋นํ ๋งฅํจํ ์ ๋ ธํธ๋ถ์์ ์ด ๋ชจ๋ธ์ ์คํํ ์ ์๋ ์ฝ๋(llama.cpp)๋ฅผ ๋ง๋ค์ด ๊ณต๊ฐย
Georgi Gerganov(์กฐ์ง ๊ฒ๋ฅด๊ฐ๋ ธํ)๋ผ๋ ๊ฐ๋ฐ์๊ฐ M1 ์นฉ์ ๊ตฌ๋นํ ๋งฅํจํ ์ ๋ ธํธ๋ถ์์ ์ด ๋ชจ๋ธ์ ์คํํ ์ ์๋ ์ฝ๋(llama.cpp)๋ฅผ ๋ง๋ค์ด ๊ณต๊ฐย
- 2023.03.11
Artem Andreenko ๐บ๐ฆ ๋์ ํธ์ํฐ: "I've sucefully runned LLaMA 7B model on my 4GB RAM Raspberry Pi 4. It's super slow about 10sec/token. But it looks we can run powerful cognitive pipelines on a cheap hardware. https://t.co/XDbvM2U5GY" / ํธ์ํฐ (twitter.com)
์๋ฅดํ ์๋๋ฆฐ์ฝ๋ผ๋ ๊ฐ๋ฐ์๊ฐ ๋ผ์ฆ๋ฒ ๋ฆฌ ํ์ด์์ ์๋๋ ๋๋ฆฌ์ง๋ง โ๋ผ๋งโ๋ฅผ ์คํํ๋๋ฐ ์ฑ๊ณต
์๋ฅดํ ์๋๋ฆฐ์ฝ๋ผ๋ ๊ฐ๋ฐ์๊ฐ ๋ผ์ฆ๋ฒ ๋ฆฌ ํ์ด์์ ์๋๋ ๋๋ฆฌ์ง๋ง โ๋ผ๋งโ๋ฅผ ์คํํ๋๋ฐ ์ฑ๊ณต
- 2023.03.13
Stanford CRFM
Stanford Alpaca, and the acceleration of on-device large language model development (simonwillison.net)
์คํ ํฌ๋์ ์ฐ๊ตฌ์ง, ์คํAI์ ๋ค๋น์น-003๊ณผ ๋น์ทํ์ง๋ง ํจ์ฌ ๊ฐ๋ฒผ์ด ํ๋์จ์ด์์ ์คํ๋๋ โ๋ผ๋ง 7Bโ์ ์กฐ์ ๋ฒ์ ์ธ โ์ํ์นด 7Bโ๋ฅผ ์ถ์
Stanford Alpaca, and the acceleration of on-device large language model development (simonwillison.net)
์คํ ํฌ๋์ ์ฐ๊ตฌ์ง, ์คํAI์ ๋ค๋น์น-003๊ณผ ๋น์ทํ์ง๋ง ํจ์ฌ ๊ฐ๋ฒผ์ด ํ๋์จ์ด์์ ์คํ๋๋ โ๋ผ๋ง 7Bโ์ ์กฐ์ ๋ฒ์ ์ธ โ์ํ์นด 7Bโ๋ฅผ ์ถ์
4์ฅ. ์๊ฐํด๋ณผ ๊ฒ
- ย ์ธ์ด๋ชจ๋ธ์ ๊ฐ์ธ์ฅ๋น์์ ๊ตฌ๋ํ ์ ์๋ค?๊ตฌ๋๊ฐ๋ฅ ๋ฒ์: ์ํผ ์ปดํจํฐ โ ๋งฅ โ 50๋ง์ ๊ทธ๋ํฝ์นด๋ (7B)
1) ํ์ธ ํ๋์ด ๊ฐ๋ฅํ๊ณ
2) ํ์ธ ํ๋์ด ์ ๋ ดํ๊ณ
3) ๋ชจ๋ธ ์์ฒด๊ฐ ๊ฐ๋ณ๋ค๋ ๋ถ๋ถย
2. ๊ฐ๊ณผํ ์ ์๋ ๋น์ฉ์ ๊ฐ์ ์ธก๋ฉด
๊ธฐ์กด AI ์ฐ๊ตฌ์ ํฐ ์ฅ์ ๋ฌผ: ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ ํ์ต ์ ๋ง๋ํ ๋น์ฉ
ํ๊ณ์ ์ฐ๊ตฌ๊ธฐ๊ด์์ LLaMA์ ํ์ฉ์ผ๋ก ์ต์ ์๋ฐฑ๋ง ๋ฌ๋ฌ ๋น์ฉ ์ ๊ฐํ ๊ฒ์ผ๋ก ์์ธก
3. ํ๋ก์ ํธ์ ๋ํ ์ผ๋ง/๊ตฌํ ๋ฒ์ ํ์ฅ
API ๋น์ฉ ๋ฌธ์ x โ ๋ ๋ค์ํ ์์ฉ ๋ฒ์
4. ์ ์ฉ๊ณผ ์ฑ ์๋ฌธ์ ์ ๋ํ ์ฐ๋ ค
ํต์ ๊ธฐ๋ฐ ์์ฉ ์๋น์ค ์ ๊ทผ ๋ฐฉ์: ์ฑ ์ ์์ฌ ๋ถ๋ช
ex) ์คํAI, ๋ง์ดํฌ๋ก์ํํธ, ๊ตฌ๊ธ - ์์ต์ฐฝ์ถ & ์ฑ ์์ฑ ์๋ ๋๊ตฌ ์ฌ์ฉ ๋ณด์ฅ
c.f) Stable diffusion, LLaMA: ์ฑ ์ ๊ด๋ จ ์์น ๋ฏธ์ค์ ๊ฐ๋ฅ์ฑ์ ๋ํ ์ฐ๋ ค
๊ณต๊ฒฉ์ /์กฐ์๋ AI ์ฝํ ์ธ ์ ์น ์ ํต
5. ๊ทธ๋์, '๋ผ๋ง์ ์ ์ถ์ด ๊ณผ์ฐ ์ด๋ค ์ํฅ์ ๋ฏธ์น ๊ฒ์ธ๊ฐ'
์ ๋ฌธ๊ฐ๋ค์ ์์ธก๋๋ก LLaMA๋ ์ธ๊ณ์์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์์ฑํ AI๊ฐ ๋ ๊น?
ex) Stable diffusion์์ ์คํ์์ค ๋ฅ๋ ฅ์๋ค์ด ๋ง๋ค์ด๋ธ ์ ๋ก
๋งํฌ
Week 3 of LLaMA ๐ฆ - Replicate โ Replicate
https://simonwillison.net/2023/Mar/13/alpaca/
https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
https://www.itworld.co.kr/news/281539#csidxf0164453fb380639bde9a6e177f11e6
https://blog.naver.com/hilft/223047153234
https://news.hada.io/topic?id=8684