🦙 라마(LLaMa)의 역사

1장. 라마(LLaMa)란 무엇인가

"Meta AI released a new open-source language model called LLaMA."

생성형 경쟁에 가장 핵심이 되는 거대 언어모델LLM에 주력하는 메타.

2장. 라마의 특징

175 billion (GPT3) → 65 billion (LLaMa)

" 더 작고 강력한 모델로, 경쟁 모델과 비슷한 수준의 성능을 내면서도 컴퓨팅 성능을 더 적게 소비해 환경에 미치는 영향도 더 작다 "

LLaMA: open source

오픈소스 커뮤니티 깃허브에 라마 소스코드를 업데이트
(학습 패러미터 - '공식적으로는' 승인 시 연구목적으로 제공)

라마는 후발주자, 대부분 오픈형으로.

open ai는 api형태 유료모델.

→ 마이크로소프트 VS 구글 VS 메타 3파전

3장. 라마의 역사는 3주

2023.02.24

메타는 지난달 24일 이 모델의 개발을 발표하면서 연구 목적으로 승인받은 사람에게만 제공하겠다고 밝혔다. 그러나 누군가가 비트토렌트를 통해 ‘라마’가 사용하는 가중치를 유출했다.

LLM에 Stable Diffusion Moment가 오고 있다
1 week of Stable Diffusion | multimodal.art

스테이블 디퓨전(Stable Diffusion) : 오픈소스 텍스트 이미지 생성기
2022년 8월의 Stable Diffuion(SD) 공개로 인한 '폭발적인 혁신'을 의미하는 것
GPT-3 급의 언어 모델을 개인 노트북에서 실행가능

Large language models are having their Stable Diffusion moment (simonwillison.net)

LLaMA is easy to run on your own hardware, large enough to be useful, and open-source enough to be tinkered with,

2023.03.10

Georgi Gerganov's Home Page (ggerganov.com)
Georgi Gerganov(조지 게르가노프)라는 개발자가 M1 칩을 구비한 맥킨토시 노트북에서 이 모델을 실행할 수 있는 코드(llama.cpp)를 만들어 공개

2023.03.11

Artem Andreenko 🇺🇦 님의 트위터: "I've sucefully runned LLaMA 7B model on my 4GB RAM Raspberry Pi 4. It's super slow about 10sec/token. But it looks we can run powerful cognitive pipelines on a cheap hardware. https://t.co/XDbvM2U5GY" / 트위터 (twitter.com)
아르템 안드린코라는 개발자가 라즈베리 파이에서 속도는 느리지만 ‘라마’를 실행하는데 성공

2023.03.13

Stanford CRFM
Stanford Alpaca, and the acceleration of on-device large language model development (simonwillison.net)
스탠포드의 연구진, 오픈AI의 다빈치-003과 비슷하지만 훨씬 가벼운 하드웨어에서 실행되는 ‘라마 7B’의 조정 버전인 ‘알파카 7B’를 출시

4장. 생각해볼 것

언어모델을 개인장비에서 구동할 수 있다?
구동가능 범위: 슈퍼 컴퓨터 → 맥 → 50만원 그래픽카드 (7B)

1) 파인 튜닝이 가능하고
2) 파인 튜닝이 저렴하고
3) 모델 자체가 가볍다는 부분

2. 간과할 수 없는 비용절감의 측면

기존 AI 연구의 큰 장애물: 대규모 언어 모델 학습 시 막대한 비용
학계와 연구기관에서 LLaMA의 활용으로 최소 수백만 달러 비용 절감할 것으로 예측

3. 프로젝트에 대한 야망/구현 범위 확장

API 비용 문제 x → 더 다양한 응용 범위

4. 악용과 책임문제에 대한 우려

통제 기반 상용 서비스 접근 방식: 책임 소재 분명
ex) 오픈AI, 마이크로소프트, 구글 - 수익창출 & 책임성 있는 도구 사용 보장

c.f) Stable diffusion, LLaMA: 책임 관련 원칙 미준수 가능성에 대한 우려
공격적/조작된 AI 콘텐츠의 웹 유통

5. 그래서, '라마의 유출이 과연 어떤 영향을 미칠 것인가'

전문가들의 예측대로 LLaMA는 세계에서 가장 널리 사용되는 생성형 AI가 될까?
ex) Stable diffusion에서 오픈소스 능력자들이 만들어낸 전례

링크
Week 3 of LLaMA 🦙 - Replicate – Replicate
https://simonwillison.net/2023/Mar/13/alpaca/
https://ai.facebook.com/blog/large-language-model-llama-meta-ai/
https://www.itworld.co.kr/news/281539#csidxf0164453fb380639bde9a6e177f11e6
https://blog.naver.com/hilft/223047153234
https://news.hada.io/topic?id=8684

📣 24기 대기자 모집이 시작되었습니다!

🦙 라마(LLaMa)의 역사

1장. 라마(LLaMa)란 무엇인가

2장. 라마의 특징

3장. 라마의 역사는 3주

4장. 생각해볼 것

뉴스레터 무료 구독