https://arxiv.org/pdf/2302.04870.pdf
sgid="BAh7CEkiCGdpZAY6BkVUSSIwZ2lkOi8vanVtcHN0YXJ0LWFwcC9FbWJlZC82ODkzMTQ_ZXhwaXJlc19pbgY7AFRJIgxwdXJwb3NlBjsAVEkiD2F0dGFjaGFibGUGOwBUSSIPZXhwaXJlc19hdAY7AFQw--a41ff3c3726a45bf428f6aa3ce0c1dc339c2eb76" content-type="embed">
꽤 신기한 학습 방법이 공개되서 올려봅니다.
파인튜닝 자체보단 과정에 대한 내용입니다.
(a) 데이터셋을 모델 소유자에게 보내준 뒤 소유자가 직접 파인튜닝하는 현재 과정 (OpenAI 등)
문제 1. 데이터셋이 유출될 수 있음
(b) 모델 파일을 데이터셋 소유자에게 보내준 뒤 데이터셋 소유자가 직접 파인튜닝하는 과정 (스테이블 디퓨전 등)
문제 1. 높은 용량의 사전 학습 파일을 통으로 보내주는건 매우 비효율적임
문제 2. 모델 파일이 유출될 수 있음
(c) 에뮬레이터와 어댑터만 보내줌으로써 데이터셋 소유자가 직접 파인튜닝하는 Offsite-Tuning
https://arxiv.org/pdf/2302.04870.pdf
https://github.com/mit-han-lab/offsite-tuning
sgid="BAh7CEkiCGdpZAY6BkVUSSIwZ2lkOi8vanVtcHN0YXJ0LWFwcC9FbWJlZC82ODkzMTQ_ZXhwaXJlc19pbgY7AFRJIgxwdXJwb3NlBjsAVEkiD2F0dGFjaGFibGUGOwBUSSIPZXhwaXJlc19hdAY7AFQw--a41ff3c3726a45bf428f6aa3ce0c1dc339c2eb76" content-type="embed">
꽤 신기한 학습 방법이 공개되서 올려봅니다.
파인튜닝 자체보단 과정에 대한 내용입니다.
(a) 데이터셋을 모델 소유자에게 보내준 뒤 소유자가 직접 파인튜닝하는 현재 과정 (OpenAI 등)
문제 1. 데이터셋이 유출될 수 있음
(b) 모델 파일을 데이터셋 소유자에게 보내준 뒤 데이터셋 소유자가 직접 파인튜닝하는 과정 (스테이블 디퓨전 등)
문제 1. 높은 용량의 사전 학습 파일을 통으로 보내주는건 매우 비효율적임
문제 2. 모델 파일이 유출될 수 있음
(c) 에뮬레이터와 어댑터만 보내줌으로써 데이터셋 소유자가 직접 파인튜닝하는 Offsite-Tuning
https://arxiv.org/pdf/2302.04870.pdf
https://github.com/mit-han-lab/offsite-tuning