라마인덱스 공식문서 살펴보기

배경 및 목적

라마인덱스 공식 문서(https://docs.llamaindex.ai/en/stable/)를 살펴보고 있습니다. 많은 분들이 말씀하시는 것처럼 소프트웨어의 공식 문서를 살펴보는 것이 중요하다는 점을 상기하면서요.

아울러, 라마인덱스 자료가 많지 않다는, 한글 자료가 많지 않다는 의미가 아닐까 싶습니다만, 의견들이 많아 이 문서를 번역해보면 어떨까 하는 생각도 해보았습니다. 번역 관련해서는 빅라마 스터디장님의 노션 페이지가 참고가 되었습니다.

참고 자료

라마인덱스 공식 문서: https://docs.llamaindex.ai/en/stable/

활용 툴

옵시디언

DeepL

실행 과정

공식 문서 사이트의 메뉴에 따른 페이지 수를 파악해보니 전체 1,430페이지로 메뉴별 분포는 다음과 같았습니다. 번호는 제 편의로 붙여 보았습니다.

1.Home 10

2.Learn 34

3.Use Cases 8

4.Examples 553

5.Component Guides 83

6.Advanced Topics 11

7.API Reference 715

8.Open-Source Community 14

9.LlamaCloud 2

합계 1430

페이지 수로 볼 때 API Reference와 Examples이 압도적으로 많은 것을 알 수 있었습니다. 라마인덱스의 다양한 활용 가능성을 볼 수 있지 않나 싶습니다. API Reference에서 50개 이상의 페이지를 갖고 있는 분류 항목은 Embeddings, Llama Packs, LLMs, Readers, Storage, Tools 등이었습니다. Examples에서 30개 이상의 페이지를 갖고 있는 분류 항목은 Agents, Data Connectors, Embeddings, LLMs, Vector Stores 등이었고요. 이런 결과가 의미하는 바를 전문가분께서 설명해주시면 좋겠네요.

라마인덱스를 공부하려면 Home(10), Learn(34)을 보면 될 것 같기는 한데, Component Guides(83)와 Advanced Topics (11) 부분도 중요하지 않을까 싶습니다.

이 공식문서를 어떻게 효율적으로 번역하고 문서화를 하여 공부해볼까 하다가 요즘 자주 사용하고 있는 툴인 옵시디언을 생각해보게 되었습니다. 그래서 아래처럼 볼트를 구성해보았습니다.

구글 문서의 한국어 버전 스크린샷

영어 원문과 한글 번역문을 비교하면서, 그리고 번역한 내용을 옵시디언의 노트에 바로 붙여넣기 위해 아래처럼 스프레드시트에서 다소간의 수작업을 진행해보고 있습니다. 그런 수작업을 하면서 기계번역된 내용을 포스트에디팅하고 있습니다.

한국어 텍스트가 포함된 스프레드시트 스크린샷

결과 및 인사이트

라마인덱스 문서 현황을 보면서 LLM에 기반한 개발 프로세스에 사람들이 아주 많은 관심을 보이면서 다양한 시도들이 하고있지 않나 하는 생각을 해보게 되었습니다. API Reference와 Examples의 숫자가 그런 의미가 아닐까 싶습니다.

이런 현상을 비유적으로 얘기해본다면, 2차 산업혁명 시기에 전기가 공급되면서 다양한 공장들이 다양한 방식으로 배치되어 활용되는 것과 비슷하지 않나 싶습니다. 그러니까 LLM이, 전기를 보내는 발전소와 같은 역할을 한다고 비유해보는 것인데 그럴 듯한가 모르겠습니다.^^

석탄과 같은 에너지 공급원을 사용하던 1차 산업혁명기에는 그런 공급원 바로 옆에 공장을 지어야했던 것처럼, 얼마 전까지 많은 사람들이 너도나도 딥러닝을 해서 언어모델을 만들지 않았나 싶습니다. 지금은 그렇지 않아서 그런지 고사양의 컴퓨터가 중고시장에 나오고 있는 것 같습니다. 맞는얘기인가 모르겠습니다만.

그나저나 번역하면서 라마인덱스 공부를 해보겠다는 마음으로 며칠 동안은 열심히 해보았는데 이런저런 일들로 인해 이 공부가 좀 뒷전으로 밀렸습니다. 앞으로 어떻게 될까 잘 모르겠습니다.^^

4

뉴스레터 무료 구독

👉 이 게시글도 읽어보세요