레디샷 서비스를 위한 허깅페이스 모델 찾기의 여정(ReadyShot)

[이전 발표 내용]

ReadyShot 이미지에서 Object 구별하기 발표링크

핵심 기술은 이미지내의 “Object detection”의 정확도!!

기술보다 더 중요한 것은 PMF(Product Market Fit)!!

[Status]

  • 생각보다 많은 진도 나가지 못한 상태

  • [진행 중] 최적의 모델 찾고 테스트 중

  • [진행 중] 서비스 구성 - 백엔드 구성 고민 중

  • [완료] 도메인 구매 완료

[Goal]

  • 7월 중 beta open

  • preview sketch



[서비스 수준에 맞는 적절한 모델 찾는 여정]

  1. Hugging Face 적절한 모델 찾기 및 테스트(HuggingFace Space or Google Colab)

    1. Model - “google/owlv2-base-patch16-ensemble” >> 결과 양호

      1. https://colab.research.google.com/drive/15EgtMpH3XFqfQT-hALwF4pm4JEW7nEVU?usp=sharing




    2. Model - ”facebook/detr-resnet-50” >> 결과 나쁨

      1. https://colab.research.google.com/drive/1SDWUggj-GJEtzUSAteZ9I3sdE3Ri8Eyu?usp=sharing

      2. <시연> 구글 드라이브 파일 연결

<<Tip>> Colab 개발 중 에러 발생시 Gemini 도움받기 >> 직접적인 도움이 됨

  • Model - Florence-2 >> 결과 부족함



⁉️ 계속 허깅페이스 내 모델안에만 검색하고 테스트 하던 중, 가까이 있던 똑똑한 친구, ChatGPT-4o에게 확인을 해봐야겠다는 생각이 듬

  • ChatGPT-4o 테스트 사례 #1

    이미지가 포함된 chat 내용은 아직 공유 기능이 제공되지 않음


<ChatGPT 40 결과 중 일부 내용> 결과 >> 훌륭함

  • ChatGPT-4o 테스트 사례 #2

    1. 재밌었던 부분은 각 아이템을 분리해서 이미지를 재생성해줬는데 없는것도 만들어줬네요^^



[Co-working with AI]

  1. 👉 3가지 케이스의 백엔드 구축 비용 대충 비교해보기 [chatGPT chat]

참고용 - “GPT 가격 비교 결론”

•ChatGPT-4 API 이용:** 초기 구축 비용과 운영 비용이 낮고, 관리가 용이하며 빠르게 서비스를 출시할 수 있습니다. 다만, 쿼리 수가 많아질 경우 비용이 증가할 수 있습니다.

• 자체 서버 구축:** 초기 구축 비용과 운영 비용이 높지만, 장기적으로 대규모 트래픽을 처리할 수 있는 유연성과 확장성이 큽니다. 모델 최적화와 커스터마이징이 가능합니다.

• 허깅페이스 Inference Endpoints (AWS GPU Instances):** 초기 구축 비용이 낮고, 유연성과 확장성이 높습니다. 그러나 GPU 인스턴스 비용과 허깅페이스 사용료로 인해 월 운영 비용이 상대적으로 높습니다.

빠른 검증을 위한 MVP용이라면 자체 서버구축 방법보다는 chatgpt API이용 방법이나 허깅페이스 Interface Endpoints 옵션을 고려해서 결정 예정!


[To-Do List]

  • 모델 확정(1w)

  • MVP 백엔드 구성안 확정(1w)

  • 앱 개발(1W) - flutter flow

  • 랜딩페이지 개발(2d)


» to be continue » ReadyShot!!


#11기HuggingFace

3
3개의 답글

👉 이 게시글도 읽어보세요