Weekly 인공지능 뉴스레터 6월 4주차

안녕하세요. 요즘 매일 인공지능에 대한 공부를 하나씩 해서 주말에 인공지능 관련 뉴스레터를 발행하고 있습니다. 그렇게 대단한건 아니지만 트렌드 등을 간단하게 파악하는데 요긴하실 것 같습니다.

6월 4주차 내용을 공유드립니다~!

  • Meta의 MusicGen - 메타에서 텍스트로 음악을 생성할 수 있는 모델을 발표했습니다. 코드와 페이퍼는 공개했고 허깅 페이스를 통해 데모를 사용할 수 있습니다.

  • 어도비의 Generative Recolor 공개 - 어도비에서 이미지를 텍스트 프롬프트로 변경하는 모델을 일러스트레이터에 포함했습니다. 프롬프트를 입력하면 다양한 컬러 테마를 적용시켜 변화를 쉽게 만들어 낼 수 있습니다.

  • 메타의 음성 생성 AI Vocebox - 이번에도 메타의 이야기네요. Voicebox는 text to speech 를 6개언어로 만들어낼 수 있습니다. 스타일 트랜스퍼로 특정 목소리의 스타일을 학습할 수 있고 노이즈 제거 및 음성 편집이 가능합니다. 오남용에 대한 우려 때문에 코드와 모델은 공개하지 않았고 페이퍼와 샘플을 공개했습니다. TTS 기반의 인터페이스는 앞으로 생성이 좀 더 쉬워지지 않을까 예측해 봅니다.

  • GPT Engineer - 프롬프트를 입력하면 프로젝트 전체를 빌드해주는 파이썬 프로젝트. GPT-4 API를 사용하고 인공지능이 확실하지 않은 부분은 다시 물어봐서 프로젝트를 빌드해 줍니다.

  • 허깅 페이스 AI QR 코드 : 허깅 페이스에서 텍스트를 입력하면 QR 코드 이미지를 만들어 주는 기능을 공개했습니다. (url과 프롬프트를 입력하면 QR 코드를 만들어 줍니다.)

  • 딥마인드의 RoboCat : 구글 딥마인드에서 로봇 팔을 이용해서 다양한 작업을 수행할 수 있는 인공지능 모델을 개발했다고 합니다. 100~1000개의 사람이 조종한 로봇 팔을 활용해 특정 작업을 학습할 수 있다고 합니다. 이런식으로 샘플에서 패턴을 학습한 후 사용하는 방식은 앞으로 널리 쓰일 것 같습니다.


계속 뉴스레터를 발행할 계획이니 관심있으신 분들은 뉴스 레터 링크에서 구독해 주세요~!

https://tilnote.io/pages/6496760dedd1a49a606138f4

그럼 즐거운 저녁 되세요~! 🙂🙂

7

👉 이 게시글도 읽어보세요