안녕하세요.
네이버프리미엄콘텐츠에도 글 쓰고,
SK그룹 교육플랫폼 커뮤니티에 GPT & AI 관련된 칼럼도 쓰고
유튜브에서도 GPT & AI 활용 사례를 많이 알리고 있는 버프입니다.
오늘은 코파일럿이 ChatGPT보다 더 좋은 이유 딱 세 가지만 알아보겠습니다.
저의 주력 무기는 챗GPT입니다. 여러 AI 중에서도 글 하나만큼은 워낙 잘 쓰니까 말이죠.
그래도 이거저거 쓰다보니까 코파일럿도 매력이 상당하더라구요.
생성형 AI 서비스의 대세는 ChatGPT입니다.
특히 ChatGPT 유료 결제를 하면 그림도 그릴 수 있고, 이미지 인식도 되고 코드도 짤 수 있고.
다양한 기능을 활용할 수 있어서 안 되는게 없다고 느껴질 정도입니다.
ChatGPT 이후 수많은 생성형 AI 서비스가 등장했고, 우리가 쉽게 접근할 수 있습니다.
그 중 대표적인 것이 마이크로소프트의 코파일럿입니다.
코파일럿이 ChatGPT보다도 더 편한, 그 이유 3가지는 다음과 같습니다.
첫째, OCR 광학 문자 인식이 굉장히 편리합니다.
ChatGPT 쓰는 것보다 훨씬 편리하고 굉장히 정확 합니다.
두 번째, 문서와의 대화가 편리합니다
웹사이트 열어놓고 웹페이지에 있는 내용이랑 대화한다. 또는 PDF 파일 열어놓고 그 내용과 대화한다.
유튜브 사이트 열어놓고 그 영상을 다 보는게 아니라 그 영상에 나온 스크립트를 파악하거나, 그 스크립트 내용에 기반을 해서
질문을 하고 대답을 듣는다.
이런 것들을 하려면 ChatGPT도 다 됩니다.
크롬 웹 스토어에서 확장 프로그램을 깔거나 ChatGPT 유료 결제하거나 하면 다 됩니다.
그런데 코파일럿으로 하면 더 편리합니다.
세 번째로 이 모든 기능이 무료라는 거죠.
추가로 설치하거나 어디 접속해야 되는게 아니라 그냥 내 PC에 깔려 있는 윈도우 상태 그대로,
이 모든 기능을 활용할 수 있다는 면에서 엄청 편리합니다.
하나씩 조금 더 자세하게 설명드리겠습니다.
우선 광학 문자 인식입니다.
마이크로소프트 코파일럿은 윈도우11에 기본 탑재되어 있습니다.
윈도우 아래쪽 작업 표시줄의 빈자리에서 우클릭을 하면 작업 표시줄 설정이 나오고 코파일럿 미리보기 기능이 있습니다.
이걸 켜면 윈도우 키 바로 옆에 코파일럿 기능이 나타납니다.
이걸 눌러 보시면 우측에 코파일럿을 쓸 수 있는 화면이 나타납니다.
OCR 기능 사용해 보겠습니다.
아무 사업자등록증을 샘플로 하나 열어봅니다.
윈도우 바탕화면 우측에 뜬 코파일럿 창에 이미지를 캡처해서 올리는 스크린샷 기능도 있고, 이미지 자체를 추가하는 기능도 있습니다.
여기다가 업로드를 시키면 사업자등록증에 쓰여진 글자를 인식하는 OCR 기능을 시킬 수 있습니다.
OpenAI의 GPT-4와 기능이 똑같습니다. GPT4 기능을 사용하면 달리3 기능을 쓸 수 있고, 이미지를 올려서 달리3에게 이미지에 나와 있는 텍스트를 입력을 해 달라고 요구를 할 수도 있죠.
하지만 GPT-4는 유료라는 거! 코파일럿은 무료로 똑같은 기능을 사용할 수 있다는 거!
캡처를 해서 코파일럿에게 'OCR 해줘' 라고 요구를 하면 이 이미지를 인식해서 광학적으로 여기 있는 캐릭터들을 다 읽어서
텍스트 값으로 반환을 해줍니다.
아시다시피 코파일럿도 GPT4의 기능을 활용하고 있기 때문에 시간이 좀 걸립니다. 사업자등록증 하나 처리하는데 1분 정도 걸리네요.
1분 정도 기다리면 OCR이 완료되는데 사업자등록번호 같은 숫자는 잘 인식을 했고요.
법인명 단체명 같은 글자는 꽤 많이 틀려버렸습니다.
코파일럿에 실망하셨나요? 자, 여기서 멈추지 말고요.
끝나지 않았습니다 !!!
코파일럿에게는 이런 아쉬움이 있었지만 윈도우가 제공하는 또 다른 기능을 찾아보겠습니다
윈도우 키 누르시고 앱을 찾아보시면 캡처 도구가 있습니다
이 툴을 이용해서 사업자등록증의 캡처 영역을 지정합니다.
여기서 주인공이 등장합니다. 캡처 도구 내에 있는 '텍스트 작업'이라는 기능입니다
이 '텍스트 작업'을 누르면 이미지 캡쳐 화면 안에 등장하는 텍스트들을 다 문자로 인식을 합니다.
이미지를 처리하는 복잡한 기능이 다 들어가 있는 것이 아니라
오로지 텍스트만 추출을 해내는 기능이라서 순식간에 이렇게 텍스트가 있는 영역과 없는 영역을 구분을 해냈습니다.
선택된 영역에서 복잡한 이미지를 처리하는 것이 아니라
그냥 학습되어 있는 글자들 중에서 가장 유사한 글자를 선택을 해서 치환하는 기능이기 때문에
글자 인식이 정확도가 훨씬 높습니다.
여기서 모든 텍스트 복사 기능이 있고요,
이걸 복사해서 다시 코파일럿에게 주면서 "이 내용을 표로 정리해달라" 이렇게 요구를 하면 되겠습니다.
이걸 Ctrl+C 해서 엑셀에서 Ctrl+V 하시면 깔끔하게 표로 삽입이 됩니 다.
코파일럿은 여러가지 이미지를 처리할 수 있지만 OCR만 놓고보면 오타가 많은 편입니다.
반면에 이 캡쳐 도구는 오로지 글자를 인식하는 기능에만 특화가 되어 있어서 정확도가 상당히 높습니다.
다음으로 넘어가 보겠습니다.
코파일럿에서는 마이크로소프트 엣지 브라우저에서 실행되고 있는 화면을 파악하고 그 내용에 대해 대화를 나눌 수 있습니다.
우선 설정에서 빙챗과 마이크로소프트 엣지 콘텐츠 공유를 '사용'으로 설정합니다.
자~ 엣지 브라우저를 열어봅니다.
엣지 브라우저를 새로 하나 열고요, CES 2024를 검색해 보겠습니다.
이렇게 많은 기사들이 나오죠. 이 중에서 특정 뉴스 기사를 들어가서 이 뉴스기사를 내가 읽어보는 것이 아니라 코파일럿에게 요약을 시켜봅니다.
우측 코파일럿 화면에서 "이 뉴스 기사 요약해 줘" 이렇게만 입력했습니다.
그럼 "활성 Microsoft Edge 탭 검색 중"이라고 뜹니다.
지금 현재 엣지에서 열려 있는 탭들 중에서 선택이 되어 있는 탭 내용을 근거로 해서 코파일럿이 일을 하는 거죠.
성남시의 CES 2024 전시회 관련 뉴스를 잘 정리해주네요.
영상 요약도 혹시 가능할까요?
유튜브로 한번 가보겠습니다.
유튜브에 접속을 하고 제 채널에 들어와 봤습니다.
자, 코파일럿을 또 새로고침해서 새로운 코파일럿 창을 열었습니다.
그리고 "유튜브 내용 요약해줘"라고 시켜봅니다.
"비디오에서 정보 검색하기" 라고 내용이 떴고요,
엣지의 활성 탭이 유튜브이니까 코파일럿이 알아서 영상 정보를 파악하네요.
결과 요약해준거를 보면,
9분 54초짜리 비디오라는 거.
에어테이블과 ChatGPT를 이용하여 글과 이미지를 자동으로 생성하고 페이스북에 포스팅하는 방법을 설명하고 있다는 거.
이렇게 요약을 잘 해주네요.
이런 요약은 ChatGPT 응용 서비스로도 가능했었죠.
크롬 웹 스토어에 있는 유튜브 요약 확장 프로그램을 설치를 하면 됩니다
크롬 웹 스토어에서 'YouTube Summary' 이렇게 검색을 해보면 많은 확장 프로그램들이 있고,
그 중에서 YouTube Summary with ChatGPT & Claude가 많이 유명하죠.
이게 설치가 되어 있으면 유튜브 채널에 가서 영상에 들어가보면 오른쪽에 Transcript & Summary라고 메뉴가 뜨게 되고요.
이게 아까 우리가 설치했던 크롬 확장 프로그램이 만들어내는 기능이고
이 영상에 나오는 이 스크립트의 전체 풀 텍스트가 위와 같이 나옵니다.
하지만 이렇게 기능을 사용하기 위해서 우리는 크롬 확장 프로그램도 깔아야 됐었죠.
Edge 브라우저에서 유튜브를 보면서 그 내용을 바로 코파일럿을 실행시켜서 이 유튜브에 대한 내용을 요약을 받아보는
이런 식으로도 활용을 할 수 있습니다.
코파일럿은 별도 설치도 없으니까 더 편하죠.
그리고 웹브라우징을 하다 보면 PDF 문서를 찾게 되는 경우도 많죠.
예를 들어서 저는 '미리 보는 CES 2024'에 대해서 삼일PWC경영연구원에서 나온 아주 양질의 자료를 찾았습니다.
이 내용을 다 읽어 보면 좋겠지만 만약에 시간이 없다면 코파일럿에게 요약을 시킬 수 있습니다.
전체는 무려 70페이지가 조금 넘는 PDF 파일인데요, PDF 파일이 열려 있는 엣지 브라우저의 탭을 활성화 시킨 다음에
코파일럿에게 'PDF 내용을 요약해 줘. 주요 내용과 결론 중심으로'라고 시켰습니다.
이번에도 "활성 Microsoft Edge 탭 검색 중"이라고 뜨면서 내용을 파악하네요.
"이 PDF는 CES 2024에 대한 미리보기 보고서입니다. 주요 내용과 결론은 다음과 같습니다"라고 하면서 내용을 잘 요약해 주었습니다.
이것처럼 윈도우에서 제공하고 있는 코파일럿이 엣지 브라우저의 내용과 연결이 되어 있기 때문에
- 우리가 엣지 브라우저에 있는 웹페이지 내용을 요약시키는 것도 할 수 있고,
- 여기에 유튜브 영상이 올라와 있을 경우에는 그 영상의 내용을 파악하거나 결론을 요약시키는 것도 할 수 있고,
- 이 엣지 브라우저에 PDF 파일이 있다면그 내용과의 대화 요약 결론 추출, 이런 것들도 할 수 있죠
우리가 ChatGPT에서 이 작업을 하려면 우선 유료 모델인 GPT4, GPT Plus 요금제를 사용을 해야 됩니다
그리고 이 PDF 파일을 다운 받아서 파일을 업로드를 시킨 다음에 대화를 했었죠.
그것과 비교해 코파일럿은 이 PDF 파일을 저장하거나 하는 과정 없이 웹에서 보고 있는 상태 그대로 대화를 할 수 있다는 면에서 상당히 매력적입니다.
그리고 가장 큰 차이는 역시나 무료라는 거죠!
ChatGPT에서 이 기능을 사용하려면 유료입니다. GPT Plus 요금제를 구독을 해야 되고요.
또는 별도의 ChatPDF, PDF.AI 이런 사이트를 이용을 해야 되는 번거로움이 있었죠.
코파일럿은 아무런 프로그램을 설치하지 않아도 되고 윈도우에 기본적으로 설치가 되어 있기 때문에
코파일럿 기능 활성화만 시키고 엣지 브라우저로 인터넷 서핑을 하면서 바로 연동된 분석을 할 수 있다는 점이 굉장히 매력적입니다
자, 어떤가요. 코파일럿 많이 사용해야겠죠?
혹시 글이 아닌 영상으로 이 내용을 듣고 싶으시다면 아래 유튜브를 링크드립니다.