네이버 알고리즘 이해 전 구글 Bert업데이트를 이해하기
'BERT'는 Bidirectional Encoder Representations from Transformers의 약자로 신경망 기반의 알고리즘 모델을 의미합니다. 이 모델은 검색어의 맥락을 더 잘 이해하고 개별 단어의 의미를 더 정확하게 해석하기 위해 도입되었습니다.
이 모델은 문장의 다른 모든 단어와 관련하여 단어를 분석하며, Google 검색 쿼리의 경우 단어의 의미를 따로 따로 보지 않습니다 이는 전치사의 의미와 검색어 내 개별 단어의 위치를 해석할 때 특히 유용하다고 합니다.
BERT의 영향은 롱테일 검색 쿼리에 영향을 미친다고 합니다. BERT는 검색창에 질문 또는 단어 그룹으로 입력되는(또는 STT 음성 검색을 통해 말해지는) 더 긴 쿼리에 대한 맥락적 해석을 개선합니다.
네이버 알고리즘
네이버 검색 알고리즘의 요소
유사성 : 검색어와 문서 내 상관 빈도 및 유사도
문서 품질 : 해당 문서에 걸린 링크의 수, 다양한 형태의 정보, 사이트의 업데이트 정도
이용자 선호도 : 해당 문서에 얼마나 많은 이용자가 방문했는지, 얼마나 오래 머물렀는지 등의 행동 패턴
구글과 같은 BERT 모델을 적용한 네이버 알고리즘
특정 브랜드를 검색할 때, 해당 브랜드 제품을 구매하고자 하는 쇼핑의도, 브랜드 홈페이지를 찾는 의도를 모두 가질 수 있음
다양한 질의 의도를 파악하기 위해 BERT 언어 모델 적용
알고리즘이 대량의 데이터 학습을 통해 단어의 문맥, 관계 등을 판단하고 예측하는 자연어 처리 모델
네이버 블로그 알고리즘의 변화
2012-13 리브라 알고리즘
리브라 알고리즘이란 약 45일 동안 하루에 1개의 글을 포스팅하면 모든 글에서 상위노출이 가능한 알고리즘
블로그 저품질화로 씨랭크 알고리즘으로 변화
2016 C-Rank(씨랭크) 알고리즘
지속적으로 양산되는 마케팅 대행사들의 다량의 최적화 블로그가 상위 노출을 조작하게 됨
네이버는 공장형 블로그를 막기 위해 C랭크 알고리즘을 발표
하나의 주 제로만 전문적으로 글을 쓴 블로그에게만 가산점을 주겠다는 것
지속성이 높은 블로거가 상위 노출되는 식
2018 DIA(다이아) 알고리즘
C-Rank를 통해 일반 유저들이 아무리 풍부한 내용과 지식으로 작성해도 상위 노출이 어려워짐 → 이를 개선하기 위해 나온 로직으로 개별 단위의 퀄리티 높은 글이 상위 노출 가
다이아로직이란 그동안 상위노출이 되었던 글도 이미지 혹은 키워드의 반복사용, 유사문서 등 저품질 글이라는 근거가 생긴다면 상위 노출을 차단하는 알고리즘
다이아 로직에서 중요한 것은 조회수가 아닌 체류시간
소비자를 위한 글 / 10개의 일상글 보다 전문성이 있는 1개의글
현재 네이버 블로그 SEO를 위한 TIP
글자 수 최소 1500-2000자 이상
이미지 최소 5개 이상 ← 사용되지 않은 이미지
동영상 최소 2개 혹은 3개 이상
유사문서, 유사 키워드 반복, 유사 이미지 방지
Topical Authority 주제를 찾아내기
C-Rank를 고려한 일관된 컨텐츠 주제로 블로그 운영
서로 이웃 및 꾸준한 상호 작용
글의 퀄리티를 높이기 위한 노력(유저들을 잡아 둘 수 있도록 전문성을 보여줄 것)
*본 글은 패스트캠퍼스 디지털 마케팅 초격차 패키지 part21. SEO 김동욱 강사님의 강의를 바탕으로 작성되었습니다.