예전의 여러 글에서 “상위 노출되는 것은 나중의 얘기이고, 일단 검색엔진에 의해 수집되는 것이 중요하다”라고 강조한 바 있다. 우리의 웹사이트나 컨텐츠가 검색엔진의 데이터베이스에 등록되어 있지 않다면, 당연히 검색엔진은 어떠한 검색 사용자에게도 우리의 웹사이트 또는 컨텐츠를 보여주지 않을 것이다.

연관된 이슈로, 페이지 자체는 수집했으나 컨텐츠의 내용을 파악할 수 없는 경우에 대해서도 언급했다. 검색 키워드로부터 사용자의 검색 의도를 파악한 검색엔진은 그 의도에 가장 부합하는 컨텐츠를 상위에 보여주는데, 내 컨텐츠의 내용을 검색엔진이 알지 못한다면 그 “의도에 부합하는 가치”를 파악하지 못하게 된다. 오늘은 뒤쪽에 언급한 검색엔진의 컨텐츠 이해도를 막는 것들에 대해 얘기하겠다.

 

검색엔진의 정보 수집 프로세스와 SEO

 

그에 앞서, 검색엔진의 프로세스에 대해 간략히 살펴보자. 개념적인 이해를 돕기 위해 비유를 사용하겠다.

1) 영화에서 FBI는 정보 수집을 위해 세계 각국에 요원을 파견한다. 2) 그 요원들은 조사 대상에게 접근하거나 지역을 다니며 다양한 정보를 수집하고, 그 정보를 본부에 보낸다. 3) 본부에 보내진 정보들은 본부의 자료실에 차곡차곡 쌓여, 4) 후에 연관된 수사가 진행될 때 관련이 있는 자료들이 다시 꺼내진다. 

이 과정을 검색엔진의 프로세스로 바꿔보자.

1) 검색엔진은 전 세계의 웹페이지들에 크롤러(Crawler. Spider라고도 부른다)라는 로봇(정확한 개념은 아니지만, 이렇게 표현하는 것이 이해가 쉽다)을 보낸다. 2) 크롤러는 개별 웹페이지를 탐색하며 정보를 수집한다. 3) 크롤러가 수집한 정보는 검색엔진의 데이터베이스에 수집된다(이 과정을 Indexing이라고 한다). 4) 사용자가 특정 단어로 검색을 하면, 검색엔진은 나름의 기준(알고리즘이라고 한다)으로 수집된 정보의 가치를 평가하고, 사용자에게 도움이 되는 컨텐츠 순으로 보여준다.

SEO는 이 프로세스에서 이 모든 과정에 관여한다. 크롤러가 1) 우리 웹페이지에 방문하도록 유도하고, 2, 3) 웹페이지 탐색에 장애가 되는 요소들을 제거하여 모든 정보가 잘 수집되도록 하며, 4) 검색엔진으로부터 우리 웹사이트와 컨텐츠가 특정 검색어에 보다 좋은 평가를 받도록 한다. 오늘 다룰 내용은 2번과 3번에 해당하는 내용이다.

 

인간 사용자 vs. 검색엔진 사용자

 

검색엔진은 컴퓨터 프로그램이니, 인간 사용자와 다른 방식으로 컨텐츠를 탐색한다. 우리는 화면에 보이는 것들을 읽는 반면, 검색엔진은 소스에 있는 것들을 읽는다.

좌측이 사람 사용자가 보는 것, 우측은 검색엔진이 보는 것.

이 개념을 반드시 이해해야만 하는 것이, 아무리 우리 눈에 보이는 정보라 하더라도 검색엔진이 읽을 수 없는 방식으로 되어 있다면 아무 의미가 없다.

 

검색엔진이 정보를 이해할 수 없는 컨텐츠들은?

 

1. 이미지 폰트

첫번째 흔히 보이는 문제는 지난 글에서도 밝힌 이미지 폰트다. 이미지 폰트란 이미지 내에 텍스트가 존재하는 것을 말한다. 레이아웃 디자인과 보다 다양한 폰트 사용 등 미적인 이슈로 흔히 사용된다. 

이미지 폰트 뿐 아니라 아래 나올 다른 모든 이슈들도 “검색엔진은 시각장애인이다”라고 생각하면 이해가 편하다. 시각 장애인은 음각 또는 양각으로 된 글자를 손으로 만져서 이해한다. 이 음각과 양각으로 된 글자를 HTML 텍스트라고 생각하면 된다. 좋은 책을 사진으로 찍는다면 우리는 사진을 통해 그 책의 내용을 파악할 수 있지만, 거기에는 시각장애인이 정보를 파악할 수 있는 음각 또는 양각으로 된 정보가 없다. 시각장애인에게는 그저 사진 한 장일 뿐이다. 

이미지 내에 있는 텍스트 정보는 HTML 텍스트가 아니다. 즉, 검색엔진에게는 단순히 “여기에 이미지 한장이 있다”는 그 이상의 정보를 제공하지 못한다.

스크린캡쳐된 이 페이지의 어떠한 텍스트 정보도 검색엔진은 읽지 못한다.

 

이미지 폰트는 상당히 많이 사용되고 있다. 

첫번째는 카드뉴스. 카드뉴스는 주목도와 가독성이 높지만, SEO 관점에서는 최악이다. 한때 카드뉴스가 널리 퍼지며 블로그 컨텐츠도 카드뉴스로 구성하는 것이 유행이었는데, 검색을 통한 방문을 목적으로 하는 블로그에 카드 뉴스를 쓰는 것은 절대로 해서는 안될 일이다. 카드 뉴스를 구성한다면, 카드뉴스 내의 정보를 텍스트로 한번 더 적어줘야 한다.

두번째는 쇼핑몰이다. 이커머스야말로 마케팅 효율성을 높이기 위한 노력을 아끼지 말아야 하는데, 현실은 매우 안타깝다. 쇼핑 플랫폼 뿐 아니라 개별 사업자의 쇼핑 사이트들도 대부분 상품 정보를 이미지 폰트로 제공하고 있다.

이미지 폰트로 제작된 쇼핑 페이지들. 검색엔진에게는 그저 이미지일 뿐이다.

이미지 폰트가 유일한 원인은 아닐 수 있으나, 구글에서 “발란스팬츠”를 검색해보면 해당 사업자의 웹사이트는 네이버 블로그보다도 낮은 순위에 위치한다.

“발란스팬츠” 구글 검색 결과

“발란스팬츠”라는 고유의 단어로 검색해도 이런데, 같은 제품에 대해 다양한 판매 채널과 경쟁하는 사업자였다면 자연검색 유입을 기대하기 어려운 수준일 것이다. 심지어 저 링크를 클릭하면 발란드팬츠 페이지가 아닌 메인 페이지를 방문하게 된다. 

 

예전에야 웹에서 사용할 수 있는 폰트가 제한적이라서 보기 좋은 컨텐츠를 만들기 위해 어쩔 수 없이 이미지 폰트를 사용했다. 그리고, 각 사용자들의 컴퓨터에 설치된 폰트가 달라 레이아웃이 흐트러지는 경우도 있었다. 그러나 이제는 웹폰트라는 것이 존재한다. 사용자가 웹페이지에 방문하는 순간 “우리가 보여주고 싶은 그 폰트”를 다운받게 된다.

애플 홈페이지에 방문한 사용자들은 자동적으로 애플의 San Francisco 폰트를 다운받게 된다. 즉, 어떠한 접속 환경에 있든 모든 사용자는 같은 폰트를 경험한다.

 

그림 위에 HTML 텍스트를 띄울 수도 있다. 특별한 기술도 아닌데, 그냥 사용하지 않을 뿐이다. 아래의 삼성 갤럭시 Z 플립 사이트를 보면, 이미지 내에 텍스트가 있는 듯 보이지만 텍스트는 이미지 위에 HTML로 존재한다.

이미지 내의 텍스트처럼 보이나 따로 선택되는 HTML 텍스트다.

 

조금의 노력만 더 들인다면 이미지 폰트 이슈를 피할 수 있다. 

 

2. 아이프레임과 AJAX

컴퓨터에 있는 영상을 빔프로젝터로 보고 있다. 우리는 커다란 스크린에 띄워진 영상을 보지만, 실제 파일은 스크린이 아닌 컴퓨터에 있다. 스크린은 빔 프로젝터에서 나온 컴퓨터의 정보를 반사하여 보여주는 것으로, 실제로 스크린에 정보가 존재하는 것은 아니다. 

 

아이프레임과 AJAX는 이런 개념이다. A 웹페이지에 존재하는 정보를 B 페이지로 불러와 보여주는 것으로, 실제 소스를 불러오는 것이 아니라 단순히 화면만을 불러오는 것이다. 즉, B 페이지에는 아무런 소스 정보가 없다. 우리는 화면을 읽으므로 당연히 정보 파악이 가능하지만, 소스가 없기 때문에 검색엔진은 아무런 정보를 파악할 수 없다. 

 

예전에 아래와 같은 사이트를 경험한 적이 있다.

페이지 내에 아이프레임 속에 또 아이프레임이 존재하는, 러시아의 마트료시카를 연상시키는 구조. 당연히 SEO 외에도 많은 문제들을 야기했다. 

 

HTML5의 활성화로 여러가지 기술적 대안들이 나왔지만, 여기에서는 다루지 않겠다. 

 

3. 플래시

이제는 거의 사용되지 않는 제작기술이지만, 그래도 언급은 하는 것이 좋을 듯 하다. 여전히 플래시로 제작된 사이트가 있으니.

아래 사이트는 정상적인 페이지로 보인다.

그러나 이 페이지의 거의 모든 정보는 플래시로 제작되어 있다. 플래시 옵션을 끄니 아래와 같이 보인다. (현재 많은 브라우저가 플래시 차단을 기본 옵션으로 한다)

제품 구매가 가능한 상세 페이지는 이렇게 보여진다.

2020년에 이런 사이트를 볼 수있다는 사실이 놀랍다. 플래시는 이미 죽었다. 이건 SEO 뿐 아니라 모든 웹 관련 테크닉에서 상식이다. 심지어 이 사이트는 여전히 살아서 업데이트되는 사이트인데, 아직까지 이 상태로 운영되는 것이 이해되지 않는다. 내가 이 사이트를 처음 본 것이 2019년 초니, “새로운 사이트가 나오기 전에 재수없게 네가 본거네”라는 변명도 통하지 않는다.

 

기술적인 이슈와 별개로 SEO에서는 플래시를 금하고 있다. 다시 시각장애인으로 비유하자면, 플래시 내에는 음각과 양각의 텍스트 정보가 있지만 그것들이 플래시라는 유리통 안에 들어가 있는 것이다. 따라서 우리 눈으로 정보를 탐색할 수는 있지만, 검색엔진에게는 그저 유리통일 뿐이다.

 

4. 동영상

이미지 내의 정보를 읽을 수 없듯, 동영상 내의 정보 역시 검색엔진에게는 무의미하다. 동영상이 페이지의 핵심 정보라면, 동영상에 대한 또는 동영상이 다루고 있는 정보를 같은 페이지 내에 텍스트로 남겨두자. 

 

최근 그로스해킹이 유행이다. 너도 나도 다른, 또 모호한 얘기들을 하지만 어찌됐건 다들 그로그해킹을 외친다. 그런데 그로스해킹을 여기저기 외치고 다니는 몇개의 회사 웹사이트를 방문해 보니, 검색엔진이 매우 싫어하는 컨텐츠 형태들이 상당히 많이 눈에 띈다. 사용자들의 가장 기본적이며 보편적이고, 지속적인 투자가 가장 덜 들어가는 자연검색 방문도 외면하면서 무슨 그로스해킹인가? 

+ Recent posts