지난 글 “검색엔진최적화에서 구조화의 중요성 - 1. URL”을 요약하자면 이렇다.

  • 책의 챕터가 잘 구성되어야 독자가 정보를 이해하기 쉽듯, 검색엔진은 페이지들의 구조화가 잘 된 웹사이트가 사용자에게 도움이 된다고 생각한다

  • 웹사이트의 구조는 눈에 보이는 메뉴가 아니라 URL의 구조를 통해 정의되고, 검색엔진에게 전달된다

  • URL 내 각 페이지의 수직, 수평적 관계는 “/“를 이용한 URL Depth에 의해 정의된다

오늘은 컨텐츠 레벨에서의 구조화를 알아보겠다.

 

아래의 두 글을 비교해보자.

예시 A는 비록 단락과 문단이 나뉘어 있으나 긴 글이 하나의 호흡으로 이어지는 반면, 예시 B는 같은 내용을 단계적 제목으로 구분하여 전달하고 있다. A와 B 중 어떤 글이 더 정보를 이해하기 쉬울까? 예시에서는 비록 한페이지의 짧은 내용을 다루고 있으나, 이것이 만약 서너배 또는 책 한권의 분량이라면? 당연히 예시 B가 사용자들이 전체 글의 흐름을 이해하고 개별 정보를 머리속에 체계적으로 담아두는데 더 도움이 된다. 그리고 이것은 검색엔진이 컨텐츠의 가치를 평가하는데 있어 가장 기본이 되는 원칙, “이 컨텐츠가 사용자에게 도움이 되는가”와 직결되는 개념이다.

 

컨텐츠를 구조화하라

 

컨텐츠의 구조화를 가장 쉽게 이해하고자 한다면 나무위키를 방문하면 된다. 위의 예 역시 나무위키의 정보인데, 나무위키의 컨텐츠는 모두 정보의 내용에 따라 단계적으로 구조화되어 있다. 

나무위키 마이클잭슨 페이지의 목차

 

컨텐츠의 구조화 방법은 검색엔진최적화라고 해서 다르지 않다. 기존에 우리가 알고 있던 “좋은 글쓰기”의 방법을 따르면 된다.

 

검색엔진최적화된 컨텐츠 구조화

 

그러나 한가지의 기술적 문제가 있다. 웹사이트의 구조화와 마찬가지로, “검색엔진이 이해할 수 있는 방식”이어야 한다는 것.

우리 눈에 보이는 중제목과 소제목을 아무리 적용해봤자 검색엔진에게는 “독립된 줄(Line)에 있는 짧고 시각적으로 구분되는 텍스트”에 불과하다. 그것이 구조화를 위해 사용된 중제목인지, 주목도를 높이기 위해 사용된 단어 또는 감탄사인지 구분할 수 없다.

 

컨텐츠의 구조를 검색엔진에게 전달하기 위해서는 Heading Tag라고 불리우는 간단한 태그를 사용한다. 

Heading Tag는 컨텐츠의 구조에서 구분 기준이 되는 단어, 문장, 또는 이미지에 적용되는데, H1이 가장 상위 구조이며 H2, H3과 같이 하위 구조로 갈수록 숫자가 커진다. 

 

H1은 책의 제목과 같다. 따라서 H1은 한 컨텐츠(웹페이지 또는 블로그 글)에서 하나만 존재해야 한다. 흔히 모든 웹페이지에 공통으로 적용되는 로고에 H1을 적용하는데, 개별 웹페이지의 H1은 해당 페이지의 전체 내용을 다루는 페이지 제목에 적용되어야 한다. 

아래의 화면을 보면, 청와대 웹사이트 내 모든 페이지에서 로고가 H1으로 지정되어 있다. 검색엔진최적화의 관점에서 본다면 이 페이지의 내용을 대표하는 “G20 특별 화상 정상회의”라는 제목에 H1이 적용되어야 한다. 물론, 로고를 H1으로 지정한다고 해서 웹사이트의 기능적 문제가 생기는 것은 아니다.

 

해당 컨텐츠의 구조화를 본격적으로 전달하는 것은 H2 이하의 Heading Tag다. H2 이하의 Heading Tag는 페이지당 1개만 사용되는 H1과 달리 복수로 사용 가능하다. H1이 책의 제목이라면, H2 이하는 장, 절, 그리고 항과 같다. 주의할 점은, 같은 레벨의 컨텐츠는 같은 레벨의 Heading Tag를 적용해야 한다는 것이다. 어떤 중제목이 H2이고, 다른 중제목이 H3가 되어서는 안된다. 모든 중제목에는 H2가 적용되고, H3는 소제목을 위한 자리다.

 

아래의 페이지를 보자.

실제 이 페이지의 Heading Tag는 이렇게 적용되어 있지 않으나, Heading Tag를 설명하기에 아주 좋은 컨텐츠다.

먼저, 이 페이지의 대표 제목인 “국정과제”가 H1으로 적절하다.

이 페이지는 국민이 주인인 정부, 더불어 잘사는 경제, 내 삶을 책임지는 국가, 고르게 발전하는 지역, 그리고 평화와 번영의 한반도라는 다섯개의 카테고리로 나뉜다. 이 컨텐츠들은 모두 한 페이지 내의 컨텐츠이며, 따라서 이들에게 중제목인 H2를 적용할 수 있다.

H2인 국민이 주인인 정부 컨텐츠는 4개의 전략으로 구분되며, 전략 1 내에는 4개의 세부 과제가 있다. 전략과 과제는 H3과 H4로 지정된다. 과제 1은 목표, 내용, 효과라는 3개의 세부 내용으로 구성되는데, 이들에게는 H5를 적용하면 된다.

 

Heading Tag를 적용하는 방법은 간단하다. 아래와 같이 소스 내의 지정 영역 앞뒤에 태그를 넣어주면 된다. 영역의 시작 부분에 <h1>을 넣고, 끝부분에는 역시 대괄호 안에 /H1을 넣어주면 된다. 

 

URL과 Heading Tag를 이용하면 웹사이트는 전체적으로 아래와 같은 구조화의 형태를 띄게 된다.

 

컨텐츠 구조화의 장점

 

사용자들은 평균적으로 웹페이지 컨텐츠의 20%만을 읽는다. 컨텐츠 방문 후 집중하는 시간은 단지 8초 정도이며, 이는 수초 이내에 사용자에게 “이 컨텐츠는 읽을 가치가 있다”는 것을 전달해야 한다. 구조화된 컨텐츠는 사용자로 하여금 컨텐츠의 전체적인 내용을 빠르게 살펴보고, 보다 흥미를 느끼게 할 것이다. 이를 통해 높아진 사용자의 만족도는 이탈률과 체류시간 등 방문지표 뿐 아니라 소셜 공유와 같은 추가적인 유입경로의 확산에 도움이 된다.

또한, 보다 나은 사용자 경험과 만족도를 제공함으로써 검색엔진으로부터 더 나은 평가를 이끌어낼 수 있다. 

“검색엔진은 사람과 보는 눈이 다르다”라고 누누히 밝혔지만, 사실 검색엔진은 많은 부분에서 사람들의 의사 결정을 모방하고 있다. "보다 인간스러움”은 모든 AI의 목표다.

특히 이것이 좋은 컨텐츠인가에 대한 검색엔진의 관점은 거의 완벽하게 사람들의 시선과 일치한다. 검색엔진최적화의 테크닉은 이것과 관련되어 있거나, 이것을 검색엔진에게 보다 잘 전달하기 위한 방법들이다.

 

검색엔진의 입장에서 좋은 컨텐츠란 무엇일까? 특정 키워드를 검색한 사람을 대상으로, 이 컨텐츠를 제공해줬을 때 사용자가 만족하는 것이다. 사용자의 만족도는 단순히 컨텐츠의 품질로 결정될까? 웹사이트의 속도, 모바일에서 버튼과 텍스트의 크기, 정보의 다양성, 관련된 정보의 연관 탐색 등등 수많은 사용자 경험 요소들이 사용자의 만족도에 영향을 미친다. 그래서 검색엔진최적화에서 사이트 로딩 속도, 링크간의 거리, 사진과 동영상 등의 포함여부, 링크 등을 다루는 것이다. 오늘은 이 수많은 검색엔진최적화 요소 중 웹사이트의 구조화를 다루고자 한다.

 

여기 이순신 장군이라는 동일한 주제를 다루는 두권의 책이 있다. A는 “이순신에 대하여”라는 제목만 있을 뿐, 내용에서는 별도의 챕터 구분이 없다. B는 제목은 동일하지만 아래와 같이 세부 챕터를 갖고 있다.

 

제목: 이순신에 대하여

1장: 이순신의 유년시절

 1절: 이순신의 출생

 2절: 어린 이순신

2장: 이순신의 청년기

3장: 과거 급제와 전장에서의 활약

….

6장: 이순신의 눈부신 업적

7장: 이 시대의 우리가 이순신을 돌아봐야 하는 이유

 

어떤 책이 독자들에게 내용을 잘 전달할까?

사람의 머리는 모든 걸 한번에 담아두고 정리하지 못한다. 정보를 세부 주제에 따라 별도의 수납함에 정리하게 되는데, 당연히 정보의 제공 단계에서 주제가 구분되는 것이 효율적이다.

 

웹사이트에도 수많은 정보가 있다. 그 모든 정보들이 한 페이지에 모두 들어있는 것이 아니라, 주제에 따라 분류되어 있다. 모든 내용이 한 페이지에 들어 있다면 사용자들이 읽거나 이해하기 힘들 것이고, 이해에 앞서 많은 사용자들이 이탈하게 될 것이다. 이러한 이유로 연관된 주제에 따라 페이지를 구분하여 제작한다. 그리고 그 분류는 메뉴에 잘 반영되어 있다. 하지만 메뉴는 인간 사용자를 위한 것이며, 검색엔진에게 그 분류를 전달하기 위해서는 다른 요소가 필요하다.

 

 

일상에서 접하는 구조화의 예

 

회사의 예를 들어보자

매드타임스/편집부/기자1

매드타임스/편집부/기자2

매드타임스/인사부/직원1

매드타임스/영업부/직원2

조직도가 이렇게 구조화되어 있다면 어떤 직원이 어떤 일을 하는지 파악하기 쉬울 것이며, 어떤 업무를 위해 어떤 직원에게 연락해야 하는지도 쉽게 알 수 있다.

하지만 아래와 같이 조직도가 구성되어 있다면 어떨까?

매드타임스/기자1

매드타임스/기자2

매드타임스/직원1

매드타임스/직원3

 

또한 조직 내에는 직급도 존재한다.

미팅에 참석했는데 매드타임스의 모든 기자가 “기자”라는 타이틀을 갖고 있다면, 누가 책임자인지 알 수 없게 된다. 구조화에는 단순히 주제별 분류 뿐 아니라, 상하위 서열이 존재해야 한다. 위의 구조화를 직급으로 표현한다면 아래와 같다.

대표이사/편집부장/기자1

대표이사/편집부장/기자2

대표이사/인사부장/직원1

이를 통해 우리는 편집부장이 편집부 기자들 모두와 관련된 일을 하며, 직원1은 인사부장의 업무를 돕는다는 것을 알 수 있다.

 

 

검색엔진최적화를 위한 URL의 구조화란?

 

웹사이트 내 페이지들의 수직/수평 구조를 파악하기 위하여 검색엔진은 URL을 이용한다. URL이 어떻게 구성되어 있는가에 따라 그 페이지가 어떤 주제의 상/하위 페이지이며 어떤 페이지들과 주제를 공유하고 있는지를 파악한다.

 

일반적인 URL은 아래와 같이 구성된다.

도메인.com/1단계분류/2단계분류/페이지1.html

도메인.com/1단계분류/2단계분류/페이지2.html

검색엔진은 이 URL로부터 특정 페이지가 어느 주제의 카테고리이며, 어느 페이지와 인접한 주제인지 파악한다.

웹사이트의 페이지들 역시 이렇게 구조화되어야 하며, 그 관계는 메뉴 뿐 아니라 URL에 반영되어야 한다.

쉽게 요약하자면, 각 웹페이지의 레벨은 /로 구분되어야 하며, 같은 / 레벨에는 컨텐츠 구조에서 같은 레벨에 속한 페이지가 위치해야 한다.

아래 두개의 URL 구조를 비교해보자.

도표의 계층은 웹페이지의 계층이며, 그 안에 URL이 기재되어 있다.

좌측의 URL 구조는 웹페이지의 계층 구조를 반영하고 있다. 신발과 의류라는 카테고리 페이지는 2 Depth, 하위의 제품군 페이지는 3 Depth의 URL 구조를 갖추고 있다.

또한 농구화와 축구화는 신발이라는 카테고리 페이지를 상위에 공유하고 있다.

편의상 제품군을 최하 계층의 페이지로 표현했지만, 개별 제품군 페이지의 경우 아디다스.com/신발/농구화/게임토커.html 이렇게 구성될 것이다.

반면 오른쪽의 URL은 카테고리 페이지와 제품군 페이지 모두 2 Depth의 URL로 구성되어 있다. 이는 웹페이지의 계층 구조와 상이하며, 검색엔진은 최상위 도메인 페이지(메인페이지)를 제외한 모든 페이지가 같은 레벨에서 존재한다고 생각할 것이다.

당연히 좌측의 URL 구조가 검색엔진최적화에서 권장되는 형태다.

 

마지막으로 마케팅 관련 매체인 매드타임스의 URL을 예로 살펴보자.

메인: http://www.madtimes.org/

Trends 메인: http://www.madtimes.org/news/articleList.html?sc_section_code=S1N37&view_type=sm

Trends-Watch 메인: http://www.madtimes.org/news/articleList.html?sc_sub_section_code=S2N80&view_type=sm

Trends-Watch 기사: http://www.madtimes.org/news/articleView.html?idxno=4139

메뉴에서는 이 네 페이지가 수직 구조를 갖추고 있다. 하지만 URL을 살펴보면, Trends의 메인, Trends 내 세부 주제인 Watch의 메인, 그리고 구조에서 제일 하단에 있는 기사 모두 http://www.madtimes.org/news/articleList.html에서 Depth(“/“로 구분되는 URL의 단위)가 끝나는, 모두 동일한 Depth를 갖고 있다. 단순히 그 뒤에 파라미터로 페이지가 구분될 뿐인데, 파라미터는 URL의 구조를 정의하지 못한다. 직급 구분이 없이 모두 수평 구조로 나열된 것이라 말할 수 있으며, 이 URL 구조는 아래와 같이 개선되어야 한다.

메인: http://www.madtimes.org/

Trends 메인: http://www.madtimes.org/news/trends

Trends-Watch 메인: http://www.madtimes.org/news/trends/watch

Trends-Watch 기사: http://www.madtimes.org/news/trends/watch/기사페이지

 

마지막으로 한번 더 강조하자면, 검색엔진은 사용자가 탐색하고 이해하기 쉽게 구조화된 웹사이트를 좋아한다. 그리고 그 구조는 URL을 통해 전달되므로 절대로 소흘하게 여겨서는 안된다.

지난 글에서 검색엔진이 컨텐츠의 정보를 읽지 못하게 만드는 장애요인들을 살펴봤다. 오늘은 컨텐츠에 대한 검색엔진의 접근 자체를 막는 대표적인 요소들을 살펴보고자 한다. 

[지난 글 보기] - 검색엔진의 눈을 가리는 웹사이트 - 1. 컨텐츠

 

1. URL

 

검색엔진최적화에서 URL은 생각보다 훨씬 더 중요하다. URL은 많은 검색엔진최적화 컨설턴트들이 웹사이트 분석시 제일 먼저 확인하는 요소 중 하나이며, 구조화와 타겟 키워드 등 다양한 측면에서의 최적화가 필요하다.

 

URL의 가장 기본적이며 중요한 역할은 “검색엔진에게 웹사이트 내 페이지들을 안내하는 이정표” 역할을 수행한다는 것이다. 반대로 URL로 인해 검색엔진이 개별 웹페이지들을 인식하지 못하게 될 수도 있다. 

URL에 대해서는 하나의 컨텐츠를 별도로 작성해야 할 정도지만, 오늘은 단 하나만 기억하자. 

“#는 나쁘다”

소셜미디어의 해시태그로 인해 더없이 친숙한 #지만, URL에서의 #는 매우 나쁘다. 

 

검색엔진은 # 뒤의 정보를 읽지 못한다.

여기 여러 페이지의 URL들이 있다. 

도메인.com/aaa/#a

도메인.com/aaa/#b

도메인.com/aaa/#c

도메인.com/aaa/#d

분명 우리 눈에는 4개의 분리된 페이지들인데, 검색엔진에게는 도메인.com/aaa까지만 인식된다. # 뒤의 정보를 읽지 못하기 때문이다. URL 단위로 페이지를 수집하여 보여주는 검색엔진이 개별 페이지를 분리해서 인식하지 못한다는 것은 큰 문제가 된다.

 

URL이 이렇게 구성되는 가장 흔하고 쉬운 예는 탭으로 컨텐츠를 구분하여 보여주는 페이지다. 

아래와 같은 구조의 웹사이트를 예로 들자면, 1의 메뉴를 클릭했을 때 2의 영역은 바뀌지 않고 3의 영역만 바뀌는 구조다.

디자인적 예시일 뿐, 실제 삼성반도체 미국의 사이트는 아무런 문제가 없다

 

페이지를 이렇게 구성하는 기획자의 가장 큰 논리는 사용자 편의성이다. 굳이 모든 페이지를 다시 로딩하지 않고 하단의 페이지만 바꿈으로써 사용자들의 편의성을 높인다는 것인데, 의미가 없는 말은 아니지만 다시 생각해볼 필요가 있다.

첫째, 페이지 전체를 로딩하는 경험(페이지를 새로 이동한다는 느낌)이 정말로 사용자에게 불편함을 주는가? 물론, 페이지를 이동할 때마다 절반 이상의 트래픽이 이탈한다는 연구 결과가 있긴 하지만 전체 리로딩과 부분 교체 사이에 유의미한 차이가 있을까? 

둘째, 상단의 정보를 다시 로딩하기 위해 걸리는 시간이 사용자 편의성을 해칠 정도인가? 그 정도로 열악한 인터넷 환경이 얼마나 될 것이며, 만일 로딩 시간이 이슈라면 그 시간을 줄이기 위한 페이지 최적화가 우선이 아닐까?

셋째, 사용자 편의성이 높아진다고 가정하면, 그것이 과연 검색노출 제한과 맞바꿀 정도의 가치인가?

 

긴 페이지 내의 특정 부분으로 바로 이동하게 만드는 용도로 #를 사용하는 경우도 있는데, 해당 페이지의 대표 주소를 #로 막아버리지만 않는다면 이 경우는 큰 문제가 되지 않는다.

 

부득히하게 #를 사용하는 경우 #!와 같이 !를 분이는 방법(hashbang이라고 부른다)이 있으나, 활용이 제한적이며 기술적인 설명이 필요하니 본 글에서 다루지는 않겠다. 

 

 

2. Robots.txt, Noindex Tag

 

Robots.txt 파일은 검색엔진의 수집 활동을 제어하는 역할을 한다. 웹사이트 내에는 검색 결과에 드러나서는 안되는 페이지들은 존재한다. 각 회원의 개인정보 페이지나 보안 자료, 그리고 어드민 관련 페이지들이 대표적이다. 또한 웹사이트 내에는 “서버에서는 삭제하지는 않지만 사람들이 방문해서는 안되는 옛날 페이지”들이 존재하기도 한다. 이러한 페이지들은 Robots.txt 파일을 통해 검색엔진의 접근을 차단할 수 있다.

 

아래의 Robots.txt 파일 예를 보자

User-agent: *

Disallow: /admin

Disallow: /member

User-agent: Baiduspider

Disallow: /

 

이 파일은 두개의 정보를 담고 있다.

먼저, 모든 검색엔진에 대해(User-agent: *) /admin과 /member에 속한 모든 페이지에 접근하지 말라고 전달(Disallow)한다.

또한 바이두(User-agent: Baiduspider)는 모든 페이지에 접근하지 않도록 명령(Disallow: /)한다.

 

흔하지 않지만 간혹 아래와 같은 Robots.txt 파일이 올려져 있는 것을 보게 된다.

User-agent: *

Disallow: /

모든 검색엔진(User-agent: *)은 이 사이트의 모든 페이지에 접근하지 말라(Disallow: /)는 것이다. 이런 요구를 전달하고 있으니, 당연히 검색엔진은 해당 사이트의 정보를 가져가지 않는다.

 

Noindex 태그는 각 페이지에 적용되어 검색엔진의 인덱싱을 차단하는데, 이 역시 불필요하게 사용되어서는 안된다. 

 

 

3. Redirect

 

A라는 페이지로 방문한 사용자를 B 페이지로 자동으로 보내는 것을 리다이렉트라고 한다. 웹사이트 개편이나 다른 수많은 이유로 아주 흔히 사용되는 방법인데, 어떤 식으로 해도 사용자에게는 문제가 없지만 검색엔진 대상으로는 약간의 주의가 필요하다.

먼저, 리다이렉트는 301과 302라는 두개의 방식이 있다. 301은 영구, 302는 임시라는 것만 알아두자.

 

A 페이지가 영원히 없어져서 기존에 블로그 또는 소셜에 공유된 A 페이지 링크를 클릭한 사람들을 B 페이지로 안내해야 한다면 301이 적용되어야 한다. 그러나 A 페이지의 내용 또는 디자인적 개편 기간 동안에만 임시로 B 페이지로 사람들을 안내한다면 여기에는 302 방식의 리다이렉트가 적용되어야 한다. 

 

조금 더 이해하기 쉬운 우리 일상 생활의 예를 들어보자.

301: 이번에 다른 집으로 이사를 한다. 따라서 주민등록상의 내 주소를 바꿔야 하며, 공식적으로 나의 주소는 바뀌게 된다.

302: 리모델링 하는 한달 동안만 근처의 오피스텔에서 생활한다. 한달 후에 다시 원래 집으로 돌아가므로, 주민등록상의 주소를 바꾸지 않는다. 쇼핑 배송 주소는 임시로 바꾸겠지만, 공식적인 나의 주소는 바뀌지 않는다.

 

공식적으로 웹페이지의 주소가 바뀌는 경우(301 리다이렉트) 검색엔진은 바뀐 주소를 검색 결과 화면에 노출할 것이다. 그러나 임시로 리다이렉트를 적용하면(302) 검색엔진은 기존의 페이지 주소를 수집한다. 따라서 어떤 페이지 주소를 검색엔진에 등록할 것인가에 따라 리다이렉트 방식을 적용해야 한다.

예전의 여러 글에서 “상위 노출되는 것은 나중의 얘기이고, 일단 검색엔진에 의해 수집되는 것이 중요하다”라고 강조한 바 있다. 우리의 웹사이트나 컨텐츠가 검색엔진의 데이터베이스에 등록되어 있지 않다면, 당연히 검색엔진은 어떠한 검색 사용자에게도 우리의 웹사이트 또는 컨텐츠를 보여주지 않을 것이다.

연관된 이슈로, 페이지 자체는 수집했으나 컨텐츠의 내용을 파악할 수 없는 경우에 대해서도 언급했다. 검색 키워드로부터 사용자의 검색 의도를 파악한 검색엔진은 그 의도에 가장 부합하는 컨텐츠를 상위에 보여주는데, 내 컨텐츠의 내용을 검색엔진이 알지 못한다면 그 “의도에 부합하는 가치”를 파악하지 못하게 된다. 오늘은 뒤쪽에 언급한 검색엔진의 컨텐츠 이해도를 막는 것들에 대해 얘기하겠다.

 

검색엔진의 정보 수집 프로세스와 SEO

 

그에 앞서, 검색엔진의 프로세스에 대해 간략히 살펴보자. 개념적인 이해를 돕기 위해 비유를 사용하겠다.

1) 영화에서 FBI는 정보 수집을 위해 세계 각국에 요원을 파견한다. 2) 그 요원들은 조사 대상에게 접근하거나 지역을 다니며 다양한 정보를 수집하고, 그 정보를 본부에 보낸다. 3) 본부에 보내진 정보들은 본부의 자료실에 차곡차곡 쌓여, 4) 후에 연관된 수사가 진행될 때 관련이 있는 자료들이 다시 꺼내진다. 

이 과정을 검색엔진의 프로세스로 바꿔보자.

1) 검색엔진은 전 세계의 웹페이지들에 크롤러(Crawler. Spider라고도 부른다)라는 로봇(정확한 개념은 아니지만, 이렇게 표현하는 것이 이해가 쉽다)을 보낸다. 2) 크롤러는 개별 웹페이지를 탐색하며 정보를 수집한다. 3) 크롤러가 수집한 정보는 검색엔진의 데이터베이스에 수집된다(이 과정을 Indexing이라고 한다). 4) 사용자가 특정 단어로 검색을 하면, 검색엔진은 나름의 기준(알고리즘이라고 한다)으로 수집된 정보의 가치를 평가하고, 사용자에게 도움이 되는 컨텐츠 순으로 보여준다.

SEO는 이 프로세스에서 이 모든 과정에 관여한다. 크롤러가 1) 우리 웹페이지에 방문하도록 유도하고, 2, 3) 웹페이지 탐색에 장애가 되는 요소들을 제거하여 모든 정보가 잘 수집되도록 하며, 4) 검색엔진으로부터 우리 웹사이트와 컨텐츠가 특정 검색어에 보다 좋은 평가를 받도록 한다. 오늘 다룰 내용은 2번과 3번에 해당하는 내용이다.

 

인간 사용자 vs. 검색엔진 사용자

 

검색엔진은 컴퓨터 프로그램이니, 인간 사용자와 다른 방식으로 컨텐츠를 탐색한다. 우리는 화면에 보이는 것들을 읽는 반면, 검색엔진은 소스에 있는 것들을 읽는다.

좌측이 사람 사용자가 보는 것, 우측은 검색엔진이 보는 것.

이 개념을 반드시 이해해야만 하는 것이, 아무리 우리 눈에 보이는 정보라 하더라도 검색엔진이 읽을 수 없는 방식으로 되어 있다면 아무 의미가 없다.

 

검색엔진이 정보를 이해할 수 없는 컨텐츠들은?

 

1. 이미지 폰트

첫번째 흔히 보이는 문제는 지난 글에서도 밝힌 이미지 폰트다. 이미지 폰트란 이미지 내에 텍스트가 존재하는 것을 말한다. 레이아웃 디자인과 보다 다양한 폰트 사용 등 미적인 이슈로 흔히 사용된다. 

이미지 폰트 뿐 아니라 아래 나올 다른 모든 이슈들도 “검색엔진은 시각장애인이다”라고 생각하면 이해가 편하다. 시각 장애인은 음각 또는 양각으로 된 글자를 손으로 만져서 이해한다. 이 음각과 양각으로 된 글자를 HTML 텍스트라고 생각하면 된다. 좋은 책을 사진으로 찍는다면 우리는 사진을 통해 그 책의 내용을 파악할 수 있지만, 거기에는 시각장애인이 정보를 파악할 수 있는 음각 또는 양각으로 된 정보가 없다. 시각장애인에게는 그저 사진 한 장일 뿐이다. 

이미지 내에 있는 텍스트 정보는 HTML 텍스트가 아니다. 즉, 검색엔진에게는 단순히 “여기에 이미지 한장이 있다”는 그 이상의 정보를 제공하지 못한다.

스크린캡쳐된 이 페이지의 어떠한 텍스트 정보도 검색엔진은 읽지 못한다.

 

이미지 폰트는 상당히 많이 사용되고 있다. 

첫번째는 카드뉴스. 카드뉴스는 주목도와 가독성이 높지만, SEO 관점에서는 최악이다. 한때 카드뉴스가 널리 퍼지며 블로그 컨텐츠도 카드뉴스로 구성하는 것이 유행이었는데, 검색을 통한 방문을 목적으로 하는 블로그에 카드 뉴스를 쓰는 것은 절대로 해서는 안될 일이다. 카드 뉴스를 구성한다면, 카드뉴스 내의 정보를 텍스트로 한번 더 적어줘야 한다.

두번째는 쇼핑몰이다. 이커머스야말로 마케팅 효율성을 높이기 위한 노력을 아끼지 말아야 하는데, 현실은 매우 안타깝다. 쇼핑 플랫폼 뿐 아니라 개별 사업자의 쇼핑 사이트들도 대부분 상품 정보를 이미지 폰트로 제공하고 있다.

이미지 폰트로 제작된 쇼핑 페이지들. 검색엔진에게는 그저 이미지일 뿐이다.

이미지 폰트가 유일한 원인은 아닐 수 있으나, 구글에서 “발란스팬츠”를 검색해보면 해당 사업자의 웹사이트는 네이버 블로그보다도 낮은 순위에 위치한다.

“발란스팬츠” 구글 검색 결과

“발란스팬츠”라는 고유의 단어로 검색해도 이런데, 같은 제품에 대해 다양한 판매 채널과 경쟁하는 사업자였다면 자연검색 유입을 기대하기 어려운 수준일 것이다. 심지어 저 링크를 클릭하면 발란드팬츠 페이지가 아닌 메인 페이지를 방문하게 된다. 

 

예전에야 웹에서 사용할 수 있는 폰트가 제한적이라서 보기 좋은 컨텐츠를 만들기 위해 어쩔 수 없이 이미지 폰트를 사용했다. 그리고, 각 사용자들의 컴퓨터에 설치된 폰트가 달라 레이아웃이 흐트러지는 경우도 있었다. 그러나 이제는 웹폰트라는 것이 존재한다. 사용자가 웹페이지에 방문하는 순간 “우리가 보여주고 싶은 그 폰트”를 다운받게 된다.

애플 홈페이지에 방문한 사용자들은 자동적으로 애플의 San Francisco 폰트를 다운받게 된다. 즉, 어떠한 접속 환경에 있든 모든 사용자는 같은 폰트를 경험한다.

 

그림 위에 HTML 텍스트를 띄울 수도 있다. 특별한 기술도 아닌데, 그냥 사용하지 않을 뿐이다. 아래의 삼성 갤럭시 Z 플립 사이트를 보면, 이미지 내에 텍스트가 있는 듯 보이지만 텍스트는 이미지 위에 HTML로 존재한다.

이미지 내의 텍스트처럼 보이나 따로 선택되는 HTML 텍스트다.

 

조금의 노력만 더 들인다면 이미지 폰트 이슈를 피할 수 있다. 

 

2. 아이프레임과 AJAX

컴퓨터에 있는 영상을 빔프로젝터로 보고 있다. 우리는 커다란 스크린에 띄워진 영상을 보지만, 실제 파일은 스크린이 아닌 컴퓨터에 있다. 스크린은 빔 프로젝터에서 나온 컴퓨터의 정보를 반사하여 보여주는 것으로, 실제로 스크린에 정보가 존재하는 것은 아니다. 

 

아이프레임과 AJAX는 이런 개념이다. A 웹페이지에 존재하는 정보를 B 페이지로 불러와 보여주는 것으로, 실제 소스를 불러오는 것이 아니라 단순히 화면만을 불러오는 것이다. 즉, B 페이지에는 아무런 소스 정보가 없다. 우리는 화면을 읽으므로 당연히 정보 파악이 가능하지만, 소스가 없기 때문에 검색엔진은 아무런 정보를 파악할 수 없다. 

 

예전에 아래와 같은 사이트를 경험한 적이 있다.

페이지 내에 아이프레임 속에 또 아이프레임이 존재하는, 러시아의 마트료시카를 연상시키는 구조. 당연히 SEO 외에도 많은 문제들을 야기했다. 

 

HTML5의 활성화로 여러가지 기술적 대안들이 나왔지만, 여기에서는 다루지 않겠다. 

 

3. 플래시

이제는 거의 사용되지 않는 제작기술이지만, 그래도 언급은 하는 것이 좋을 듯 하다. 여전히 플래시로 제작된 사이트가 있으니.

아래 사이트는 정상적인 페이지로 보인다.

그러나 이 페이지의 거의 모든 정보는 플래시로 제작되어 있다. 플래시 옵션을 끄니 아래와 같이 보인다. (현재 많은 브라우저가 플래시 차단을 기본 옵션으로 한다)

제품 구매가 가능한 상세 페이지는 이렇게 보여진다.

2020년에 이런 사이트를 볼 수있다는 사실이 놀랍다. 플래시는 이미 죽었다. 이건 SEO 뿐 아니라 모든 웹 관련 테크닉에서 상식이다. 심지어 이 사이트는 여전히 살아서 업데이트되는 사이트인데, 아직까지 이 상태로 운영되는 것이 이해되지 않는다. 내가 이 사이트를 처음 본 것이 2019년 초니, “새로운 사이트가 나오기 전에 재수없게 네가 본거네”라는 변명도 통하지 않는다.

 

기술적인 이슈와 별개로 SEO에서는 플래시를 금하고 있다. 다시 시각장애인으로 비유하자면, 플래시 내에는 음각과 양각의 텍스트 정보가 있지만 그것들이 플래시라는 유리통 안에 들어가 있는 것이다. 따라서 우리 눈으로 정보를 탐색할 수는 있지만, 검색엔진에게는 그저 유리통일 뿐이다.

 

4. 동영상

이미지 내의 정보를 읽을 수 없듯, 동영상 내의 정보 역시 검색엔진에게는 무의미하다. 동영상이 페이지의 핵심 정보라면, 동영상에 대한 또는 동영상이 다루고 있는 정보를 같은 페이지 내에 텍스트로 남겨두자. 

 

최근 그로스해킹이 유행이다. 너도 나도 다른, 또 모호한 얘기들을 하지만 어찌됐건 다들 그로그해킹을 외친다. 그런데 그로스해킹을 여기저기 외치고 다니는 몇개의 회사 웹사이트를 방문해 보니, 검색엔진이 매우 싫어하는 컨텐츠 형태들이 상당히 많이 눈에 띈다. 사용자들의 가장 기본적이며 보편적이고, 지속적인 투자가 가장 덜 들어가는 자연검색 방문도 외면하면서 무슨 그로스해킹인가? 

한달 술값으로도 제작이 가능한 것이 웹사이트지만, 모든 분야에서의 제대로 된 품질과 특히나 안정적인 유지보수를 위해서는 작게는 몇천, 크게는 몇억의 비용이 든다. 이렇게 많은 비용과 시간, 그리고 노력이 들어간 웹사이트 또는 개별 웹페이지가 검색에 나오지 않는 경우, 간단하게 확인 및 조치할 사항에 대해 알아보자.

초보자 레벨로 알려줄거니까 차근차근 따라해봐.

 

검색 엔진이 알아서 해주겠지?

웹사이트를 만든다고 검색엔진이 알아서 수집하고 상위에 노출시켜줄 것이라는 생각은 버려라. 걔들 의외로 허술하고, 또 바쁘다. 내 돈이 많이 들어갔다고 해서 고작 내 사이트 정도를 하나하나 챙겨주지 않는다.

또한 웹사이트 내의 모든 페이지를 수집해서 보여주는 것도 아니다. 메인 페이지만 수집되었을 경우도 있고, 정작 중요한 페이지는 하나도 수집되지 않은 채 쓸데없는 약관 페이지들이나 상위에 노출되는 경우도 흔하다.

검색엔진님께서 알아서 긁어가시기 전에, 내가 더 할 일은 없는지 찾아봐야 한다.

 

수집은 되고 있나?

검색 엔진은 개별 사이트와 웹페이지에 대한 정보를 살핀 후 도서관의 도서카드와 같이 색인목록을 만든다. 이를 Index한다고 부른다. 내가 찾는 책이 그 도서관에 없다면 색인에도 없겠지? 달리 말하자면 사람들이 아무리 찾아도 그 도서관의 색인목록에 들어있지 않은 책은 사람들에게 보여주지 않는다. 검색엔진 역시 마찬가지다. 자신의 DB에 수집되지 않은 사이트/페이지는 검색 결과에 보여주지 않는다.

따라서 제일 먼저 할 일은 내 사이트 또는 페이지가 검색엔진에 잘 수집되어 있는지 확인하는 것이다.

"site:주소"명령어를 검색창에 치면, URL에 해당 주소를 포함한 모든 웹페이지를 보여준다. 물론, 그 검색엔진에 수집된 페이지들이다.

이렇게 사용하면 된다

특정 페이지, 특히 새로 업데이트된 페이지가 수집되어 있는지 확인한다면 site:뒤에 해당 페이지의 주소를 넣으면 된다. 검색 결과에 나오지 않는다면 해당 페이지는 수집되지 않은 것이다.

네이버는... 어... 음...

이 개자슥들아

웹사이트 영역으로 이동하면 된다. 꼭 이래야만 속이 시원했냐?

 

검색 엔진에 수집이 안 되어 있으면 어떡해야 하지?

뭘 어떡하냐. 수집하라고 시켜야지.

사이트의 등록

모든 검색엔진은 웹사이트 담당자와 검색엔진의 커뮤니케이션을 위한 도구를 제공한다. 검색엔진마다 서비스의 이름이 다르긴 하지만 "웹마스터도구(Webmaster Tools)"라고 하면 다 알아듣는다.

구글: 구글 서치 콘솔 (https://search.google.com/search-console)

네이버: 네이버 서치 어드바이저 (https://searchadvisor.naver.com/)

빙: 빙 웹마스터 도구 (https://www.bing.com/toolbox/webmaster)

사용법은 대동소이한데, 네이버로 설명을 하겠다.

먼저, 웹마스터 도구에 사이트를 추가한다.

네이버 서치 어드바이저 사이트 추가 화면

다음으로 소유권 확인을 진행한다. 이게 내꺼라는 인증이 필요하잖아?

네이버 서치 어드바이저 사이트 소유 확인 화면

티스토리나 워드프레스와 같이 서버 루트 폴더에 HTML 파일을 올릴 수 없는 경우, 두번째 옵션인 HTML 태그를 선택하면 된다. 블로그 소스에 해당 태그를 넣어서 인증하는 것이다.

이러면 기본적으로 검색엔진에게 "우리 사이트 여기 있어요~"라고 알리게 되고, 검색엔진이 찾아와 정보를 수집하게 된다.

sitemap.xml

그러나 검색엔진이 찾아온다고 해서 모든 페이지를 꼼꼼하게 다 수집해주는 것은 아니다. 종종 일부 페이지가 누락되는 경우가 생기고, 시의성 있게 새로 올린 컨텐츠가 빠르게 수집되지 않는 일도 있다.

이 경우, 우리 사이트에 대한 일종의 "안내도"를 제공하여 검색엔진이 페이지를 빠뜨리는 일 없이, 그리고 새로 올라온 컨텐츠에 대해서도 빠르게 수집하도록 요청할 수 있다. 이 안내도를 sitemap.xml 파일이라 부른다. 우리가 흔히 웹사이트에서 부르는 사이트맵에 사용자를 위한 웹사이트 안내 지도라고 한다면, 이 sitemap.xml은 검색엔진을 위한 안내도이다.

sitemap.xml 파일은 형식에 맞게 직접 작업할 수도 있고, 자동 도구를 사용할 수도 있다. 구글에 sitemap generator를 검색하면 많은 무료 도구들이 나오는데, 무료 도구들의 경우 sitemap.xml 파일 내에 포함되는 URL의 숫자가 제한되지만 소규모 웹사이트에서는 충분히 활용할 수 있다.

sitemap.xml 파일의 예

이렇게 만들어진 sitemap.xml 파일을 서버에 올린 후, 웹마스터 도구 내에 이 파일의 주소를 등록하면 된다.

네이버 서치 어드바이더 사이트맵 제출 화면

 웹사이트를 위한 안내도는 sitemap.xml 파일 뿐 아니라 rss 파일로도 제공 가능하다.

sitemap.xml 파일을 업데이트하지 않고 특정 URL에 대한 수집을 개별적으로 요청할 수도 있으니, 여러 기능을 꼼꼼하게 확인하자.

네이버 서치 어드바이저 개별 웹페이지 수집 요청 화면

여기까지 했는데도 사이트나 페이지가 수집되지 않는다?

그때는 robots.txt나 URL 자체의 기술적 문제를 생각해봐야 하는데, 그 얘기는 오늘은 안해주지롱.

 

 URL은 수집 되었는데 검색하면 죽어도 안나와부러

분명 site:을 해보면 수집이 되어 있다. 그런데 아무리 검색해도, 심지어 내 컨텐츠에 있는 내용을 검색창에 그대로 복붙해도 검색결과에 나오지 않는다. 

그럼 무엇을 봐야 할까. 

 

검색엔진은 사람이 아니다. 우리는 모니터에 보이는 화면을 읽지만, 검색엔진은 그 화면 너머에 있는 소스를 읽는다.

우리 눈에 보이는 요소들이 검색엔진은 읽을 수 없는 방식으로 되어 있다면? 검색엔진은 그 페이지가 무슨 내용인지 모른다. 무슨 내용인지 모르니, DB에 인덱스는 되어 있지만 검색결과에 보여주지 않는다. 검색엔진은 사용자가 검색창에 입력한 키워드와 관련있는 컨텐츠를 보여주는 거거든.

그런데 상당히 많은 경우, 검색엔진이 읽을 수 없는 형태로 정보를 전달하고 있다. 대표적인 경우가 "이미지폰트"라고 부르는 것이다.

이미지 폰트란, 지금 여러분이 읽고 있는 이러한 HTML 텍스트가 아니라 이미지 내에 텍스트를 넣는 것이다. 이렇게 하면 글자에 여러 효과도 넣을 수 있고, 귀찮게 웹폰트 안 불러오고 멋진 폰트도 쓸 수 있고, 이미지와 텍스트도 자연스럽게 섞어서 쓸 수 있다. 하지만 이렇게 하면 아무리 멋진 말을, 유용한 정보를 넣어도 검색엔진에게는 image1.jpg일 뿐, 그 안의 정보는 전달되지 않는다. 

대표적인 경우가 카드뉴스이다. 카드뉴스는 가독성이 뛰어나 정보 전달 능력이 우수하지만, 검색엔진에게는 그저 몇장의 이미지일 뿐이다. 따라서 소셜 채널이라면 모를까 웹사이트나 블로그에는 사용을 지양하는 것이 좋으며, 굳이 사용한다면 같은 페이지 내에 텍스트로 풀어서 정보를 전달해야 한다. 

검색엔진에게는 그저 한장의 이미지일 뿐

이제는 거의 사용되지 않지만, Flash 역시 검색엔진의 탐색을 가로막는 대표적인 형태이며, AJAX나 iFrame 등등도 마찬가이지다. 

iFrame의 문제는 애플에서 제공하는 사이드카 기능으로 설명하면 좋을 듯 하다. 

사이드카는 아이패드를 맥북의 확장 모니터로 이용하게 해 주는 기능이다. 그냥 회사에서 노트북에 모니터 한대 더 붙여 쓴다고 보면 된다.

우리 눈에는 두 화면 모두 파일이 보이지만, 사실 파일은 맥북만 있고 아이패드에는 아무런 파일이 없다. 즉, 아이패드는 화면과 뚜껑만을 제공하는 깡통이고, 컨텐츠는 다른 기기(맥북)에 있다.

아이프레임을 쓸 경우, 구글에 수집되고 사용자에게 보여지는 화면(아이패드)는 존재하지만 실제 정보는 다른 웹페이지(맥북)에 있다. 구글에 수집된 페이지에는 아무런 정보도 없는거지. 

페이지 내에 동영상만 잔뜩 넣은 것도 마찬가지다. 동영상 "속"의 정보를 검색엔진은 알지 못한다.

그리고 당연한 얘기지만, 사이트에 타겟 키워드가 있는지 확인. 제발 좀. 

site:(내 사이트 주소) 키워드

이렇게 검색창에 쳐보면 내 사이트에 그 키워드가 있는지, 어느 페이지에 있는지 알 수 있다.

 

여기까지 했는데도 안 나오잖아?

그럼 "어떻게 할까요?"라고 묻지 마. 

"돈 얼마 들까요?"라고 물어봐. 

 

누누히 말하지만, 상위 노출은 수집된 이후의 얘기다. 제발 수집이 되게 만들어 놓고 얘기하자.

그리고 수집 자체가 불가능한 사이트라고 얘기했는데 "그래도 지금 사이트 안 바꾸고 어떻게 제발"이라고 떼 좀 쓰지 마. 체지방이 45%인데 "지방 안 빼고 몸짱 제발"이라는 거랑 똑같아. 

SEO(검색엔진최적화)에서의 전략적 타겟 키워드



안녕하세요 믿고 쓰고 싸게 쓰는 검색요정 브랜든입니다. 

오늘은 SEO(검색엔진최적화)에서의 전략적 키워드에 대해 말씀드리고자 합니다. SEO(검색엔진최적화)는 기본적으로 우리 웹사이트가 노출되기를 원하는 타겟 키워드의 검색결과 화면에서 보다 높은 순위를 가져가는 것을 목적으로 합니다. 이 타겟 키워드들은 한마디로 이용자가 우리 사이트로 방문할 때 거치는 경로라고 할 수 있습니다. 
이 SEO(검색엔진최적화) 타겟 키워드를 설정할 때 가장 기본이 되는 것은 무엇일까요? 많은 분들이 검색량이라고 생각하실 것입니다. 물론, 검색량이 SEO(검색엔진최적화)를 비롯한 키워드 마케팅의 가장 기본이 되는 것은 맞습니다. 대부분의 SEO(검색엔진최적화) 프로세스에서도 키워드 검색량 확인을 가장 먼저 실시합니다. 하지만 키워드의 검색량 조사는 아직 SEO(검색엔진최적화)전략 단계로 진입하지 않은 단계입니다. SEO(검색엔진최적화)에는 소스를 보고 URL을 잡고 DB Structure를 살펴보는 등의 기술적인 업무도 필요합니다. 하지만 잊지 말아야 할 것은, SEO(검색엔진최적화)는 엄연한 마케팅 활동이라는 것입니다. 즉, SEO(검색엔진최적화) 전략이라는 것은 기술적인 부분에 앞서 마케팅적 관점에서 수립되어야 한다는 것입니다. 

하나의 예를 들어 설명드리겠습니다. 요즘 운동에 관심들이 많으시죠? 제가 헬스클럽을 열었다고 가정합시다. 편의상 간단하게 “들어가서 숨만 쉬다 와도 몸짱이 되는 브란도니스 곤잘레스 게레로 피트니스 클럽”이라고 부를께요. “들어가서 숨만 쉬다 와도 몸짱이 되는 브란도니스 곤잘레스 게레로 피트니스 클럽”을 오픈한 저는 시대와 관계 없는 기획자 박다섭, 신이 내린 코더 김민구, 형이 실업자 되자 연락 끊고 여자만 만나는 코더 시다바리 성민창, 실력은 모르겠고 얼굴은 예쁜 웹디자이너 이송이를 채용하여 웹사이트를 만들고자 합니다. 박다섭이 발로 만든 기획안이 나오고 본격적인 컨텐츠 제작 단계가 되자, 저는 슬슬 SEO(검색엔진최적화)전략을 세우기 시작합니다. 그런데 귀찮습니다. 그래서 2년동안 가르치긴 했는데 뭔가 딱히 배운 건 없어 보이는 원동준을 불렀습니다. 

검색요정: 동준아 우리 “들어가서 숨만 쉬다 와도 몸짱이 되는 브란도니스 곤잘레스 게레로 피트니스 클럽”의 타겟 키워드 뽑고 검색량 조사 좀 해오니라. 
2년동안 가르치긴 했는데 뭔가 딱히 배운 건 없어 보이는 원동준: 예압 

약 1주일 뒤, 각종 이미지와 색깔과 엑셀 수식으로 떡칠이 된 쓸데업는 고퀄 문서를 2년동안 가르치긴 했는데 뭔가 딱히 배운 건 없어 보이는 원동준이 보내왔습니다. 2년동안 가르치긴 했는데 뭔가 딱히 배운 건 없어 보이는 원동준이 뽑아온 타겟 키워드를 봅니다. 헬스클럽, 휘트니스, 휘트니스클럽, 개인PT, 개인트레이닝, 헬스비용, 가슴운동 등등등… 모두 높은 검색량을 갖고 있는 유명 키워드들이었습니다. 심지어 헬스, 가슴운동 같은 것들은 월간 검색량이 10,000건을 넘습니다. 자, 여기까지는 아무 이상한 것이 없습니다. 헬스클럽들은 다들 시설, PT 프로그램등을 강조하여 마케팅을 합니다. 부위별 운동도 관심이 많죠. 몸짱 같은 키워드도 인기가 많은 키워드입니다. 

 그런데 위의 키워드들이 저희 “들어가서 숨만 쉬다 와도 몸짱이 되는 브란도니스 곤잘레스 게레로 피트니스 클럽” 사업에 도움이 될까요? 다시 강조합니다. SEO(검색엔진최적화)는 마케팅입니다. 즉, SEO(검색엔진최적화)활동을 통해 저는 제가 정한 마케팅 활동 지표에서의 성과를 가져가야 합니다. 그리고 그 성과는 대부분 Conversion입니다. 헬스클럽에서의 Conversion이란 회원등록, 온라인 상담, 사이트 회원가입 등이 되겠지요. 그 중 가장 중요한 것은 등록과 상담이겠지요. 

다시 2년동안 가르치긴 했는데 뭔가 딱히 배운 건 없어 보이는 원동준이 보내 온 키워드로 돌아갑니다. 저 키워드로 1위를 잡으면 매우 많은 사람들이 저희 웹사이트에 방문하겠지요. 그런데 저 중 얼마나 많은 사람들이 저희 “들어가서 숨만 쉬다 와도 몸짱이 되는 브란도니스 곤잘레스 게레로 피트니스 클럽”에 방문할까요? 헬스, PT, 몸짱운동, 몸짱만들기, 3개월 복근완성… 다들 멋있어 보입니다. 하지만 이런 키워들은 제주, 강원, 심지어 시드니에서도 검색이 가능합니다. 그리고 헬스클럽 사업은 로컬 비즈니스입니다. 이런 경우는 SEO(검색엔진최적화)를 통해 웹사이트로의 방문은 늘어났지만 사업은 성장하지 않는 결과를 가져올 수 있습니다. 헬스클럽을 만들면 가장 먼저 떠오르는 홍보 키워드는 PT 프로그램이나 시설이라고 앞서 말씀드렸습니다. 전단지, 신문광고 등에는 가능합니다. 왜냐면 그런 것들은 “미디어” 자체가 로컬 단위니까요. 하지만 SEO(검색엔진최적화)관점에서 볼 때 우리의 전략적 키워드는 프로그램이나 시설이 되어야 할까요 지역이 되어야 할까요? 당연히 지역입니다. 그래야만 SEO의 성과가 사업성과로 이어질 수 있습니다. 지점이 많다면 웹사이트를 구성할 때에도 프로그램 단위가 아니라 지역(지점) 단위로 구조가 만들어져야 합니다. 그래야만 SEO(검색엔진최적화)의 성과가 사업성과로 이어질 수 있습니다. 

SEO(검색엔진최적화)는 무턱대로 랭킹을 올리는 것이 아닙니다. SEO(검색엔진최적화)의 결과가 과연 여러분의 사업성과와 이어지는지 먼저 생각하시기 바랍니다. SEO의 특징을 파악하기 앞서 자신의 사업의 속성을 파악하고, 마케팅 전략을 정하고, Conversion의 항목을 정의해야 합니다. 얼마의 검색량을 가진 몇개 키워드에서 몇위를 하는가에 눈이 멀어 Conversion을 발생할 수 없는 소모적 SEO(검색엔진최적화)를 하는 일은 없어야 할 것입니다. 

다음에는 로컬 비즈니스와 Conversion이 연계된 SEO(검색엔진최적화)사례 하나를 소개해드리겠습니다. 

이상 믿고 쓰고 싸게 쓰는 검색요정 브랜든이었습니다.


지난 글에서 검색엔진을 얼마나 많은 사람들이 사용하는지, 그리고 검색 결과 화면상의 노출이 얼마나 중요한지 간략히 살펴보았다.


[지난 글 바로가기] SEO Lesson 0 - 당신의 웹사이트는 검색에서 안녕하십니까


본격적인 시작에 앞서, 오늘은 검색엔진에 노출되지 않는 몇가지 사례들을 살펴볼 것이다. 그리고 과연 그것이 무엇을 의미하는지 간략히 언급하도록 하자.


오늘 첫번째 사례는 바로 DHC 코리아이다.

지금 이 글을 읽고 있는 20~30대 여성들 중 DHC라는 브랜드를 모르는 사람은 없을 것이다. 저렴한 가격, 우수한 품질로 많은 여성들의 사랑을 받고 있으며, 몇년 전 김희선을 모델로 한 성공적인 광고 캠페인으로 인해 아직까지도 "스베스베"라는 말을 기억하는 사람들이 많다.


DHC의 제품 중 가장 많은 사랑을 받는 제품은 바로 딥클렌징 오일인데, "가난한 자의 슈에무라"라고도 불리우며 아직까지도 DHC의 대표 제품으로 그 지위를 굳건히 지키고 있다.

이렇게 유명한 DHC의 딥클렌징 오일을 검색해보면? 당연히 DHC 딥클렌징 오일의 페이지가 상단에 있을까?

결과는 충격적이다.


검색을 위하여 3개의 키워드와 구글 코리아를 선택했다.

브랜드명과 제품명을 모두 반영한 DHC 딥클렌징오일을 검색했을 경우, 구글 첫화면의 모든 컨텐츠가 DHC의 딥클렌징오일을 언급하고 있다. 브랜드명이 제외된 딥클렌징오일의 검색결과에서는 총 15개 컨텐츠 중 4개의 컨텐츠에서 DHC의 딥클렌징오일을 언급하고 있다. 가장 광범위한 키워드인 클렌징오일에서는 불행하게도 DHC의 딥클렌징오일을 언급한 게시물이 단 하나도 없었다. 

문제는, 3개 키워드의 검색 결과에서 DHC 코리아로 바로 가는 링크, 혹은 DHC 코리아의 웹사이트가 단 하나도 발견되지 않았다는 것이다. DHC의 딥클렌징오일을 일반 블로거들이 많이 언급해준 것은 매우 바람직한 일이나, 온라인에서 "경로"가 하나 늘어날 때마다 전환율이 감소한다는 것을 고려하면 DHC Korea의 웹사이트, 또는 DHC 딥클렌징오일의 웹페이지로 바로 가는 경로가 없다는 것은 커다란 손실이 아닐 수 없다.


보다 충격적인 것은 구글에 수집/저장된 DHC 코리아의 웹페이지가 메인페이지 하나 뿐이라는 것이다. 구글에 수집/저장된 페이지가 없다는 것은 어떠한 경우에도 구글은 DHC 코리아의 해당 페이지를 검색 이용자들에게 보여줄 수 없다는 것을 의미한다.


두번째 사례는 나이키 USA의 온라인 스토어이다. 이 글을 읽고 있는 어느 누구도 나이키라는 브랜드를 모르지는 않을 것이다. 디지털 시대에 걸맞게 그들도 온라인 스토어를 운영하고 있을 것이고, 그 매출액은 상상을 초월할 것이다.

그림에서 알 수 있듯 나이키 온라인 스토어의 베스트셀링 제품 중 4위는 런닝화이다. 이렇게 유명한 브랜드의 이렇게 잘 팔리는 제품이니 검색결과 화면에서도 잘 노출될까?

예상과 달리 런닝화를 검색했을 때 나이키 스토어는 100위 이내에서 보이지 않는다. 

이전 글에서 검색 이용자 중 90%는 30위 내의 웹사이트를 방문한다고 밝혔다. 검색 100위 이내에서 노출되지 않는다는 곧 검색 이용자들이 방문할 가능성이 거의 없다는 것을 의미한다.


DHC와 나이키의 사례가 의미하는 것은 무엇일까?


80%의 국민이 인터넷을 이용하고, 인터넷 이용자의 92%가 검색을 이용한다. 검색 엔진에, 검색 결과화면에 웹사이트가 보이지 않는다는 것은 바로 "비즈니스 기회의 상실"을 의미한다.


현재의 매출을 유지하는 것이 목적인 마케터는 어디에도 없다. 현재의 고객만을 생각하는 마케터도 없다. 현재의 고객을 대상으로 한 Cross-selling과 Up-selling에 대한 고민은 마케터의 기본 임무이다. 하지만 그들의 궁극적인 목적은 그 너머에 있다. 현재 경쟁사의 고객, 더 나아가서는 우리 카테고리에 들어오지 않은 고객들을 대상으로 Needs를 자극하고 우리 브랜드와 제품을 홍보하여 더 큰 시장을 개척하는 것이다.


DHC와 나이키는 현재도 성공적인 비즈니스를 하고 있고, 온라인 스토어를 통해 많은 매출을 발생시키고 있다.

그러나 그들이 간과하고 있는 것은, 집에 누워 티비를 보며 쉬다가 문득 생각이 들어 노트북, 태블릿PC, 또는 스마트폰을 검색하는 이들이야말로 그들이 잡아야 할 궁극적인 "저 너머의 시장"이라는 것이다.


집에 누워 있다가 김남주처럼 예쁜 피부를 갖고 싶어 스마트폰으로 클렌징오일을 검색한 사람은 아마도 바비브라운, 슈메무라, 존슨앤존슨의 제품을 구매할 것이다.

티비를 보다가 몸짱 배우를 보고 다이어트를 결심한 사람은 런닝화를 검색한 후 아디다스나 리복을 구매할 것이다.

다시 말하는데, 검색결과화면에서 상위에 노출된다는 것은 "비즈니스 기회"의 문제이다.


물론, 온라인을 통한 마케팅 방법은 매우 다양하다. 예전과는 다르지만 여전히 디스플레이 광고는 마케터들이 가장 먼저 떠오르는 옵션이며, 검색결과 화면에서 활용할 수 있는 키워드 검색광고도 있다.

하지만 그것들은 모두 방문을 유치하기 위한 비용을 필요로 한다. 더 많은 방문을 유치하기 위해 더 많은 비용을 필요로 하며, 경쟁사보다 더 좋은 순위를 차지하기 위해 더 많은 비용을 필요로 한다. 그리고 비용이 중단되는 순간 방문도 중단된다.


그렇다면 비용을 들이지 않으면서 지속적인 방문을 유치할 수 있는 방법은?

그것이 바로 SEO(Search Engine Optimization), 즉 검색엔진최적화이다.


다음 글에서는 SEO를 위한 기본 환경, 검색엔진에 대해 알아보도록 하겠다.


by iProspect Korea의 빛과 소금이자 거의 모든 것, 검색요정 BRANDON





여기 몇 가지 사실이 있습니다.

1. 95% 인터넷 이용자가 검색 서비스를 이용
2. 56%가 하루에 한 번 이상 검색을 사용
3. 21%는 하루에 네 번 이상 검색을 사용
4. 62% 사용자는 검색 결과의 첫 페이지에서 클릭
5. 90%의 사용자는 검색 결과의 첫 페이지 3순위 내에서 클릭

상기의 숫자들은 우리가 “S.E.O.(Search Engine Optimization, 검색엔진최적화)가 왜 필요한가?”라는 것을 말할 때 가장 빈번하게 언급되는 숫자들입니다.
S.E.O.(Search Engine Optimization, 검색엔진최적화)란 쉽게 말해 홈페이지/블로그를 검색엔진의 알고리즘에 최적화시켜 검색 상위에 노출되도록 하는 것이죠.
페이스북, 트위터 등 소셜미디어의 시대가 이미 자리 잡았지만 검색활동은 여전히 검색 엔진에서 이루어지고 있습니다. 구글, 빙, 야후, 그리고 한국에서 독보적인 지위를 차지하고 있는 네이버 등이죠.
페이스북이 웹검색도 시범적으로 운영하고는 있지만, 여전히 검색 활동은 대부분은 검색엔진에서 이루어지고 있습니다. 유튜브가 검색량 자체로는 2위의 플랫폼이지만, 단순히 동영상 검색에 그칠 뿐이지 일반 웹 검색과는 그 성질을 달리합니다.

온라인 활동의 두 축, 소셜미디어와 검색
그 동안은 많은 논의가 소셜미디어의 검색에 국한되어 있었습니다. 소셜미디어 채널 내에서의 검색 또는 소셜미디어가 제공하는 웹검색을 말합니다.
전자의 경우는 소셜미디어 이용자의 편의 관점에서, 후자의 경우는 소셜미디어(특히 페이스북)의 성장 및 기존 검색엔진과의 경쟁구도 관점에서 많이 언급되었지요.
하지만 최근 또 다른 시각으로의 접근도 활발하게 이루어지고 있습니다. 바로 검색엔진에서의 소셜 미디어, 즉 검색엔진에서 검색활동을 했을 때 소셜 미디어가 얼마나 잘 노출되는가 하는 것이죠.
소셜 미디어를 단순한 이벤트 플랫폼 등 서브 플랫폼으로 이용하는 단체 회원(기업, 정부, 비영리단체 등)도 많지만, 소셜 미디어 자체를 메인 플랫폼으로 활용하는 단체 회원도 점점 증가하고 있습니다. 이런 움직임은 멀티 컨텐츠를 지원하는 페이스북에서 훨씬 더 많이 일어나고 있습니다.
페이스북 등 소셜 미디어를 메인 플랫폼으로 활용한다면 검색 엔진에서의 노출은 필수적이겠죠.

그렇다면 지금 현황은 어떨까요?
S.E.O. 전문 회사인 브라이트엣지(BrightEdge)에 따르면 포춘지 선정 500대 기업 중 1/3 미만의 기업만이 회사명으로 구글 검색을 했을 경우 검색결과 상위 20위 내에 페이스북 페이지가 노출되고 있다고 합니다. 절반 가까운 숫자는 40위 안에도 들지 못하고요.

구글의 검색 화면은 한 페이지에 열 개의 검색 결과를 보여줍니다. "62% 사용자는 검색결과의 첫 페이지에서 클릭, 90%의 사용자는 검색결과의 첫페이지 3순위에서 클릭"이라는 조사 결과와 비교해본다면, 40위 안에도 들지 못하는 페이스북 페이지들은 검색엔진 검색을 통한 방문 기회를 거의 갖지 못한다는 것이죠.

트위터를 대상으로 한 분석 역시 유사한 결과를 보여줍니다.

S.E.O.에서 갈래가 뻗어져 나온 S.M.O.라는 것이 있습니다. 바로 소셜미디어 최적화(Social Media Optimization)입니다. S.M.O.는 크게 두가지로 구분될 수 있는데요, 하나는 이용자의 이용패턴 활성화를 위한 최적화, 또 하나는 바로 지금 말씀드린 검색 관점에서의 소셜미디어 최적화입니다.
프로모션을 통해 회원을 유치하는 것은 단기간에 많은 회원을 유치할 수 있다는 장점이 있습니다. 하지만 이러한 방법은 지속적인 회원 유입을 보장할 수 없으며, 경쟁환경에 따라서는 상상을 초월하는 많은 비용을 요구하기도 합니다.

검색 관점에서의 S.M.O.는 꾸준한 고객의 유입에 대한 하나의 대안이 될 수 있습니다.

  1. BlogIcon manacle 2011.05.28 22:28 신고

    좋은 정보 잘 읽고 갑니다. 요즘 국내 포탈에서도 검색결과에 소셜미디어의 내용을 포함하고 있지만 단편적으로 보더라도 소셜미디어가 성장할 수록 검색에 대한 욕구는 더 커질 꺼라 생각됩니다.

    • BlogIcon Brandon Lee 2011.05.29 16:41 신고

      같은 시간이라면 포털보다는 소셜미디어에 "머무른" 채로 검색을 하는게 편하겠죠. 포털에서는 지인들과 실시간 소통을 하는 게 아니니까요.
      그리고 정보 자체가 소셜미디어 안에 많이 들어가게 될테고요.
      문제는, 소셜미디어간 크로스 검색이겠지요. 트위터와 미투데이가 경쟁한다고 상호 웹검색을 막았다가는... 지금의 네이버 같이 되겠죠.

최근 스마트폰과 태블릿PC가 점점 대중화되면서 SEO쪽에서도 고민이 생겼습니다. 
"모바일을 위한 SEO가 별도로 필요할까?"라는 것입니다.
m.domain.com의 경우 www.domain.com과 보여지는 형식이 다르며, 물리적으로는 다른 도메인을 갖게 되고, 무엇보다 구글의 검색 Bot 자체가 Googlebot과 Googlebot-Mobile로 구분되어 있기 때문입니다.
모바일 SEO에 대한 관심과 우려를 반영하듯, 구글에서는 모바일 SEO에 대한 가이드라인을 구글 웹마스터 블로그에 올렸습니다.

주요 내용을 간추리자면

  • 구글은 스마트폰과 일반 휴대폰을 구분하여 인식합니다.
  • 현재 Googlebot-Mobile은 일반 휴대폰만을 대상으로 합니다. 스마트폰은 데스크탑과 동일하게 인식됩니다. 구글에 따르면 스마트폰은 데스크탑에서 보여지는 화면을 그대로 보여줄 수 있기 때문에 웹마스터에서 모바일로 구분하여 볼 필요가 없다고 합니다.
  • 스마트폰을 데크스탑과 동일한 방식으로 크롤링한다고 해서 스마트폰용 스타일 시트를 적용할 수 없다는 것은 아닙니다. 스타일시트가 바뀐다고 해서 크롤러가 별개 사이트로 인식하지는 않습니다.
  • 최종적으로 이용자가 보게 되는 것이 동일하다면 별도의 URL스트럭처가 필요하지 않습니다. 
  • 또한 모바일용과 테스크탑용이 동일한 URL을 사용한다고 해도 구글은 중복(Cloaking)으로 판단하지 않습니다. 
  • 모바일용으로 특화된 User-agent나 컨텐츠가 적용되지 않았다고 하더라도 모바일용 사이트맵을 웹마스터에 제출해야 합니다.


난데없이 블랙햇 SEO(Black Hat SEO) 기사가 최근 SEO 관련 뉴스를 뒤덮고 있습니다. 블랙햇 SEO(Black Hat SEO)란 검색 결과 페이지에서의 순위를 올리기 위해 부정한 방법을 사용하는 것을 말합니다. 그 부정한 방법이란 것은 법을 어기는 것은 아니고, 공정한 검색 결과를 위해 각 검색엔진에서 제시하는 가이드라인과 규칙을 말합니다.

요즘 뉴스가 시끄러운 것은 다름이 아니라 미국의 대형 유통업체인 JC Penney가 대규모 블랙햇 SEO(Black Hat SEO)를 했다는 의혹을 받고 있기 때문입니다. 유통업체의 특성상 검색 상위에 노출된다는 것은 매출에 직접적인 영향을 미치는 아주 중요한 일이기 때문에 더욱 많은 눈길을 끌고 있습니다.

대략적인 개요는 이렇습니다.
지난 몇개월간 JC Penney는 상당히 많은 키워드에서 구글 검색 1위에 올라 있었습니다. 드레스, 러그 등의 큰 카테고리 뿐 아니라 스키니진, 홈데코 같은 보다 구체적인 제품군에서부터 심지어 특성 제품명까지 JC Penney가 검색 1위를 싹쓸이 했습니다. 이렇게 제조사까지도 눌러버린 대표적인 키워드로 샘소나이트가 있습니다. 구글에서 Samsonite carry on luggage를 검색하면 샘소나이트 웹사이트가 아닌 JC Penney의 샘소나이트 판매 페이지가 1위로 검색되었죠.


(왜인지는 모르겠지만) 뉴욕 타임즈가 이 점에 주목했습니다.
뉴욕 타임즈는 이 의문의 시작에 대해 다음과 같이 말하고 있습니다.
"Does the collective wisdom of the Web really say that Penney has the most essential site when it comes to dresses? And bedding? Andarea rugs? And dozens of other words and phrases?"
그리고 곧바로 뉴욕 타임즈는 검색 전문가와 함께 JC Penney 웹사이트와 그 주변을 말 그대로 "털기" 시작합니다.

그래서 나온 결과.
뉴욕 타임즈는 외부의 사이트들에서 상당히 많은 비정상 링크들을 발견합니다. JC Penney로 연결되는 링크들이죠. Open Site Explored라는 툴을 이용하여 검색한 결과 “casual dresses”, “evening dresses”, “little black dress” 또는 “cocktail dress”라는 내용이 포함된 페이지가 총 2,015개 발견되었는데, 이들 페이지에 진입하는 즉시 JC Penney의 드레스 판매 메인 페이지로 바로 연결됩니다. 이렇게 해서 외부에서 JC Penney로 연결되는 가짜의 링크들을 만들어 KS Penney의 순위를 올린 것이죠. JC Penney가 개입되었다는 의혹을 더욱 짙게 만든 것은 그 페이지들이 올려진 사이트가 거의 대부분 키워드와는 전혀 상관 없는 사이트라는 것입니다.
(자세한 기술적 배경은 생략하겠습니다.)

당연히 JC Penney에서는 이 일에 대한 JC Penney의 연루를 즉각적으로 부인하였습니다. JC Penney측에서는 웹사이트 트래픽의 단지 7%만이 Organic Search로부터 나온다며, 그 7%를 위해 JC Penney가 이런 일을 할리는 없다고 주장하였습니다. 또한 얼마 전의 Holiday Season에도 야후나 타임워너, 그리고 최근 런칭한 모바일 앱 등을 통한 유입에서 더 많은 매출이 발생했다고 말했습니다. 

그러나 검색 전문가들의 말은 다릅니다. 평균적으로 구글 검색 트래픽의 34%가 검색 결과 페이지에서 1위에 올라가 있는 사이트를 방문한다고 하며, 이는 2위와 거의 두배 차이가 나는 수치라고 합니다. 구글 미국에서 dress라는 단어의 검색 횟수가 월 1천1백1십만 가량 되는데, 이 말은 JC Penney가 dress라는 단어 검색에서 1위에 오른다면 월평균 3백8십만회의 유입을 이끌어 낼 수 있다는 것입니다. 또한 JC Penney는 지난 1월에 온라인 매출이 크게 증가했다고 발표한 적이 있다고 합니다.

JC Penney의 주장이 설득력을 잃고 있는 두번째는 JC Penney가 최근 경영부진에 시달리고 있다는 것이었습니다. 작년도 JC Penney의 총 매출은 170억 8천만 달러였는데, 이는 2001년의 매출과 정확히 같다고 합니다. 어떻게든 주주의 눈을 만족시켜야 할 돌파구가 필요했던 것이죠.

이 밖에도 뉴욕 타임즈는 다양한 각도에서 JC Penney의 의혹을 살피고 있는데요, 사실 저희가 그 주변 정황까지 알 필요는 없는 거고요.

JC Penney의 지금 상태는?
한마디로 비참합니다.
기사가 나온 날 아침 7시에 Samsonite carry on luggage로 검색하면 JC Penney가 1위였습니다. 두시간 후 71위.
같은 시간, living room furniture 키워드 검색 1위에서 두시간 후 68위.그리고 더 무서운 것은, 구글이 지금 "수작업"을 통해 지속적으로 JC Penney의 페이지들을 끌어 내리고 있다는 것.

블랙햇 SEO(Black Hat SEO), 쉽게 할 일이 아닙니다.

  1. BlogIcon 노피디 2011.02.22 10:38 신고

    트위터에서 처음 이 이야기를 들었는데... 강제로 내려지고 있군요 ㅜㅜ

    • BlogIcon Brandon Lee 2011.02.22 13:16 신고

      그런데, 달리 보면 JC Penney가 부인하고 있고 법을 어긴것도 아닌데 구글이 사후에 알고 수작업으로 강제 조정하는게 과연 옳은가 하는 생각도 들어요. 최소한 JC Penney 연관의 확인 절차는 밟아야 하지 않나 싶고. 서비스 공급자의 권한에 대한 잘못된 선례가 될 것도 같습니다.

  2. BlogIcon 김루코 2011.02.22 11:15 신고

    잘 보고 갑니다.. ㅎ
    블랙햇 SEO 라는 걸 알게 되었네요 ㅎ

+ Recent posts