한달 술값으로도 제작이 가능한 것이 웹사이트지만, 모든 분야에서의 제대로 된 품질과 특히나 안정적인 유지보수를 위해서는 작게는 몇천, 크게는 몇억의 비용이 든다. 이렇게 많은 비용과 시간, 그리고 노력이 들어간 웹사이트 또는 개별 웹페이지가 검색에 나오지 않는 경우, 간단하게 확인 및 조치할 사항에 대해 알아보자.

초보자 레벨로 알려줄거니까 차근차근 따라해봐.

 

검색 엔진이 알아서 해주겠지?

웹사이트를 만든다고 검색엔진이 알아서 수집하고 상위에 노출시켜줄 것이라는 생각은 버려라. 걔들 의외로 허술하고, 또 바쁘다. 내 돈이 많이 들어갔다고 해서 고작 내 사이트 정도를 하나하나 챙겨주지 않는다.

또한 웹사이트 내의 모든 페이지를 수집해서 보여주는 것도 아니다. 메인 페이지만 수집되었을 경우도 있고, 정작 중요한 페이지는 하나도 수집되지 않은 채 쓸데없는 약관 페이지들이나 상위에 노출되는 경우도 흔하다.

검색엔진님께서 알아서 긁어가시기 전에, 내가 더 할 일은 없는지 찾아봐야 한다.

 

수집은 되고 있나?

검색 엔진은 개별 사이트와 웹페이지에 대한 정보를 살핀 후 도서관의 도서카드와 같이 색인목록을 만든다. 이를 Index한다고 부른다. 내가 찾는 책이 그 도서관에 없다면 색인에도 없겠지? 달리 말하자면 사람들이 아무리 찾아도 그 도서관의 색인목록에 들어있지 않은 책은 사람들에게 보여주지 않는다. 검색엔진 역시 마찬가지다. 자신의 DB에 수집되지 않은 사이트/페이지는 검색 결과에 보여주지 않는다.

따라서 제일 먼저 할 일은 내 사이트 또는 페이지가 검색엔진에 잘 수집되어 있는지 확인하는 것이다.

"site:주소"명령어를 검색창에 치면, URL에 해당 주소를 포함한 모든 웹페이지를 보여준다. 물론, 그 검색엔진에 수집된 페이지들이다.

이렇게 사용하면 된다

특정 페이지, 특히 새로 업데이트된 페이지가 수집되어 있는지 확인한다면 site:뒤에 해당 페이지의 주소를 넣으면 된다. 검색 결과에 나오지 않는다면 해당 페이지는 수집되지 않은 것이다.

네이버는... 어... 음...

이 개자슥들아

웹사이트 영역으로 이동하면 된다. 꼭 이래야만 속이 시원했냐?

 

검색 엔진에 수집이 안 되어 있으면 어떡해야 하지?

뭘 어떡하냐. 수집하라고 시켜야지.

사이트의 등록

모든 검색엔진은 웹사이트 담당자와 검색엔진의 커뮤니케이션을 위한 도구를 제공한다. 검색엔진마다 서비스의 이름이 다르긴 하지만 "웹마스터도구(Webmaster Tools)"라고 하면 다 알아듣는다.

구글: 구글 서치 콘솔 (https://search.google.com/search-console)

네이버: 네이버 서치 어드바이저 (https://searchadvisor.naver.com/)

빙: 빙 웹마스터 도구 (https://www.bing.com/toolbox/webmaster)

사용법은 대동소이한데, 네이버로 설명을 하겠다.

먼저, 웹마스터 도구에 사이트를 추가한다.

네이버 서치 어드바이저 사이트 추가 화면

다음으로 소유권 확인을 진행한다. 이게 내꺼라는 인증이 필요하잖아?

네이버 서치 어드바이저 사이트 소유 확인 화면

티스토리나 워드프레스와 같이 서버 루트 폴더에 HTML 파일을 올릴 수 없는 경우, 두번째 옵션인 HTML 태그를 선택하면 된다. 블로그 소스에 해당 태그를 넣어서 인증하는 것이다.

이러면 기본적으로 검색엔진에게 "우리 사이트 여기 있어요~"라고 알리게 되고, 검색엔진이 찾아와 정보를 수집하게 된다.

sitemap.xml

그러나 검색엔진이 찾아온다고 해서 모든 페이지를 꼼꼼하게 다 수집해주는 것은 아니다. 종종 일부 페이지가 누락되는 경우가 생기고, 시의성 있게 새로 올린 컨텐츠가 빠르게 수집되지 않는 일도 있다.

이 경우, 우리 사이트에 대한 일종의 "안내도"를 제공하여 검색엔진이 페이지를 빠뜨리는 일 없이, 그리고 새로 올라온 컨텐츠에 대해서도 빠르게 수집하도록 요청할 수 있다. 이 안내도를 sitemap.xml 파일이라 부른다. 우리가 흔히 웹사이트에서 부르는 사이트맵에 사용자를 위한 웹사이트 안내 지도라고 한다면, 이 sitemap.xml은 검색엔진을 위한 안내도이다.

sitemap.xml 파일은 형식에 맞게 직접 작업할 수도 있고, 자동 도구를 사용할 수도 있다. 구글에 sitemap generator를 검색하면 많은 무료 도구들이 나오는데, 무료 도구들의 경우 sitemap.xml 파일 내에 포함되는 URL의 숫자가 제한되지만 소규모 웹사이트에서는 충분히 활용할 수 있다.

sitemap.xml 파일의 예

이렇게 만들어진 sitemap.xml 파일을 서버에 올린 후, 웹마스터 도구 내에 이 파일의 주소를 등록하면 된다.

네이버 서치 어드바이더 사이트맵 제출 화면

 웹사이트를 위한 안내도는 sitemap.xml 파일 뿐 아니라 rss 파일로도 제공 가능하다.

sitemap.xml 파일을 업데이트하지 않고 특정 URL에 대한 수집을 개별적으로 요청할 수도 있으니, 여러 기능을 꼼꼼하게 확인하자.

네이버 서치 어드바이저 개별 웹페이지 수집 요청 화면

여기까지 했는데도 사이트나 페이지가 수집되지 않는다?

그때는 robots.txt나 URL 자체의 기술적 문제를 생각해봐야 하는데, 그 얘기는 오늘은 안해주지롱.

 

 URL은 수집 되었는데 검색하면 죽어도 안나와부러

분명 site:을 해보면 수집이 되어 있다. 그런데 아무리 검색해도, 심지어 내 컨텐츠에 있는 내용을 검색창에 그대로 복붙해도 검색결과에 나오지 않는다. 

그럼 무엇을 봐야 할까. 

 

검색엔진은 사람이 아니다. 우리는 모니터에 보이는 화면을 읽지만, 검색엔진은 그 화면 너머에 있는 소스를 읽는다.

우리 눈에 보이는 요소들이 검색엔진은 읽을 수 없는 방식으로 되어 있다면? 검색엔진은 그 페이지가 무슨 내용인지 모른다. 무슨 내용인지 모르니, DB에 인덱스는 되어 있지만 검색결과에 보여주지 않는다. 검색엔진은 사용자가 검색창에 입력한 키워드와 관련있는 컨텐츠를 보여주는 거거든.

그런데 상당히 많은 경우, 검색엔진이 읽을 수 없는 형태로 정보를 전달하고 있다. 대표적인 경우가 "이미지폰트"라고 부르는 것이다.

이미지 폰트란, 지금 여러분이 읽고 있는 이러한 HTML 텍스트가 아니라 이미지 내에 텍스트를 넣는 것이다. 이렇게 하면 글자에 여러 효과도 넣을 수 있고, 귀찮게 웹폰트 안 불러오고 멋진 폰트도 쓸 수 있고, 이미지와 텍스트도 자연스럽게 섞어서 쓸 수 있다. 하지만 이렇게 하면 아무리 멋진 말을, 유용한 정보를 넣어도 검색엔진에게는 image1.jpg일 뿐, 그 안의 정보는 전달되지 않는다. 

대표적인 경우가 카드뉴스이다. 카드뉴스는 가독성이 뛰어나 정보 전달 능력이 우수하지만, 검색엔진에게는 그저 몇장의 이미지일 뿐이다. 따라서 소셜 채널이라면 모를까 웹사이트나 블로그에는 사용을 지양하는 것이 좋으며, 굳이 사용한다면 같은 페이지 내에 텍스트로 풀어서 정보를 전달해야 한다. 

검색엔진에게는 그저 한장의 이미지일 뿐

이제는 거의 사용되지 않지만, Flash 역시 검색엔진의 탐색을 가로막는 대표적인 형태이며, AJAX나 iFrame 등등도 마찬가이지다. 

iFrame의 문제는 애플에서 제공하는 사이드카 기능으로 설명하면 좋을 듯 하다. 

사이드카는 아이패드를 맥북의 확장 모니터로 이용하게 해 주는 기능이다. 그냥 회사에서 노트북에 모니터 한대 더 붙여 쓴다고 보면 된다.

우리 눈에는 두 화면 모두 파일이 보이지만, 사실 파일은 맥북만 있고 아이패드에는 아무런 파일이 없다. 즉, 아이패드는 화면과 뚜껑만을 제공하는 깡통이고, 컨텐츠는 다른 기기(맥북)에 있다.

아이프레임을 쓸 경우, 구글에 수집되고 사용자에게 보여지는 화면(아이패드)는 존재하지만 실제 정보는 다른 웹페이지(맥북)에 있다. 구글에 수집된 페이지에는 아무런 정보도 없는거지. 

페이지 내에 동영상만 잔뜩 넣은 것도 마찬가지다. 동영상 "속"의 정보를 검색엔진은 알지 못한다.

그리고 당연한 얘기지만, 사이트에 타겟 키워드가 있는지 확인. 제발 좀. 

site:(내 사이트 주소) 키워드

이렇게 검색창에 쳐보면 내 사이트에 그 키워드가 있는지, 어느 페이지에 있는지 알 수 있다.

 

여기까지 했는데도 안 나오잖아?

그럼 "어떻게 할까요?"라고 묻지 마. 

"돈 얼마 들까요?"라고 물어봐. 

 

누누히 말하지만, 상위 노출은 수집된 이후의 얘기다. 제발 수집이 되게 만들어 놓고 얘기하자.

그리고 수집 자체가 불가능한 사이트라고 얘기했는데 "그래도 지금 사이트 안 바꾸고 어떻게 제발"이라고 떼 좀 쓰지 마. 체지방이 45%인데 "지방 안 빼고 몸짱 제발"이라는 거랑 똑같아. 

+ Recent posts