목차
1. 구글 검색 작동의 원리 - 이동휘
구글 검색 원리
- 구글 검색의 첫 단계 : 크롤링
- 웹문서의 수집. 웹에는 굉장히 많은 문서 . 구글 봇(웹크롤러)라는 소프트웨어 로봇을 돌림.
- 페이지의 링크 추출하여 따라다님. - 새로운 문서 발견 / 이미 있는 문서 중 바뀐 문서 업데이트
- 사이트맵을 통해서도 새로운 페이지를 발견하기도 함.
- 추출한 주소에서 정보 수집. 폰트 어떤 태그 안에 들어 있는지. → 체계화시켜 구조화된 정보로 만듬
- 색인을 만듬
- 중요한 정보들을 엮어서 어떤 페이지에 그 정보가 나타나는지 볼수 있도록 하는 것
- 지도와도 비슷. 현실세계를 단순화하여 반영하는 것 그러나 기술적 한계로 실시간 반영은 어렵.
- 알고리즘
- 알고리즘을 사용하여 색인의 문서들을 뽑아오는 역할.
- 구글 알고리즘은 굉장히 많은(200개 이상) 알고리즘이 유기적으로 엮인 집합. 매해 500개 이상 알고리즘이 런치됨
---여기까지가 준비작업---
실 사용에서의 구글 검색 단계
- 특정 키워드 검색 (예. 끈이론)
- 오타를 치는 경우 - 검색어를 교정하는 기능 필요
- 유의어 묶어주는 기능 - 같은 개념을 다른 용어로 표현하기도 함
- 검색어 자동 완성
- 색인에서 관련된 문서 찾아오기
- 굉장히 많은 문서가 검색될 것
- 검색 결과의 순위 작업
- 사람들이 실제로 필요할 만한 것을 순서를 정해서 보여줌
- 랭킹이라고 함
- 문서에서 나오는 여러가지 정보들이 필요할 만한 것이라고 판단하는 근거 예시
- 검색어가 제목에 들어가 있다면 확률이 높을 것
- 본문에 자주 등장하면 확률이 높을 것
- 알고리즘은 게속 변하기 때문에 어떤식으로 변한다고 말할 수 없음
- 결과 표시
- 디바이스마다 다른 검색 결과
- 모바일 검색이라면, 모바일에 최적화된 페이지를 우선적으로 보여줌
- 디바이스마다 다른 검색 결과
검색 결과 구조
- Bluelinks (표준 용어는 아님)
- 타이틀 , 링크, description (or snippet)
- knowledge panel - 우측 영역 위키나, 다른 패널에서 오는 정보를 보여주는 경우가 많음
- Sitelinks
- Rich Snippets
- 사진, 평점, 리뷰 등이 스니펫에 보여짐
구글 검색의 방향
"The perfect search engine would understand exactly what you mean and give you back exactly what you want." by larry page
Web rendering service
사람들이 이해 하듯이 검색 엔진이 이해하는 게 중요해짐
- 크롬 베이스 사용자 경험이 좋은 페이지들을 검색에 잘되도록 하는 것
- 구글 봇이 css 자바스크립트 이미지 xhr 에 접근할 수 있도록 열어줘야함. 구글 봇이 잘 이해할 수 있도록
AMP
모바일 페이지에서의 사용성, 로딩 속도를 높인 오픈 소스 라이브러리
HTML 페이지처럼 쓸 수 있음.
앰프 태그 + 자바 스크립트
복잡한 사이트를 빠르게 만드는게 목표.
앰프 자체로 랭킹이 올라가진 않지만, 스피드 랭킹이 높아져서 도움이 될 뿐.
다른 브라우저에서도 다 됨. - 오래된 버전의 브라우저를 지원하지 않음.
Google Mission
전세계의 정보를 체계화하여 모두가 편리하게 이용할 수 있는 것.
질문
사이트 맵의 priority 속성을 쓰나? → 잘 모름
PWA를 쓰면 사이트맵을 잘 써서 프로덕트로의 접근이 잘 되도록 하는게 중요.
통이미지 안쓰는거
메타데이터를 페이지 디스크립션에 잘 써서 검색 결과에 나오도록 하는게 중요
2. You and google search - Garry Illyes
over 1 trillion searches a year
over 15% new searches every day
indexing hundreds of billions pages
한국에서 구글 서치 이용하는 사람이 매해 두배 증가
→ 이제 구글 서치에서 사용자들에게 잘 발견되는 것에 신경을 더 써야함
예시 . 라쿠텐
라쿠텐 레시피 : 구조화 데이터를 시험하는 사례. 표준화된 코드
구조화 데이터를 사용하기 시작하면서 레시피 캐러셀에서 라쿠텐 레시피도 나타나기 시작.
2.7배 트래픽. 1.5배 이상 세션 듀레이션
데이터를 구조화하면 여러모로 도움.
사용자에게 초점
웹사이트에서 무엇을 원하는지. 왜 웹사이트를 방문해서 왜 떠나는가.
26% 모바일웹에서 더 좋은 환경을 제공하는 다른 사이트를 찾아서 떠남.
검색 트래픽 절반이 모바일. 모바일 간과해서는 안됨.
Follow Google's Guidelines
구글 가이드라인은 모든 구글 서비스에 적용. 이미지, 구글 홈, 구글 어시스턴트
음성 검색을 고려해야하나?
잘 모르겠다. 너무 초기단계. 음성 전용 가이드 없이 기존 가이드 따르고 있음.
단 음성 검색양이 계속 늘고 있음. 구글 앱의 검색 중 20%가 음성.
또한 고려해야할 것. 구글 어시스턴트의 70% 인쿼리가 자연어로 들어옴.
음성 검색 하는 이유는, 더 편하니까 + 하는 일이 있을 때 (운정중)
음성은 늘어나고 있지만, 정답은 없는 상태.
질문
Site colon 서치의 부정확성 ?
1000개정도의 데이터를 가지고 표시. 부정확하다. 특히 사이트가 대형인경우.
천만 페이지의 크롤링 레이트 리밋 / 크롤링 버짓 관련 ?
천만 페이지 - 모든 사이트마다 특성이 달라서 정확히 말할 순 없음.
천만페이지면 크지만 아주 크진 않아서 크롤링 버짓때문에 최적화 고민을 할 필요는 없다 .
하지만 링크 스트럭처는 내부 효율화를 위해, 중복 페이지 삭제는 필요. - 유저를 위해서 필요
그러나 새 페이지 발견이 느리다고 판단된다면,
솔루션
- 사이트맵 제공
- 링크 스트럭처 개선
- 서버 추가
- 서치 콘솔에서 물어볼 것 크롤러팀에 질문
새로운 서비스로서 구글 서치 랭킹이 낮을 것인데 랭킹 올릴 방법 있나?
- 유의성이 가장 중요. PWA AMP 등 기술을 사용한다고 해도, 랭킹 개선은 되겠지만 절대적으로 높게 올라갈 수는 없다.
- 퀄리티 아주 중요. 이걸 높이는게 가장 중요하지만 어려움. 링크 수.
- 서비스 내부의 검색 결과 페이지는 불필요. 구글 서치 결과에는 다른 자동화 검색의 결과를 나오는 것을 제한하고 있음.
3. 검색엔진이 이해할수 있는 사이트 만들기(1)
검색엔진 최적화 - 검색엔진이 사이트를 쉽게 수집하고 색인할 수 있도록 페이지를 관리하는 것
200+ : 검색 알고리즘 숫자.
site colon - 구글에 색인된 페이지 확인 할 수 있음.
웹에서 접근이 가능한가?
- 메타나 로봇을 통해서 막는 것. robot.txt 은 피해야 한다.
- robot.txt 은 검색엔진 트래픽을 조절하는 용도.
- 한국에서는 보안 이슈가 있다고 생각해서 막는 경향. 자기도 모르게 막힌 상태에서 하기도 함.
- 페이지를 파악할 수 잇는 리소스를 블락하면, 로봇이 알 수 없음.
- 사이트 안의 검색 결과페이지를 막으면 불필요한 검색엔진 트래픽 막을 수 있음.
태그의 올바른 활용
- 타이틀은 <title> 태그에서 가져옴
- 페이지 검색 결과를 조절할 수 있는 가장 중요한 방법.
- 북마크 - 타이틀에서 가져옴.
- 타이틀 만으로도 페이지 내용을 파악 할 수 있도록.
- 스니펫은 메타 태그 <meta name ="description"> 에서 가져옴
- 간결하고 명확한 요약정보
- 웹 페이지마다 다른 내용을 제공해야 함
- 속성 없으면 최대한 파악해서 가져오려고 노력함. 그러나 부정확해서 이상한 결과 값을 보여주는 경우 많음
- 모든 페이지에 태그/ 속성을 사용하는 것 권장
- Description 속성 : 제한없음.
텍스트의 올바른 활용
- 텍스트를 이미지로 만들지 않는게 중요
- 이미지 파일명 설정 중요 + 알트 태그
- 이미지 파일명을 잘 설정하면- 검색 엔진이 유추하기 쉽다. alt 태그로 추가 설명
- 이미지 검색 결과 에서 더 잘 노출
- 파일명 한국어 가능
- 모든 가능한 정보는 텍스트로 제작
- "모든" 사용자를 위한 콘텐츠 측면에서도 중요. 예. 시각 장애인
- 표준 html 사용
콘텐츠 관리
10년전 구글 . 자이트 가이스트 (한해의 인기검색어)는 대부분 검색 특정포탈을 찾기 위한 것
- 과거 검색결과는 디렉토리 검색이라고 생각하는 경향
- 하지만 현재의 검색은 자연어 검색, 컨텐츠를 위한 검색이 늘어남. 구체화되고 있음
- 우수한 품질의 컨텐츠 만들기
- 사용자가 원하는 컨텐츠를 담는 것 - 지금은 모든 페이지가 검색에 적용됨
- 가능한 구체적으로, 공유가 가능하도록. (웹 = 공개)
- 키워드 활용
- 불필요한 키워드를 많이 넣는게 딱히 도움 되지 않음
- 문장형으로 만들면, 검색엔진이 문장에서 키워드 추출
- 계속적인 콘텐츠 유지보수 관리, 사이트는 제작보다 유지보수가 중요함
- 보안 신경 쓰고, CMS 는 최신버전 유지
- 자유게시판 혹은 포럼. - 스팸 생기는 경우. 링크 속성에 nofollow 적용하여, 링크 차단하면 도움 될 수 있음
- 사용하지 않으면 게시판 삭제도 검토
- 스팸방지도구 사용 → reCAPTCHA
- 자유게시판같은 곳 검색엔진봇 막으면 불필요한 트래픽 줄일 수 있음
4. 검색엔진이 이해할수 있는 사이트 만들기(2)
- URL 올바른 활용
- 사용자가 페이지의 내용을 파악할 수 있게 url 설정. 검색에도 도움 될 뿐 아니라, 사용자에게도 친화적
- CMS를 어떤걸 쓰냐에 따라 중복 페이지가 많이 발생되는 경우 있음.
- 다이나믹 변수때문에 여러가지 유알엘 생성 될수 있음.
- link rel ="canonical"로 중복 페이지 정리 표준 유알엘
- 링크의 올바른 활용
- 텍스트 링크. "여기를 클릭"은 정말 많이 안누른다
- 앵커텍스트 활용 링크된 페이지 내용 미리 파악할 수 있도록
- 유저에게도 도움, 검색엔진이 적합성 파악에도 도움
- 내부링크 - 관련된 페이지에 링크 걸어주기
- 다국어지원
- 나쁜 예
- 자동번역의 무분별한 사용은 좋지 않음.
- url 파라미터로 지역 지정. 검색엔진이 어느 언어 페이지인지 잘 모르는 경우 많음
- 좋은 예
- 서브 도메인 alternate 태그로 지역 타겟
- url을 해당 언어로 구성
- http:// vs https://
- 한국 사이트는 https:// 의 채택률이 아직 낮은편
- https 에는 암호화 뿐 아니라, 이 페이지가 웹마스터가 만든 그대로다 라는 걸 보증해주는 기능.
- 보증 안된 경우는 하이재킹이 가능.
- 모든 웹페이지가 https 적용하도록 구글에서 노력중, 랭킹 평가 요소 중 하나이기도.
- 나쁜 예
- 차세대 웹을 위한 전제 조건
- http/2
- pwa
- geolocation API
- 리다이렉트 설정, HTST 적용하기
- 서버설정 확인하기 sslabs.com
모바일 시대에 맞는 최적화
- 모바일 색인 우선적
- 여러가지 모바일 페이지 대응 기술
- 적응형 반응형
- 왜 반응형인가.
- 적응형은 거의 2배의 일.
- 속도 절감 -ugernagent 기반의 redirection이 발생하지 않아 오류 줄이고 로딩 빠름.
- 사용자가 동일한 url 사용 가능.
- 3초이상 → 53%가 나감
- 스피드가 검색 순위 결정 요인
- https://developers.google.com/speed/pagespeed/insights/
서치 콘솔의 활용
- 도메인, url 접두어
질문 url 카테고리 잘 만드는게 도움이 되나?
→ 당연히 그렇다. 랭킹이 바로 올라간다고 볼 수는 없지만. 인간이 이해하기 좋은 구조를 만들면, 봇도 이해하기 좋고 장기적으로 좋다.
5. 한국에서 SEO로 살아남기 (from. 사람인)
- 사일로 파괴
- 관리자 수준에서 부서간 협력문화 구축
- SEO 실무자 수준에서 협업 필요
- 담당자는 정책 수립 관리
- 팔로업은 SEO 정책 공유받아서 서비스 정책 고려
- 프로세스 : seo 정책 수립 → 서비스 개선점 정리 → 기존 작업과의 일정 확인 → PM 팔로업 R&R 구분 → 개선 배포
- SEO 프로세스 정리. 일관된 프로세스 정리해서 우선적으로 할 것 정리
- 수집. 색인, 검색 노출, 유입 네단계
- 네 단계에 있어서 해야할 일 정리
- 작업 우선순위 선정
- 콘텐츠의 질과 양. 시의성, 지속가능성
- 현재검색 유입 노출수
- 검색 키워드 공략 가능도
- 기술적 개선을 보조지표로 활용
- SEO sitechecker 점수
- WMT 오류 리포트, site : 검색문서수
- 단기적 지표로 기술적 개선 지표로 사용
- 작업 컨텐츠별 성과 관리
- GA / WMT Master
- 구글 서치콘솔 / developers
- SEO Trend 파악
- Q&A는 커뮤니티
'지니월드 > 경험' 카테고리의 다른 글
[2019] 제7회 널리 웹 접근성 세미나 (0) | 2020.06.17 |
---|---|
[멘토링/2019] 프로그라피 4기 프론트엔드 멘토 (3) | 2020.04.23 |
[발표/20190413] Women Techmakers 2019 (0) | 2019.04.30 |
[20190406] 봄 밤, 반짝이는 헤이조이스 파티 (0) | 2019.04.20 |
[20190329] Women in Developer Circles Seoul <We're just ordinary IT people> (1) | 2019.03.31 |