본문 바로가기
애매한 박사 엄마의 포트폴리오/엄마의 포트폴리오

[사이드프로젝트0-키워드 마인드맵] G에서 충ㅂ 검색

by Man_from 2022. 12. 6.

- N에서는 연관 검색어 나오는 페이지의 링크가 아주 깔끔하고 결괏값도 JSON형식으로 나와서 파싱 하기가 쉬웠는데, G는 링크가 매우 추잡스러울 뿐만 아니라 결과 형식도 첨 보는 거고, XHR을 get하고 ...

- 도저히 내 지식으로는 할 수 없을 것 같아서 그냥 selenium의 find_elements로 진행했다. 금방 할 정도로 이 방법은 쉽다.

N에서 검색했을 때와 비슷한 듯 다른 듯 하다. 가장 먼저 나오는 연관어가 서로 다른 게 인상깊다.

- 이제까지 해온 대로 단순 연관검색어로만 키워드들을 엮을 수는 없음. (분류가 한쪽으로 쏠림, 맵핑을 더 나아가기가 어려움)

- 남편이 제안해 준대로 발간물 아카이브에서 추출하는 작업을 진행할 계획


아래는 N과 똑같은 방법으로 하려다가 삽질만 열심히 했던 흔적이다... ↑ 위에 있는 것만 보면 되겠다. 


Q1. 같은 단어를 다른 브라우저(크롬/웨일)에서 검색했을 때 다른 관련 검색어 결과가 나옴.

Q2. (크롬에서만 확인) 같은 브라우저에서 검색할 때도 다른 결과가 나옴 or 관련 검색어 보여주는 url을 직접 입력했을 때 다시 검색한 것과 다름.

---> 이건 어쩔 수 없다. 그냥 넘어가자.

 

연관검색어 추출 방법

- 검색창에 입력한 단어의 연관 검색어(관련검색어)를 크롤링 하기

1. 검색창에 아무 단어를 입력

2. F12 검사

3. Network 탭에서 'All' 선택

4. 검색창 아래 목록에 있는 단어 중 하나 검색

5. 검색되면 더블클릭해서 Name 탭에서 확인

 

- G사이트의 경우, search?q= 가 몇 개 뜰 텐데 가장 아래에 있는 것을 선택하면 된다. 위에 있는 건 단어가 완성되기 전의 관련검색어.