- N에서는 연관 검색어 나오는 페이지의 링크가 아주 깔끔하고 결괏값도 JSON형식으로 나와서 파싱 하기가 쉬웠는데, G는 링크가 매우 추잡스러울 뿐만 아니라 결과 형식도 첨 보는 거고, XHR을 get하고 ...
- 도저히 내 지식으로는 할 수 없을 것 같아서 그냥 selenium의 find_elements로 진행했다. 금방 할 정도로 이 방법은 쉽다.
- 이제까지 해온 대로 단순 연관검색어로만 키워드들을 엮을 수는 없음. (분류가 한쪽으로 쏠림, 맵핑을 더 나아가기가 어려움)
- 남편이 제안해 준대로 발간물 아카이브에서 추출하는 작업을 진행할 계획
아래는 N과 똑같은 방법으로 하려다가 삽질만 열심히 했던 흔적이다... ↑ 위에 있는 것만 보면 되겠다.
Q1. 같은 단어를 다른 브라우저(크롬/웨일)에서 검색했을 때 다른 관련 검색어 결과가 나옴.
Q2. (크롬에서만 확인) 같은 브라우저에서 검색할 때도 다른 결과가 나옴 or 관련 검색어 보여주는 url을 직접 입력했을 때 다시 검색한 것과 다름.
---> 이건 어쩔 수 없다. 그냥 넘어가자.
연관검색어 추출 방법
- 검색창에 입력한 단어의 연관 검색어(관련검색어)를 크롤링 하기
1. 검색창에 아무 단어를 입력
2. F12 검사
3. Network 탭에서 'All' 선택
4. 검색창 아래 목록에 있는 단어 중 하나 검색
5. 검색되면 더블클릭해서 Name 탭에서 확인
- G사이트의 경우, search?q= 가 몇 개 뜰 텐데 가장 아래에 있는 것을 선택하면 된다. 위에 있는 건 단어가 완성되기 전의 관련검색어.
'애매한 박사 엄마의 포트폴리오 > 엄마의 포트폴리오' 카테고리의 다른 글
자본주의, 공산주의, 그리고? (0) | 2022.12.16 |
---|---|
[사이드프로젝트0-키워드 마인드맵] 도서관 자료에 한정 (0) | 2022.12.13 |
[사이드프로젝트0-키워드 마인드맵] 충ㅂ 슬로건 (1) | 2022.12.04 |
(후기) 최근 작업한 것들 2022.11.16 (2) | 2022.12.02 |
[사이드프로젝트1-포인트 적립] GUI (0) | 2022.12.01 |