본문 바로가기
애매한 박사 엄마의 포트폴리오/엄마의 포트폴리오

연관 키워드 추출

by Man_from 2022. 11. 23.

- 오늘도 유투브 강의 참고하여 colab에서 실행

- 1년 전 동영상이라 그대로 따라하니 안 되는 부분이 발생하는데, 역시 검색으로 다 해결 가능

'난 왜 1년 전 것을 보고 있는가...'

- Colab 에서 Mecab 사용하기 (tistory.com)

 

Colab 에서 Mecab 사용하기

import os # install konlpy, jdk, JPype !pip install konlpy !apt-get install openjdk-8-jdk-headless -qq > /dev/null !pip3 install JPype1-py3 # install mecab-ko os.chdir('/tmp/') !curl -LO https://bitbucket.org/eunjeon/mecab-ko/downloads/mecab-0.996-ko-0.9.2

sosomemo.tistory.com

- 강의 동영상과 아직 다른 부분은:

 1. 첫번째 데이터 누락됨

 2. 사전화가 안 됨

 3. 시각화에서 글자가 나오지 않음. 글자수만큼 네모로만 나옴.

 

이런 문제가 있어도, 지난 번 공부했던 크롤링과 합쳐서 중심 키워드 - 연관 키워드 트리는 그려볼 수 있겠다!