-
구글 이미지 크롤링(Google images download)SWMaestro(Archive) 2019. 5. 29. 15:39
Google images download 라이브러리를 이용한 간단한 크롤링
SWMaestro 과정에서 프로젝트 진행을 하기 위해 이미지들을 모아야 할 일이 생겨 다양한 방법으로
이미지 크롤링하는 방법을 찾아봤지만 이거다 싶은 내용들을 찾기가 힘들었다.
찾아봤던 내용 중 가장 쉽게 구글 이미지를 크롤링할 수 있었던 방법을 소개하고자 한다.
- 라이브러리 다운로드
pip install google_images_download
- 버전에 맞는 chrome driver 설치
https://chromedriver.storage.googleapis.com/index.html
- 파이썬 코드(고양이 사진 크롤링을 위한 코드)
from google_images_download import google_images_download response = google_images_download.googleimagesdownload() arguments = {"keywords":"고양이","limit":100000,"print_urls":True,"chromedriver":"chromedriver.exe"} paths = response.download(arguments) print(paths)
다양한 arguments는 아래의 링크에서 확인할 수 있다.
https://google-images-download.readthedocs.io/en/latest/arguments.html
해당 코드를 실행시킨 폴더의 download/'검색어' 경로로 들어가면 다운로드된 이미지를 확인할 수 있다.
REF