크롬 헤드리스 브라우저 사용하기 - 사이트 스크린샷 이미지 저장
우리가 흔하게 사용하는 크롬 브라우저를 이용하는 헤드리스 브라우저 입니다. 헤드리스 브라우저는 우리가 보는 GUI 환경 없이 웹사이트를 방문한다는 의미 입니다. 브라우저 이기 때문에 자바스크립트까지 모두 실제 브라우저와 같이 실행 됩니다.
● 프록시서버를 경유할 경우
--proxy-server=주소:포트
● 실행하고 바로 나오는것이 아니라 약간 기다려야 한다.
- HTML 소스 보기: --dump-dom
- pdf로 저장하기: --print-to-pdf=저장위치및파일명.pdf
- 이미지로 저장하기: --screenshot=저장위치및파일명.jpg
● 헤드리스 브라우저
--headless
● 로그를 보고 싶을때
--enable-logging --log-level=0
● 검은 화면이 나오면 사용해 보세요.
--disable-gpu
● 화면해상도 지정 - 이미지 저장할때 이 크기로 저장됨.
--window-size=1280x4600
● 브라우저 정보 변경하기
이 옵션을 주지 않으면 현재 브라우저의 User-Agent에 headless 가 붙어서 가기 때문에 변경해 줘야 합니다.
--user-agent=
아래는 크롬 헤드리스 브라우저 사용하기 - 사이트 스크린샷 이미지 저장을 pdf로 하는 예 입니다.
jpg로 하고 싶으시면 위에 옵션을 확인 후 pdf 부분을 스크린샷으로 변경해 주면 됩니다.
"C:\Program Files\Google\Chrome\Application\chrome.exe" --headless --disable-gpu --window-size=1920x1024 --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36" --print-to-pdf=C:\t.pdf https://www.pabburi.co.kr/
* 참고사이트
https://developers.google.com/web/updates/2017/04/headless-chrome
항상 그렇듯이 저장 위치나 실행 파일 같은 경우는 본인의 환경에 맞게 수정해서 사용하면 됩니다.