크롤링 - 오솔길

Selenium 크롬 안 띄우고 background 사용 방법

2024-06-122024-05-19 작성자: 나루

Selenium 크롬 브라우저를 눈에 보이지 않도록 background에서 실행되게 하는 방법을 알아보도록 하겠습니다. Selenium 크롬 브라우저 안 띄우는 옵션 Options 인스턴스 객체에 add_argument로 –headless=new값을 지정해 주면 Selenium을 이용해서 크롬 브라우저를 띄우지 않고 background에서 작동하게 할 수 있습니다. 위의 코드를 실행하면 브라우저가 실행되지 않고 네이버 홈페이지의 페이지 소스를 가져오는 것을 확인할 수 있습니다. 크롬 버전에 따른 차이 … 더 읽기

Selenium 크롬 꺼짐 현상의 원인과 해결책

2024-06-122024-05-15 작성자: 나루

Selenium으로 크롬 브라우저를 이용할 때 Python 코드 종료 후에도 Selenium 크롬 꺼짐을 방지하는 방법을 살펴보겠습니다. Selenium 크롬 꺼짐 현상의 원인 아래의 코드에서는 셀레니움의 크롬 드라이버를 이용해 크롬 브라우저를 실행해서 osg.kr 웹 페이지를 여는 작업을 하게 됩니다. 하지만 크롬 브라우저는 열리자마자 종료됩니다. 왜일까요? 기본적으로 Python 코드가 종료되면 해당 프로세스를 마쳤으므로 당연히 Selenium으로 실행한 크롬 브라우저 또한 … 더 읽기

Python BeautifulSoup4 사용방법

2024-05-142017-06-13 작성자: 나루

Python beautifulsoup4 사용법으로 문서의 제목을 가져오고 표의 값을 가져와 보도록 하겠습니다. Python BeautifulSoup4 개요 BeautifulSoup4는 Python에서 HTML 문서나 XML 문서를 파싱하는데 사용할 수 있습니다. PyPi에서 제공되는 현재 최신 버전은 4.12.3입니다. beautifulsoup3는 2020년도에 drop 되었다고 하니 bs4를 이용하시기 바랍니다. 문서의 제목 읽어오기 문서의 제목을 읽어오도록 하겠습니다. HTML에서 문서의 제목은 head 태그 아래의 title 태그 내에 표현합니다. … 더 읽기