파이썬으로 웹 크롤링 시작하기

HTML과 XML 파싱에 사용되는 python 패키지로 BeautifulSoup이 있다. 현재 버전은 4.4.0이다. BeautifulSoup의 문서는 다음 한 페이지에 모두 설명되어 있다. 한 페이지의 양이 좀 길기는 하다. 한글문서가 있었던 것 같은데 지금은 링크가 깨져있다. 문서: https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 코드: [code language=”python”] from bs4 import BeautifulSoup html_string = ”’ <html> <head> <title>나루의 HTML parsing</title> </head> <body> </body> </html> ”’ soup = … Read more