from selenium import webdriver from bs4 import BeautifulSoup ##webdriver 경로설정해주기 driver = webdriver.Chrome('webdriver 경로 설정') driver = webdriver.Chrome() driver.get('url 주소') ##브라우저에서 사용되는 엔진 자체에서 파싱되는 시간을 기다려주는 메소드 ##에러 방지를 위해 넉넉히 시간을 잡아줍니다. driver.implicitly_wait(3) ##page soure 를 html 에 넣습니다. html = driver.page_source ##파싱 속도를 향상시키기 위해 html 대신 lxml 을 사용 soup = BeatifulSoup(html, 'lxml') ##beautifulsoup 에는 html 파서 (= 파이썬 표준라이브러리) 를 지원하고 사용합니다. ##다만, html 파서보다 lxml 이라는 모듈이 속도에 있어서 장점이 있어 많이 사용합니다. ##그래서 보통 soup = BeatifulSoup(html, 'lxml') 이라는 코드를 많이 보게 됩니다. |
이 코드를 실행시키면, 아래처럼 뜰 것이다.
bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to install a parser library?
친절하게도 잘 알려주고 있다. "pasrer library 인 lxml 을 설치했는가?"
pip install lxml
lxml 설치하면 이 문제는 바로 해결 된다.
'IT > 코딩' 카테고리의 다른 글
[github] 깃헙 터미널에 토큰 적용시키기 (token login) (0) | 2021.08.14 |
---|---|
[IOS DEVELOPER] 애플 개발자 등록하는 절차! (0) | 2021.01.05 |
[코코아팟] Error installing cocoapods 에러. 재설치하는 방법 (0) | 2021.01.05 |
[파이썬] driver.implicitly_wait 와 time.sleep 차이점 (0) | 2020.12.01 |