Tech/Web Scrapping

beautifulsoup 사용법

kimjingyu 2023. 8. 17. 16:55
728x90
  • select()는 조건을 만족하는 모든 요소를 리스트에 담아 반환한다.
  • select_one()은 그 중에 가장 위에 나오는 요소를 반환한다.
  • 선택자는 CSS를 작성할 때 사용하는 것과 똑같이 사용하면 된다.
# 선택자를 사용하는 방법 -> copy selector
soup.select('태그명')
soup.select('.클래스명')
soup.select('#아이디명')

# 위를 조금 더 구체화해서 어떤 경로를 거쳐 요소를 찾아야 되는지 명시할 수 있다.
soup.select('상위태그명 > 하위태그명 > 하위태그명')
soup.select('상위태그명.클래스명 > 하위태그명.클래스명')

# 여러개의 li 태그를 가질 때, 몇 번째 li 인지를 부모의 몇 번째 자식인지 명시해서 지정할 수 있다.
soup.select('.클래스명:nth-child(자식의순서)')

# 태그와 속성값으로 찾는 방법
soup.select('태그명[속성="값"]')

# 한 개만 가져오고 싶은 경우
soup.select_one('.클래스명 > 태그명')
728x90