2swan
Python 스크래핑 본문
Example(1)
from bs4 import BeautifulSoup
html = """
<html><body>
<h1>스크레핑이란?</h1>
<p>웹 페이지를 분석하는 것</p>
<p>원하는 부분을 추출하는 것</p>
</body></html>
"""
soup = BeautifulSoup(html, 'html.parser')
print(soup)
h1 = soup.html.body.h1
print(h1)
p = soup.html.body.p
print(p)
p1 = p.next_sibling.next_sibling
print(p1)
print("h1:", h1.string)
print("p:", p.string)
print("p1:", p1.string)
Example(2)
from bs4 import BeautifulSoup
html = """
<html><body>
<div id="meigen">
<h1>위키북스 도서</h1>
<ul class="items">
<li>유니티 게임 이펙트 입문</li>
<li>스위프트로 시작하는 아이폰 앱 개발 교과서</li>
<li>모던 웹사이트 디자인의 정석</li>
</ul>
</div>
</body></html>
"""
soup = BeautifulSoup(html, 'html.parser')
h1 = soup.find('h1').string
print(h1)
h1_1 = soup.select_one('h1').string
print(h1_1)
h1_2 = soup.select_one('div > h1').string
print(h1_2)
h1_3 = soup.select_one('div#meigen > h1').string
print(h1_3)
li_list = soup.select('div#meigen > ul.items >li')
print(li_list)
for li in li_list:
print(li.string)
lis = soup.select('li')
print(lis)
for li in lis:
print(li.string)
'Programming > Python' 카테고리의 다른 글
Python 데이터분석 Mysql (1) | 2023.10.15 |
---|---|
Python 크롤링 예제 (0) | 2023.10.15 |
데이터 분석 1번째 숫자 ~ 4번째 숫자 합계 (0) | 2023.08.31 |
데이터 분석 변수에 키보드로 직접 값을 입력 (0) | 2023.08.31 |
데이터 분석 계산기 프로그램 (0) | 2023.08.31 |