Example(1)
from bs4 import BeautifulSoup
html = """
<html><body>
<h1>스크레핑이란?</h1>
<p>웹 페이지를 분석하는 것</p>
<p>원하는 부분을 추출하는 것</p>
</body></html>
"""
soup = BeautifulSoup(html, 'html.parser')
print(soup)
h1 = soup.html.body.h1
print(h1)
p = soup.html.body.p
print(p)
p1 = p.next_sibling.next_sibling
print(p1)
print("h1:", h1.string)
print("p:", p.string)
print("p1:", p1.string)
Example(2)
from bs4 import BeautifulSoup
html = """
<html><body>
<div id="meigen">
<h1>위키북스 도서</h1>
<ul class="items">
<li>유니티 게임 이펙트 입문</li>
<li>스위프트로 시작하는 아이폰 앱 개발 교과서</li>
<li>모던 웹사이트 디자인의 정석</li>
</ul>
</div>
</body></html>
"""
soup = BeautifulSoup(html, 'html.parser')
h1 = soup.find('h1').string
print(h1)
h1_1 = soup.select_one('h1').string
print(h1_1)
h1_2 = soup.select_one('div > h1').string
print(h1_2)
h1_3 = soup.select_one('div#meigen > h1').string
print(h1_3)
li_list = soup.select('div#meigen > ul.items >li')
print(li_list)
for li in li_list:
print(li.string)
lis = soup.select('li')
print(lis)
for li in lis:
print(li.string)