Python urlopen의 HTTP Error 403: Forbidden
2020. 6. 18. 20:13ㆍ서버 프로그래밍
urlopen과 BeautifulSoup을 이용하여 웹사이트에서 정보를 파싱하는 기능을 구현했는데, 적지 않은 외국 사이트에서 "HTTP Error 403: Forbidden" 에러가 발생했다. 아마도 외국 사이트들은 쿠키 사용을 승인 받는 팝업이 뜨는 것 때문에 정상적으로 결과값을 가져오지 못하는 것으로 추정된다. 별의별 방법으로 대안을 만들어도 안되기에...
from urllib.request import urlopen
from bs4 import BeautifulSoup
word = 'house'
r = urlopen('https://www.google.pl/search?&dcr=0&tbm=isch&q='+word)
data = r.read()
https://stackoverflow.com/questions/47594331/python-3-urlopen-http-error-403-forbidden
그래서 아예 방법을 바꿔서 해보았더니 너무나 잘된다. 뭐냐 이게...
import requests
r = requests.get('https://sneakernews.com/category/adidas/')
html = r.text