python网络爬虫

发布网友发布时间：2022-03-03 16:13

共2个回答

热心网友时间：2022-03-03 17:42

警告你没有按照他规定的格式BeautifulSoup(html, 'markup_type')
你应该是在代码中直接用BeautifulSoup(html), 没有指定用什么来解析你的html, 他就会用一种最合适的方法来解析, 一般我用lxml, 你也可以自己改成别的
所以把代码里的BeautifulSoup(html)改成BeautifulSoup(html, 'lxml')即可

热心网友时间：2022-03-03 19:00

你html是urlopen返回的结果，是个response,所以要加一步
html = response.read()
如果你是python3的话，注意html是byte类型的，你要转成str

声明：本网页内容为用户发布，旨在传播知识，不代表本网认同其观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。E-MAIL:11247931@qq.com

首页

文章

python网络爬虫