python网络爬虫
发布网友
发布时间:2022-03-03 16:13
我来回答
共2个回答
热心网友
时间:2022-03-03 17:42
警告你没有按照他规定的格式BeautifulSoup(html, 'markup_type')
你应该是在代码中直接用BeautifulSoup(html), 没有指定用什么来解析你的html, 他就会用一种最合适的方法来解析, 一般我用lxml, 你也可以自己改成别的
所以把代码里的BeautifulSoup(html)改成BeautifulSoup(html, 'lxml')即可
热心网友
时间:2022-03-03 19:00
你html是urlopen返回的结果,是个response,所以要加一步
html = response.read()
如果你是python3的话,注意html是byte类型的,你要转成str