2021
02-21
02-21
python数据抓取3种方法总结
三种数据抓取的方法正则表达式(re库)BeautifulSoup(bs4)lxml*利用之前构建的下载网页函数,获取目标网页的html,我们以https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/为例,获取html。fromget_htmlimportdownloadurl='https://guojiadiqu.bmcx.com/AFG__guojiayudiqu/'page_content=download(url)*假设我们需要爬取该网页中的国家名称和概况,我们依次使用这三种数据抓取的方法实现数据抓取。1.正则表达式from...
继续阅读 >