注册 登录  
 加关注
查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Aruilture

无论何时何地也别忘了自己当初屌丝般的诺言!

 
 
 

日志

 
 

学习爬虫第一课  

2017-04-17 14:27:57|  分类: 小代码 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
因为走的是爬虫方向    所以快速的浏览了一遍python3的书籍     就开始迫不及待的学习写爬虫了!
而我本人是用的python3.6的环境:

首先用到的是Python本身自带的库 URLLIB,BS4(外带的,需要安装) , 这两个库我感觉非常的强大!

 首先我先去获取一下网站的整个源码:

学习爬虫第一课 - aruilture - Aruilture
 
先用urllib库的模块requset.urlopen() 来获取一个网站的html源代码, 
然后再用BS4库的模块BeautifulSoup来整理HTML源代码 
因为用urlopen()爬下来的源代码全部集中在一行了,
所以用了BeautifulSoup来进行排版
 
  评论这张
 
阅读(7)| 评论(0)
推荐

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018