前几天写了个爬虫,用 path、re、BeautifulSoup 爬取的 B 站 python 视频,但是这个爬虫有有个缺陷,没能获取视频的图片信息,如果你去尝试你会发现它根本就不在返回的结果里面。今天就用分析 Ajax 的方法获取到。
分析页面
url = ‘https://api.bilibili.com/x/web-interface/search/type?jsonp=jsonp&&search_type=video&highlight=1&keyword=python&page={}’.format(page)
点一下搜索,这个 url 才会出现,或者点一下下一页
然后就构造这个请求就可以了。需要注意的是最后一个参数不能添加。
代码实战
代码里面有些解释已经很清楚了,在这里再次复习一下
re.sub()
这个函数传入五个参数,前三个是必须传入的 pattern,、repl、 string
第一个是表示的是正则表达式中模式字符串
第二个是要被替换的字符串
第三个是文本字符串剩下两个可选参数,一个是 count 一个是 flag 。
如果你需要一个良好的学习交流环境,那么你可以考虑Python学习交流群:548377875;
如果你需要一份系统的学习资料,那么你可以考虑Python学习交流群:548377875。
时间戳转换成标准格式的时间第一种方法
第二种方法
综上就是这次的全部内容,多加练习继续加油!