以pycharm环境为例:
首先需要安装各种库(urllib:requests:Openssl-python等)
python爬虫中需要用到的库,大致可分为:1、实现 HTTP 请求操作的请求库;2、从网页中提取信息的解析库;3、Python与数据库交互的存储库;4、爬虫框架;5、Web框架库。
一、请求库
实现 HTTP 请求操作
1、urllib:一系列用于操作URL的功能。
2、requests:基于 urllib 编写的,阻塞式 HTTP 请求库,发出一个请求,一直等待服务器响应后,程序才能进行下一步处理。
3、selenium:自动化测试工具。一个调用浏览器的 driver,通过这个库你可以直接调用浏览器完成某些操作,比如输入验证码。
4、aiohttp:基于 asyncio 实现的 HTTP 框架。异步操作借助于 async/await 关键字,使用异步库进行数据抓取,可以大大提高效率。
二、解析库
从网页中提取信息
1、beautifulsoup:html 和 XML 的解析,从网页中提取信息,同时拥有强大的API和多样解析方式。
2、pyquery:jQuery 的 Python 实现,能够以 jQuery 的语法来操作解析 HTML 文档,易用性和解析速度都很好。
3、lxml:支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。
4、tesserocr:一个 OCR 库,在遇到验证码(图形验证码为主)的时候,可直接用 OCR 进行识别。
三、存储库
Python与数据库交互
1、pymysql:一个纯 Python 实现的 MySQL 客户端操作库。
2、pymongo:一个用于直接连接 mongodb 数据库进行查询操作的库。
3、redisdump:一个用于 redis 数据导入/导出的工具。基于 ruby 实现的,因此使用它,需要先安装 Ruby。
四、爬虫框架
1、Scrapy:很强大的爬虫框架,可以满足简单的页面爬取(比如可以明确获知url pattern的情况)。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。但是对于稍微复杂一点的页面,如 weibo 的页面信息,这个框架就满足不了需求了。
2、Crawley:高速爬取对应网站的内容,支持关系和非关系数据库,数据可以导出为 JSON、XML 等。
3、Portia:可视化爬取网页内容。
4、newspaper:提取新闻、文章以及内容分析。
5、python-goose:java 写的文章提取工具。
6、cola:一个分布式爬虫框架。项目整体设计有点糟,模块间耦合度较高。
五、Web框架库
1、flask:轻量级的 web 服务程序,简单,易用,灵活,主要来做一些 API 服务。做代理时可能会用到。
2、django:一个 web 服务器框架,提供了一个完整的后台管理,引擎、接口等,使用它可做一个完整网站。
爬取前需添加软件库,方法如下:
我们以爬取某贴吧评论为实例,代码如下:
import csv
import requests
import re
import time
def main(page):
url = f'https://tieba.baidu.com/p/7394085357'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'
}
resp = requests.get(url,headers=headers)
html = resp.text
# 评论内容
comments = re.findall('style="display:;"> (.*?)</div>',html)
# 评论用户
users = re.findall('class="p_author_name j_user_card" href=".*?" target="_blank">(.*?)</a>',html)
# 评论时间
comment_times = re.findall('楼</span><span class="tail-info">(.*?)</span><div',html)
for u,c,t in zip(users,comments,comment_times):
# 筛选数据,过滤掉异常数据
if 'img' in c or 'div' in c or len(u)>50:
continue
csvwriter.writerow((u,t,c))
print(u,t,c)
print(f'第{page}页爬取完毕')
if __name__ == '__main__':
with open('01.csv','a',encoding='utf-8')as f:
csvwriter = csv.writer(f)
csvwriter.writerow(('评论用户','评论时间','评论内容'))
for page in range(1,8): # 爬取前7页的内容
main(page)
time.sleep(2)
运行结果为:
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第1页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第2页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第3页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第4页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第5页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第6页爬取完毕
pps卡 2021-06-08 15:55 ❓问:热血神器是什么,在哪里下载?<br><br>❣️答:17年以前的“热血宝宝挂”已经改名“热血神器”并纳为官方挂,后来有部分盗用宝宝名字的外挂,某些存在盗号风险,官方打压不建议使用!<br>热血神器下载地址,官网,充值中心,私享服务下面有链接,贴吧右侧也有链接。<br><br>首先下载两个热血神器,一个收费版一个免费版,收费版本的某些功能收费但是可以免费查店和免费多开,打开查线器可以查看每个服务器的情况。
Cz灬风 2021-06-08 16:02 本帖水贴是会被删除的哦,不要水贴哈~❤️可以楼层里面回复提问!
贴吧用户_QCbRR32 2021-06-08 16:26 升到10级转完职去九泉,能免费带到40级(进去会有人自动组你的,只限10级-30级),如果是晚上的话你能到五十几级,(因为晚上后半夜代练睡觉了不会踢人)。弓箭手,刺客这两个职业可能不会组,有些开了职业过滤的。
第7页爬取完毕
进程已结束,退出代码为 0
然后我们以访问百度为例,代码如下:
from urllib import request
req = request.urlopen("http://www.baidu.com")
print(req.read().decode("utf-8"))
返回结果如下:
F:\software\pythonProject\venv\Scripts\python.exe F:\software\pythonProject\0104.py
<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="Content-Type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1"><meta content="always" name="referrer"><meta name="theme-color" content="#ffffff"><meta name="description" content="全球领先的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。百度超过千亿的中文网页数据库,可以瞬间找到相关的搜索结果。"><link rel="shortcut icon" href="https://www.baidu.com/favicon.ico" type="image/x-icon" /><link rel="search" type="application/opensearchdescription+xml" href="/content-search.xml" title="百度搜索" /><link rel="icon" sizes="any" mask href="https://www.baidu.com/favicon.ico"><link rel="dns-prefetch" href="//dss0.bdstatic.com"/><link rel="dns-prefetch" href="//dss1.bdstatic.com"/><link rel="dns-prefetch" href="//ss1.bdstatic.com"/><link rel="dns-prefetch" href="//sp0.baidu.com"/><link rel="dns-prefetch" href="//sp1.baidu.com"/><link rel="dns-prefetch" href="//sp2.baidu.com"/><link rel="dns-prefetch" href="//pss.bdstatic.com"/><link rel="apple-touch-icon-precomposed" href="https://psstatic.cdn.bcebos.com/video/wiseindex/aa6eef91f8b5b1a33b454c401_1660835115000.png"><title>百度一下,你就知道</title><style index="newi" type="text/css">#form .bdsug{top:39px}.bdsug{display:none;position:absolute;width:535px;background:#fff;border:1px wrap::before{content:"";width:38px;height:38px;position:absolute;top:0;right:0;left:0;bottom:0;border:1px solid rgba(0,0,0,.06);border-radius:9px}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .left-img{box-sizing:border-box;float:left;width:40px;height:40px;border:1px solid rgba(0,0,0,.06);border-radius:9px;margin-right:6px}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .content{float:left}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .header{margin-bottom:6px;line-height:18px;height:18px;vertical-align:middle}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .name{float:left;font-size:18px;color:#222;font-weight:500}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .tag-img{width:18px;margin-left:4px}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .more{line-height:14px;width:240px}#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .brief,#head_wrapper #form .bdsug-new ul li .direct-sug-wrap .info{font-size:14px;color:#222;format('truetype'),url('https://pss.bdstatic.com/static/superman/font/iconfont-74fcdd51ab.svg#iconfont') format('svg')}
.c-gap-top-small{margin-top:3px}
.c-font-medium{font:14px/24px Arial,sans-serif}
.c-font-middle{font:14px/24px Arial,sans-serif}
.c-font-normal{font:13px/23px Arial,sans-serif}
.c-input-xmini{width:154px}
.c-input-xmini input{width:134px}
.c-input-mini{width:202px}
.c-input-mini input{width:182px}
.c-input-small{width:346px}
.s-skin-hasbg #head_wrapper #form #kw.new-ipt-focus{border-color:#4569ff}
.s-skin-hasbg #head_wrapper #s_lm_wrap{background-image:none;filter:none}
.s-skin-hasbg #head_wrapper #s_lm_wrap .links-wrap{background-color:rgba(255,255,255,.65)!important;padding:0 12px;border-radius:6px}
.s-skin-hasbg #head_wrapper #s_lm_wrap .links-wrap .icon{margin-top:13px}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search #kw{border-color:#4e6ef2;padding-top:11px;padding-bottom:11px;height:18px;line-height:18px}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search #kw:hover{border-color:#1d4fff;opacity:1;filter:alpha(opacity=100)\9}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search #kw:focus{border-color:#1d4fff!important;opacity:1;filter:alpha(opacity=100)\9}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search #kw.new-ipt-focus{border-color:#1d4fff}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search .s_btn_wr{height:44px}
.s-skin-hasbg #head_wrapper.s-down #form.sam_search
,
"t11.baidu.com":"t11.baidu.com"
,
"t12.baidu.com":"t12.baidu.com"
,
"play.baidu.com":"dss3.baidu.com\/5LgHhXSm2Q5IlBGlnYG"
,
"olime.baidu.com":"sp1.baidu.com\/8bg4cTva2gU2pMbgoY3K"
{modName[i]=this.svnMod+":"+modName[i]}}}evt.on(modName,evtName,handler)});F._setContextMethod("unListen",function(modName,evtName,handler){evt.un(this.svnMod+":"+this.modName,evtName,handler)})});F._loadScriptTimeout=15e3;F._useConfig=true;F._firstScreenCSS=F._firstScreenCSS||[];F._firstScreenCSS.push("/css/super_min-6f52ab3317.css");F._firstScreenJS=F._firstScreenJS||[];F._firstScreenJS.push("/js/min_super-ade0e81d30.js");</script><script>
$(window).on("load", function() {
var e = $('#virus-2020');
e.click(function() {
$.setCookie('virus-2020-clicked', '1');
e.removeClass('dot');
});
var hasClicked = $.getCookie && $.getCookie('virus-2020-clicked');
if (!hasClicked) {
e.addClass('dot');
}
});
</script><script src="https://pss.bdstatic.com/static/superman/js/s_super_index-3fffae8d60.js"></script><script src="https://pss.bdstatic.com/static/superman/js/min_super-ade0e81d30.js"></script><script>
if(navigator.cookieEnabled){
document.cookie="NOJS=;expires=Sat, 01 Jan 2000 00:00:00 GMT";
}
</script><script src="https://pss.bdstatic.com/static/superman/js/components/hotsearch-ea3ea684d5.js"></script><script defer src="//hectorstatic.baidu.com/cd37ed75a9387c5b.js"></script></body></html>
进程已结束,退出代码为 0
以下示例为爬取豆瓣影评中相关电影信息:
import re
from time import sleep
import requests
from lxml import etree
import random
import csv
def main(page,f):
url = f'https://movie.douban.com/top250?start
headers = {'User-Agent': 'Mozilla/5.0 (Window
resp = requests.get(url,headers=headers)
tree = etree.HTML(resp.text)
# 获取详情页的链接列表
href_list = tree.xpath('//*[@id="content"]/di
# 获取电影名称列表
name_list = tree.xpath('//*[@id="content"]/di
for url,name in zip(href_list,name_list):
f.flush() # 刷新文件
try:
get_info(url,name) # 获取详情页的信息
except:
pass
sleep(1 + random.random()) # 休息
print(f'第{i+1}页爬取完毕')
def get_info(url,name):
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10
'Host': 'movie.douban.com',
}
resp = requests.get(url,headers=headers)
html = resp.text
tree = etree.HTML(html)
# 导演
dir = tree.xpath('//*[@id="info"]/span[1]/spa
# 电影类型
type_ = re.findall(r'property="v:genre">(.*?)
type_ = '/'.join(type_)
# 国家
country = re.findall(r'地区:</span> (.*?)<br',h
# 上映时间
time = tree.xpath('//*[@id="content"]/h1/span
time = time[1:5]
# 评分
rate = tree.xpath('//*[@id="interest_sectl"]/
# 评论人数
people = tree.xpath('//*[@id="interest_sectl"
print(name,dir,type_,country,time,rate,people
csvwriter.writerow((name,dir,type_,country,ti
if __name__ == '__main__':
# 创建文件用于保存数据
with open('03-movie-xpath.csv','a',encoding='
csvwriter = csv.writer(f)
# 写入表头标题
csvwriter.writerow(('电影名称','导演','电影类型','国
for i in range(10): # 爬取10页
main(i,f) # 调用主函数
sleep(3 + random.random())
结果如下:
F:\software\pythonProject\venv\Scripts\python.exe F:\software\pythonProject\0104.py
肖申克的救赎 弗兰克·德拉邦特 剧情/犯罪 美国 1994 9.7 2970956
霸王别姬 陈凯歌 剧情/爱情/同性 中国大陆 / 中国香港 1993 9.6 2195435
阿甘正传 罗伯特·泽米吉斯 剧情/爱情 美国 1994 9.5 2214234
泰坦尼克号 詹姆斯·卡梅隆 剧情/爱情/灾难 美国 / 墨西哥 1997 9.5 2250474
这个杀手不太冷 吕克·贝松 剧情/动作/犯罪 法国 / 美国 1994 9.4 2345597
千与千寻 宫崎骏 剧情/动画/奇幻 日本 2001 9.4 2297573
美丽人生 罗伯托·贝尼尼 剧情/喜剧/爱情/战争 意大利 1997 9.5 1356953
星际穿越 克里斯托弗·诺兰 剧情/科幻/冒险 美国 / 英国 / 加拿大 2014 9.4 1907376
盗梦空间 克里斯托弗·诺兰 剧情/科幻/悬疑/冒险 美国 / 英国 2010 9.4 2117347
辛德勒的名单 史蒂文·斯皮尔伯格 剧情/历史/战争 美国 1993 9.5 1146304
楚门的世界 彼得·威尔 剧情/科幻 美国 1998 9.4 1767460
忠犬八公的故事 拉斯·霍尔斯道姆 剧情 美国 / 英国 2009 9.4 1426347
海上钢琴师 朱塞佩·托纳多雷 剧情/音乐 意大利 1998 9.3 1715143
三傻大闹宝莱坞 拉吉库马尔·希拉尼 剧情/喜剧/爱情/歌舞 印度 2009 9.2 1900572
放牛班的春天 克里斯托夫·巴哈蒂 剧情/音乐 法国 / 瑞士 / 德国 2004 9.3 1344576
机器人总动员 安德鲁·斯坦顿 科幻/动画/冒险 美国 2008 9.3 1348425
疯狂动物城 拜伦·霍华德 喜剧/动画/冒险 美国 2016 9.2 2000509
无间道 刘伟强 剧情/惊悚/犯罪 中国香港 2002 9.3 1403466
控方证人 比利·怀尔德 剧情/悬疑/犯罪 美国 1957 9.6 590063
大话西游之大圣娶亲 刘镇伟 喜剧/爱情/奇幻/古装 中国香港 / 中国大陆 1995 9.2 1568295
熔炉 黄东赫 剧情 韩国 2011 9.4 953101
教父 弗朗西斯·福特·科波拉 剧情/犯罪 美国 1972 9.3 994396
触不可及 奥利维埃·纳卡什 剧情/喜剧 法国 2011 9.3 1151450
当幸福来敲门 加布里埃莱·穆奇诺 剧情/家庭/传记 美国 2006 9.2 1554233
寻梦环游记 李·昂克里奇 喜剧/动画/音乐/奇幻 美国 2017 9.1 1737002
第1页爬取完毕
末代皇帝 贝纳尔多·贝托鲁奇 剧情/传记/历史 英国 / 意大利 / 中国大陆 / 法国 1987 9.3 914130
龙猫 宫崎骏 动画/奇幻/冒险 日本 1988 9.2 1295357
怦然心动 罗伯·莱纳 剧情/喜剧/爱情 美国 2010 9.1 1876835
活着 张艺谋 剧情/家庭/历史 中国大陆 / 中国香港 1994 9.3 871445
哈利·波特与魔法石 克里斯·哥伦布 奇幻/冒险 美国 / 英国 2001 9.2 1232059
蝙蝠侠:黑暗骑士 克里斯托弗·诺兰 剧情/动作/科幻/惊悚/犯罪 美国 / 英国 2008 9.2 1089328
指环王3:王者无敌 彼得·杰克逊 剧情/动作/奇幻/冒险 美国 / 新西兰 2003 9.3 824818
我不是药神 文牧野 剧情/喜剧 中国大陆 2018 9.0 2154381
乱世佳人 维克多·弗莱明 剧情/爱情/历史/战争 美国 1939 9.3 709702
飞屋环游记 彼特·道格特 剧情/喜剧/动画/冒险 美国 2009 9.1 1360858
素媛 李濬益 剧情 韩国 2013 9.3 705303
十二怒汉 西德尼·吕美特 剧情 美国 1957 9.4 507681
哈尔的移动城堡 宫崎骏 动画/奇幻/冒险 日本 2004 9.1 1055548
让子弹飞 姜文 剧情/喜剧/动作/西部 中国大陆 / 中国香港 2010 9.0 1742660
何以为家 娜丁·拉巴基 剧情 黎巴嫩 / 美国 / 法国 / 塞浦路斯 / 卡塔尔 / 英国 2018 9.1 1070164
摔跤吧!爸爸 涅提·蒂瓦里 剧情/家庭/传记/运动 印度 2016 9.0 1603543
猫鼠游戏 史蒂文·斯皮尔伯格 剧情/传记/犯罪 美国 / 加拿大 2002 9.1 1062132
天空之城 宫崎骏 动画/奇幻/冒险 日本 1986 9.2 902121
鬼子来了 姜文 剧情/喜剧 中国大陆 2000 9.3 643508
海蒂和爷爷 阿兰·葛斯彭纳 剧情/家庭/冒险 德国 / 瑞士 2015 9.3 646778
少年派的奇幻漂流 李安 剧情/奇幻/冒险 美国 / 中国台湾 / 英国 / 加拿大 2012 9.1 1377947
钢琴家 罗曼·波兰斯基 剧情/音乐/传记/战争 英国 / 法国 / 波兰 / 德国 2002 9.3 662393
大话西游之月光宝盒 刘镇伟 喜剧/爱情/奇幻/古装 中国香港 / 中国大陆 1995 9.0 1248761
指环王2:双塔奇兵 彼得·杰克逊 剧情/动作/奇幻/冒险 美国 / 新西兰 2002 9.2 774073
闻香识女人 马丁·布莱斯特 剧情 美国 1992 9.1 913807
第2页爬取完毕
死亡诗社 彼得·威尔 剧情 美国 1989 9.2 753065
绿皮书 彼得·法雷里 剧情/喜剧/音乐/传记 美国 / 中国大陆 2018 8.9 1696002
罗马假日 威廉·惠勒 剧情/喜剧/爱情 美国 1953 9.1 970351
大闹天宫 万籁鸣 剧情/动画/奇幻/古装 中国大陆 1961 9.4 452199
天堂电影院 朱塞佩·托纳多雷 剧情/爱情 意大利 / 法国 1988 9.2 691790
指环王1:护戒使者 彼得·杰克逊 剧情/动作/奇幻/冒险 新西兰 / 美国 2001 9.1 869488
黑客帝国 莉莉·沃卓斯基 动作/科幻 美国 1999 9.1 858363
教父2 弗朗西斯·福特·科波拉 剧情/犯罪 美国 1974 9.3 569042
狮子王 罗杰·阿勒斯 动画/歌舞/冒险 美国 1994 9.1 867511
辩护人 杨宇硕 剧情 韩国 2013 9.2 601811
饮食男女 李安 剧情/家庭 中国台湾 / 美国 1994 9.2 639042
搏击俱乐部 大卫·芬奇 剧情/动作/悬疑/惊悚 美国 1999 9.0 868549
本杰明·巴顿奇事 大卫·芬奇 剧情/爱情/奇幻 美国 2008 9.0 1008553
美丽心灵 朗·霍华德 剧情/传记 美国 2001 9.1 787244
穿条纹睡衣的男孩 马克·赫尔曼 剧情/战争 英国 / 美国 2008 9.2 582152
窃听风暴 弗洛里安·亨克尔·冯·多纳斯马尔克 剧情/悬疑 德国 2006 9.2 578334
情书 岩井俊二 剧情/爱情 日本 1995 8.9 1148827
两杆大烟枪 盖·里奇 剧情/喜剧/犯罪 英国 1998 9.1 608916
西西里的美丽传说 朱塞佩·托纳多雷 剧情/情色/战争 意大利 / 美国 2000 8.9 999491
音乐之声 罗伯特·怀斯 剧情/爱情/歌舞/传记 美国 1965 9.1 618637
看不见的客人 奥里奥尔·保罗 剧情/悬疑/惊悚/犯罪 西班牙 2016 8.8 1306039
阿凡达 詹姆斯·卡梅隆 动作/科幻/冒险 美国 2009 8.8 1454130
哈利·波特与死亡圣器(下) 大卫·叶茨 奇幻/冒险 美国 / 英国 2011 9.0 857185
拯救大兵瑞恩 史蒂文·斯皮尔伯格 剧情/战争 美国 1998 9.1 662720
飞越疯人院 米洛斯·福尔曼 剧情 美国 1975 9.1 558796
第3页爬取完毕
小鞋子 马基德·马基迪 剧情/家庭/儿童 伊朗 1997 9.2 421479
沉默的羔羊 乔纳森·戴米 剧情/惊悚/犯罪 美国 1991 8.9 914776
功夫 周星驰 喜剧/动作/犯罪/奇幻 中国大陆 / 中国香港 2004 8.8 1172730
布达佩斯大饭店 韦斯·安德森 剧情/喜剧/冒险 美国 / 德国 / 英国 2014 8.9 968913
禁闭岛 马丁·斯科塞斯 剧情/悬疑/惊悚 美国 2010 8.9 1005408
蝴蝶效应 埃里克·布雷斯 剧情/科幻/悬疑/惊悚 美国 / 加拿大 2004 8.9 962703
致命魔术 克里斯托弗·诺兰 剧情/悬疑/惊悚 英国 / 美国 2006 8.9 882528
哈利·波特与阿兹卡班的囚徒 阿方索·卡隆 奇幻/冒险 英国 / 美国 2004 8.9 758828
心灵捕手 格斯·范·桑特 剧情 美国 1997 8.9 735540
超脱 托尼·凯耶 剧情 美国 2011 9.0 625968
低俗小说 昆汀·塔伦蒂诺 剧情/喜剧/犯罪 美国 1994 8.9 857429
海豚湾 路易·西霍尤斯 纪录片 美国 2009 9.3 362634
摩登时代 查理·卓别林 剧情/喜剧/爱情 美国 1936 9.3 310550
春光乍泄 王家卫 剧情/爱情/同性 中国香港 / 日本 / 韩国 1997 9.0 648540
美国往事 赛尔乔·莱昂内 剧情/犯罪 美国 / 意大利 1984 9.2 422740
喜剧之王 周星驰 剧情/喜剧/爱情 中国香港 1999 8.8 994253
致命ID 詹姆斯·曼高德 剧情/悬疑/惊悚 美国 2003 8.9 849617
杀人回忆 奉俊昊 剧情/动作/悬疑/惊悚/犯罪 韩国 2003 8.9 738798
红辣椒 今敏 科幻/动画/悬疑/惊悚 日本 2006 9.1 483844
七宗罪 大卫·芬奇 剧情/悬疑/惊悚/犯罪 美国 1995 8.8 963802
哈利·波特与密室 克里斯·哥伦布 奇幻/冒险 英国 / 美国 2002 8.9 785956
加勒比海盗 戈尔·维宾斯基 动作/奇幻/冒险 美国 2003 8.8 881934
一一 杨德昌 剧情/爱情/家庭 中国台湾 / 日本 2000 9.1 411115
狩猎 托马斯·温特伯格 剧情 丹麦 / 瑞典 2012 9.1 405149
唐伯虎点秋香 李力持 喜剧/爱情/古装 中国香港 1993 8.7 1108848
第4页爬取完毕
7号房的礼物 李焕庆 剧情/喜剧/家庭 韩国 2013 8.9 571078
被嫌弃的松子的一生 中岛哲也 剧情/歌舞 日本 2006 8.9 717857
蝙蝠侠:黑暗骑士崛起 克里斯托弗·诺兰 剧情/动作/科幻/惊悚/犯罪 美国 / 英国 2012 8.9 741812
请以你的名字呼唤我 卢卡·瓜达尼诺 剧情/爱情/同性 意大利 / 法国 / 巴西 / 美国 2017 8.8 741770
爱在黎明破晓前 理查德·林克莱特 剧情/爱情 美国 / 奥地利 / 瑞士 1995 8.8 705533
剪刀手爱德华 蒂姆·波顿 剧情/爱情/奇幻 美国 1990 8.7 1054358
断背山 李安 剧情/爱情/同性/家庭 美国 / 加拿大 2005 8.8 721134
入殓师 泷田洋二郎 剧情 日本 2008 8.9 683907
第六感 M·奈特·沙马兰 剧情/悬疑/惊悚 美国 1999 8.9 571258
重庆森林 王家卫 剧情/爱情 中国香港 1994 8.8 834051
超能陆战队 唐·霍尔 喜剧/动作/科幻/动画/冒险 美国 2014 8.7 1042087
勇敢的心 梅尔·吉布森 剧情/动作/传记/历史/战争 美国 1995 8.9 567732
甜蜜蜜 陈可辛 剧情/爱情 中国香港 1996 8.9 576516
幽灵公主 宫崎骏 动画/奇幻/冒险 日本 1997 8.9 537039
爱在日落黄昏时 理查德·林克莱特 剧情/爱情 美国 / 法国 2004 8.9 579667
菊次郎的夏天 北野武 剧情/喜剧 日本 1999 8.9 610785
寄生虫 奉俊昊 剧情 韩国 2019 8.8 1405864
借东西的小人阿莉埃蒂 米林宏昌 动画/奇幻/冒险 日本 2010 8.9 568430
消失的爱人 大卫·芬奇 剧情/悬疑/惊悚/犯罪 美国 2014 8.7 981285
阳光灿烂的日子 姜文 剧情/爱情 中国大陆 / 中国香港 1994 8.8 628705
天使爱美丽 让-皮埃尔·热内 剧情/喜剧/爱情 法国 / 德国 2001 8.7 967744
完美的世界 克林特·伊斯特伍德 剧情/犯罪 美国 1993 9.1 323936
无人知晓 是枝裕和 剧情 日本 2004 9.1 328901
倩女幽魂 程小东 爱情/奇幻/武侠/古装 中国香港 1987 8.8 755010
小森林 夏秋篇 森淳一 剧情 日本 2014 9.0 434905
第5页爬取完毕
时空恋旅人 理查德·柯蒂斯 喜剧/爱情/奇幻 英国 2013 8.8 697808
未麻的部屋 今敏 动画/惊悚/奇幻 日本 1997 9.1 351737
侧耳倾听 近藤喜文 剧情/爱情/动画 日本 1995 8.9 474726
哈利·波特与火焰杯 迈克·内威尔 悬疑/奇幻/冒险 英国 / 美国 2005 8.8 685948
驯龙高手 迪恩·德布洛斯 动画/奇幻/冒险 美国 2010 8.8 775222
幸福终点站 史蒂文·斯皮尔伯格 剧情/喜剧/爱情 美国 2004 8.8 586430
一个叫欧维的男人决定去死 汉内斯·赫尔姆 剧情 瑞典 2015 8.9 500314
小森林 冬春篇 森淳一 剧情 日本 2015 9.0 387571
教父3 弗朗西斯·福特·科波拉 剧情/犯罪 美国 1990 9.0 385592
怪兽电力公司 彼特·道格特 喜剧/动画/儿童/奇幻/冒险 美国 2001 8.8 693696
玩具总动员3 李·昂克里奇 喜剧/动画/奇幻/冒险 美国 2010 8.9 533566
傲慢与偏见 乔·赖特 剧情/爱情 法国 / 英国 / 美国 2005 8.7 824710
新世界 朴勋政 剧情/犯罪 韩国 2013 8.9 455081
萤火之森 大森贵弘 剧情/爱情/动画/奇幻 日本 2011 8.9 554270
茶馆 谢添 剧情/历史 中国大陆 1982 9.6 158101
被解救的姜戈 昆汀·塔伦蒂诺 剧情/动作/西部/冒险 美国 2012 8.8 625000
釜山行 延尚昊 动作/惊悚/灾难 韩国 2016 8.6 1229381
神偷奶爸 皮埃尔·柯芬 喜剧/动画/冒险 美国 / 法国 2010 8.7 967233
告白 中岛哲也 剧情/悬疑 日本 2010 8.8 685168
玛丽和马克思 亚当·艾略特 剧情/喜剧/动画 澳大利亚 / 美国 2009 9.0 427995
哪吒闹海 王树忱 动画/奇幻/冒险 中国大陆 1979 9.2 267301
色,戒 李安 剧情/爱情/情色 中国台湾 / 中国大陆 / 美国 / 中国香港 2007 8.7 841250
九品芝麻官 王晶 剧情/喜剧/古装 中国香港 / 中国大陆 1994 8.7 703153
大鱼 蒂姆·波顿 剧情/家庭/奇幻/冒险 美国 2003 8.8 580729
喜宴 李安 剧情/喜剧/爱情/同性/家庭 中国台湾 / 美国 1993 9.0 375774
第6页爬取完毕
模仿游戏 莫滕·泰杜姆 剧情/同性/传记/战争 英国 / 美国 2014 8.8 663572
头号玩家 史蒂文·斯皮尔伯格 动作/科幻/冒险 美国 2018 8.6 1397483
射雕英雄传之东成西就 刘镇伟 喜剧/奇幻/武侠/古装 中国香港 1993 8.7 654169
花样年华 王家卫 剧情/爱情 中国香港 2000 8.8 629366
头脑特工队 彼特·道格特 喜剧/动画/冒险 美国 2015 8.8 635629
我是山姆 杰茜·尼尔森 剧情/家庭 美国 2001 9.0 346406
阳光姐妹淘 姜炯哲 剧情/喜剧 韩国 2011 8.8 599597
七武士 黑泽明 剧情/动作/冒险 日本 1954 9.3 204161
血战钢锯岭 梅尔·吉布森 剧情/传记/历史/战争 澳大利亚 / 美国 2016 8.7 798087
惊魂记 阿尔弗雷德·希区柯克 悬疑/惊悚/恐怖 美国 1960 9.0 306879
黑客帝国3:矩阵革命 拉娜·沃卓斯基 动作/科幻 美国 2003 8.8 457035
你的名字。 新海诚 剧情/爱情/动画 日本 2016 8.5 1441545
三块广告牌 马丁·麦克唐纳 剧情/犯罪 英国 / 美国 2017 8.7 841024
电锯惊魂 温子仁 悬疑/惊悚/恐怖 美国 2004 8.7 550585
达拉斯买家俱乐部 让-马克·瓦雷 剧情/同性/传记 美国 2013 8.8 463103
心迷宫 忻钰坤 剧情/悬疑/犯罪 中国大陆 2014 8.7 540036
谍影重重3 保罗·格林格拉斯 动作/悬疑/惊悚 美国 / 德国 / 法国 / 英国 2007 8.8 428825
英雄本色 吴宇森 剧情/动作/犯罪 中国香港 1986 8.6 554866
上帝之城 费尔南多·梅里尔斯 剧情/犯罪 巴西 / 法国 2002 9.0 307136
风之谷 宫崎骏 动画/奇幻/冒险 日本 1984 8.9 361808
爱在午夜降临前 理查德·林克莱特 剧情/爱情 美国 / 希腊 2013 8.9 416382
纵横四海 吴宇森 剧情/喜剧/动作/犯罪 中国香港 1991 8.8 436474
海街日记 是枝裕和 剧情/家庭 日本 2015 8.8 461651
第7页爬取完毕
卢旺达饭店 特瑞·乔治 剧情/传记/历史/战争 英国 / 南非 / 意大利 / 美国 2004 8.9 337825
小丑 托德·菲利普斯 剧情/惊悚/犯罪 美国 / 加拿大 2019 8.7 1031816
背靠背,脸对脸 黄建新 剧情 中国大陆 / 中国香港 1994 9.5 141941
心灵奇旅 彼特·道格特 动画/音乐/奇幻 美国 2020 8.7 1014029
疯狂的石头 宁浩 喜剧/犯罪 中国大陆 / 中国香港 2006 8.6 843932
雨中曲 斯坦利·多南 喜剧/爱情/歌舞 美国 1952 9.1 233893
岁月神偷 罗启锐 剧情/家庭 中国香港 / 中国大陆 2010 8.7 582490
忠犬八公物语 神山征二郎 剧情 日本 1987 9.2 200597
荒蛮故事 达米安·斯兹弗隆 剧情/喜剧/犯罪 阿根廷 / 西班牙 2014 8.8 454018
小偷家族 是枝裕和 剧情/家庭/犯罪 日本 2018 8.7 828397
无敌破坏王 瑞奇·摩尔 喜剧/动画/奇幻/冒险 美国 2012 8.7 555701
爆裂鼓手 达米恩·查泽雷 剧情/音乐 美国 2014 8.7 604511
冰川时代 卡洛斯·沙尔丹哈 喜剧/动画/冒险 美国 2002 8.6 630929
恐怖游轮 克里斯托弗·史密斯 剧情/悬疑/惊悚 英国 / 澳大利亚 2009 8.5 889642
牯岭街少年杀人事件 杨德昌 剧情/犯罪 中国台湾 1991 8.9 312237
贫民窟的百万富翁 丹尼·博伊尔 剧情/爱情 英国 2008 8.6 758732
东京教父 今敏 剧情/喜剧/动画 日本 2003 9.0 242703
东邪西毒 王家卫 剧情/动作/爱情/武侠/古装 中国香港 / 中国台湾 1994 8.6 588723
魔女宅急便 宫崎骏 动画/奇幻/冒险 日本 1989 8.7 471604
遗愿清单 罗伯·莱纳 剧情/喜剧/冒险 美国 2007 8.7 477100
大佛普拉斯 黄信尧 剧情/喜剧 中国台湾 2017 8.7 475989
第8页爬取完毕
第9页爬取完毕
萤火虫之墓 高畑勋 剧情/动画/战争 日本 1988 8.7 411257
彗星来的那一夜 詹姆斯·沃德·布柯特 科幻/悬疑/惊悚 美国 / 英国 2013 8.6 600537
奇迹男孩 斯蒂芬·卓博斯基 剧情/家庭/儿童 美国 / 中国香港 2017 8.6 561541
哈利·波特与死亡圣器(上) 大卫·叶茨 奇幻/冒险 英国 / 美国 2010 8.5 597547
文章来源地址https://www.toymoban.com/news/detail-794715.html
文章来源:https://www.toymoban.com/news/detail-794715.html
到了这里,关于014集:python访问互联网:网络爬虫实例—python基础入门实例的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!