Python爬虫学习笔记(一)---Python入门

这篇具有很好参考价值的文章主要介绍了Python爬虫学习笔记(一)---Python入门。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、pycharm的安装及使用

pycharm的安装可以自行去搜索教程。

pycharm的使用需要注意:
1、venv文件夹是这个项目的虚拟环境文件,应与代码文件分开。
2、如果运行没有,最后一行是“进程已结束,退出代码为0”,如果最后不是0,那么,就说明运行出错。

二、python的基础使用

1、字符串连接

print("Hello"+"world"+"!")

2、单双引号转义

print括号中使用单引号或者双引号都是可以的。
如果引号中需要打印引号,我们则需要转义。或者外双内单、外单内双都是可以的。

print("He said 'let's go!'")
print("He said \"let\'s go!\"")

3、换行

print("Hello!\nHi!")

每一个print也可以默认换行

4、三引号跨行字符串

隆重介绍"“” XXX"""即可换行

print("""XXXXXX
XXX
XXX
XXX""")

5、命名规则

尽量使用英文变量名,以避免控制台或日记等编码不兼容等问题展现出乱码。

python英文变量名又称是用“下划线命名法”:
1、字母全部小写
2、不同单词用下划线分割
也可以用驼峰命名法,就是用大写字母分割

user_age≠user_Age
python是对大小写敏感的。

同时也不能使用关键词作为变量名,如果打出来是彩色的说明是关键字哦!

6、注释

#是注释,也可以用快捷键“ctrl”+“/”注释。
“”" “”"也可以作为多行注释

7、 优先级not>and>or

8、列表(list)

shopping_list=[]
sp_list=["1", "2"]
sp_list.append("3")

方法是对象.方法名(…)
函数是函数名(对象)

列表是可变的

9、字典(dictionary)

key:value
键:值

键是用来查找值的

dict={"小明":"1",
	  "小花":"2"}
#增加元素
dict["小谭"]="3"
#判断一个键是否在
print("小明" in dict)
#删除元素
del dict["小谭"]

10、元组(tuple)

tp={("张伟",21):"1",
	("张伟",22):"2",
	("张伟",23):"3"}
zw21_phone=tp[("张伟",21)]

11、迭代

dict.keys()   #所以键
dict.values() #所有值
dict.items()  #所有键值对

#写法一
for a,b in dict.items():
	if a>=38:
		print("XXXX")

#写法二:
for temp in dict.items():
	a=temp[0]
	b=temp[1]
	...

range(a,b)表示从a到b-1
range(a,b,c)表示从a开始一直到b-1,步长为c

12、format方法

message="""金{0}贺岁,金{0}敲门,给{1}及家人拜年啦!""".format(year,name)

message="""金{year}贺岁,金{year:.0f}敲门,给{name}及家人拜年啦!""".format(year=year,name=name)

print(f"{message}")
#f+字符串

13、引入模块

import statistics
print(statistic.median([19,-5,36])

#也可以这样子写
from statistics import median
print(median([19,-5,36])

pycharm中,按住control键点击函数名即可查看更详细的介绍。

要安装什么的话,去终端,输入pip install 库名

14、文件

两个等价的代码

f=open("./data.txt") #相对路径
print(f.read())
f.close()

与之等价的是

with open("./data.txt","r",encoding="utf-8") as f:
	print(f.read()) #结束后,会自动关闭文件,释放资源

一些相关操作

f.readline()
f.readlines()
f.read()#文件特别大的时候,最好不要用read(),因为可能爆内存
f.read(10)
f.read(10)#会接着上面继续读

"w":如果文件不存在,会自动创建新文件;如果文件存在,就会把原本的文本清空。
"a":就是一个追加模式。

15、异常与测试

try:
	XXX #放上你觉得可能会报错的代码
except ValueError:#这里ValueError是错误的类型,可以替换成其他的,也可以不写
	print("XX") #可以用来告知客户
except:
	XXX
else: #没有错误时运行
	XXX
finally: #不管有没有错误都会运行
	XXX

'assert'断言

assert 1+2>6 #这里就会报错且不会继续进行下去

unittest专门测试的库


Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
继承super()
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
测试,来判断是否与自己的预期相等
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
这表明全部通过测试点
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
有一个测试点错误,还会告诉你具体原因
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
常见的测试方法
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习
unittest会返回更加具体的原因。
Python爬虫学习笔记(一)---Python入门,2024科研,python,爬虫,学习文章来源地址https://www.toymoban.com/news/detail-798813.html

到了这里,关于Python爬虫学习笔记(一)---Python入门的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Python爬虫学习笔记(七)————Selenium

    目录 1.什么是selenium? 2.为什么使用selenium? 3.selenium安装 4.selenium的使用步骤 5.selenium的元素定位 6.访问元素信息 7.交互 1.什么是selenium? (1)Selenium是一个用于Web应用程序测试的工具。 (2)Selenium 测试直接运行在浏览器中,就像真正的用户在操作一样。 (3)支持通过各种

    2024年02月16日
    浏览(36)
  • Python爬虫学习笔记(一)————网页基础

    目录 1.网页的组成 2.HTML (1)标签 (2)比较重要且常用的标签: ①列表标签 ②超链接标签 (a标签) ③img标签:用于渲染,图片资源的标签 ④div标签和span标签 (3)属性 (4)常用的语义化标签 (5)元素的分类及特点 ①块元素 ②行内元素 ③行内块元素 (6)文件路径 (

    2024年02月15日
    浏览(52)
  • Python爬虫学习笔记(三)————urllib

    目录 1.使用urllib来获取百度首页的源码 2.下载网页图片视频  3.总结-1 4.请求对象的定制(解决第一种反爬)   5.编解码 (1)get请求方式:urllib.parse.quote() (2)get请求方式:urllib.parse.urlencode() (3)post请求方式 6.ajax的get请求 (1)获取豆瓣电影的第一页的数据 (2)下

    2024年02月16日
    浏览(37)
  • 最简单的python爬虫案例,适合入门学习

    用python从网页爬取数据,网上相关文章很多,但能让零基础初学者轻松上手的却很少。可能是有的作者觉得有些知识点太简单不值得花费精力讲,结果是难者不会会者不难,初学者常常因此而蒙圈。本人也是小白,刚摸索着爬了两个简单的网页数据,经历了初学者易犯的各种

    2024年02月08日
    浏览(41)
  • Python爬虫学习笔记(四)————XPath解析

    目录 0.xpath最新下载地址和安装教程 1.xpath安装 2.xpath基本使用 3.xpath基本语法 4.实例 (1)xpath解析本地文件  (2)xpath解析服务器响应的数据 ①获取百度网站的“百度一下”四个字 ②获取站长素材网站情侣图片前十页的图片 0.xpath最新下载地址和安装教程 https://blog.csdn.net/

    2024年02月16日
    浏览(50)
  • python萌新爬虫学习笔记【建议收藏】

    前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。【宝藏入口】。 为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能帮到一些萌新进行新技术的学习那也是极好的。作者菜菜一枚,文章

    2024年02月08日
    浏览(48)
  • Python爬虫学习笔记(五)————JsonPath解析

    目录 1.JSONPath —— xpath在json的应用 2.JSONPath 表达式 3.jsonpath的安装及使用方式 4.jsonpath的使用 5.JSONPath语法元素和对应XPath元素的对比 6.实例  (1)商店案例 (2) 解析淘票票的“城市选择”数据 1. JSONPath —— xpath在json的应用 xml最大的优点就有大量的工具可以分析,转换,

    2024年02月17日
    浏览(42)
  • 第一个Python程序_获取网页 HTML 信息[Python爬虫学习笔记]

    使用 Python 内置的 urllib 库获取网页的 html 信息。注意,urllib 库属于 Python 的标准库模块,无须单独安装,它是 Python 爬虫的常用模块。 1) 获取响应对象 向百度(http://www.baidu.com/)发起请求,获取百度首页的 HTML 信息,代码如下: 上述代码会返回百度首页的响应对象, 其中

    2024年01月17日
    浏览(41)
  • 编程小白的自学笔记十二(python爬虫入门四Selenium的使用实例二)

    编程小白的自学笔记十一(python爬虫入门三Selenium的使用+实例详解) 编程小白的自学笔记十(python爬虫入门二+实例代码详解)  编程小白的自学笔记九(python爬虫入门+代码详解)  目录 系列文章目录 前言 一、使用Selenium打开子页面 二、使用Selenium实现网页滚动 三、使用

    2024年02月15日
    浏览(37)
  • 编程小白的自学笔记十一(python爬虫入门三Selenium的使用+实例详解)

    编程小白的自学笔记十(python爬虫入门二+实例代码详解 编程小白的自学笔记九(python爬虫入门+代码详解)  编程小白的自学笔记八(python中的多线程)  编程小白的自学笔记七(python中类的继承)  目录 系列文章目录 文章目录 前言 一、Selenium是什么 二、安装Selenium  三、

    2024年02月16日
    浏览(51)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包