【Python 高级特性】深入 NamedTuple 命名元组

这篇具有很好参考价值的文章主要介绍了【Python 高级特性】深入 NamedTuple 命名元组。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

介绍

和元组 tuple 一样,NamedTuple 也是不可变数据类型,创建之后就不能改变内容。
如其名,和 tuple 的区别在于“Named”,即"命名"。NamedTuple 不像数组那样使用下标读写,反而和类相似,使用 . 来读写。

基本语法

创建 NamedTuple 的函数定义

collections.namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)

参数说明:

  • typename:新创建的类的名称。
  • field_names:字段名称列表。必须是有效的 Python 变量名称,且不能以下划线开头
  • rename:是否自动转换无效字段名。
  • defaults:字段默认值列表。
  • module__module__ 的值。

使用教程

创建

首先看看如何创建命名元组。以 Point(代表二维坐标中的一个点)为例:

# 导包
from collections import namedtuple

# 创建普通元组
point = (22, 33)
print(point) # 输出:(22, 33)

# 创建命名元组
Point = namedtuple('Point', 'x y')
point_A = Point(22, 33)
print(point_A) # 输出:Point(x=22, y=33)

重点是这两句话

Point = namedtuple('Point', 'x y')
point_A = Point(22, 33)

需要注意,namedtuple() 是用来创建类的,不是创建对象实例!

我们先用 namedtuple 创建了一个名为 Point,有两个字段 xy 的子类,然后将这个类赋给 Point 变量。
然后 Point(22, 33) 就是普通的 new 的语法。

类似于如下代码:

class Point:
	def __init__(self, x, y):
		self.x = x
		self.y = y
point_A = Point(22, 33)

创建命名元组对象时,也可以使用位置参数

a = Point(1, 2)
b = Point(y=2, x=1)
a == b # >>> True

field_names 参数用来设置命名元组字段名,有三种风格可以选择。
下面几种都是等价写法:

Point = namedtuple('Point', 'x y')
Point = namedtuple('Point', 'x,y')
Point = namedtuple('Point', ['x', 'y'])


# 下面都是合法代码
# 中间允许存在任意空白字符
Point = namedtuple('Point', 'x,   \t\t\t\n\n y')
Point = namedtuple('Point', 'x   \t\t\t\n\n y')
# 元组也可以
Point = namedtuple('Point', ('x', 'y'))
# 事实上只要是可迭代都行
def fields():
	yield 'x'
	yield 'y'
Point = namedtuple('Point', fields())

使用

命名元组首先是一个元组,元组能怎么用,命名元组当然也可以。

print(point_A[0])
print(point_A[1])
print(*point_A) # tuple unpack

# 输出
"""
22
33
22 33
"""

然后是命名元组的特殊用法:

print(point_A.x)
print(point_A.y)

# 输出
"""
22
33
"""

常用方法

namedtuple 创建的类还附赠了一些实用方法:

Point._make(iterable) # 从某个序列创建命名元组
point._asdict() # 转成字典
point._replace(**kargs) # 返回一个新元组,新元组里的指定字段被替换为指定值

point._fields # 列出字段名
point._field_defaults # 列出字段默认值

设置默认值

可以为命名元组的字段设置默认值,只需要在创建类的时候传入 defaults 参数即可。

# 四维向量
# 默认值为 Vector4D(0, 0, 0, 0)
Vector4 = namedtuple('Vector4D', 'x y z w', defaults=(0, 0, 0, 0))

v1 = Vector4()
v2 = Vector4(1)
v3 = Vector4(1, 2, w=4)
print(v1)
print(v2)
print(v3)

# 输出
"""
Vector4D(x=0, y=0, z=0, w=0)
Vector4D(x=1, y=0, z=0, w=0)
Vector4D(x=1, y=2, z=0, w=4)
"""

默认值的数量可以小于字段数,表示为右边 n 个参数设置默认值。

Foo = namedtuple('Foo', 'a b c d', defaults=(1, 2))
print(Foo(22, 33))
print(Foo())

# 输出
"""
Foo(a=22, b=33, c=1, d=2)
Traceback (most recent call last):
  File "D:\TempCodeFiles\named_tuple.py", line 6, in <module>
    print(Foo())
TypeError: Foo.__new__() missing 2 required positional arguments: 'a' and 'b'
"""

更好的表示方式

namedtuple() 的写法既不直观,也不优雅。Python 3.5 新增了一种更好的写法:

# >= Python 3.5
from typing import NamedTuple
class PointA(NamedTuple):
	x: int = 0
	y: int = 0

# >= Python 2
from collections import namedtuple
PointB = namedtuple('PointB', 'x y', defaults=(0, 0))

print(PointA(2, 3) == PointB(2, 3)) # 输出:True

继承并扩展 NamedTuple

namedtuple() 返回的是一个正常的类。既然它是一个类,当然也可以被继承。

创建一个 Point 命名元组,增加一个方法,求两点距离。

# >= Python 3.5
class Point(NamedTuple):
	x: int = 0
	y: int = 0
    
	def distance(self, p) -> float:
		return math.sqrt((self.x - p.x) ** 2 + (self.y - p.y) ** 2)

# >= Python 2
class Point(namedtuple('Point', 'x y', defaults=(0, 0))):
	def distance(self, p) -> float:
		return math.sqrt((self.x - p.x) ** 2 + (self.y - p.y) ** 2)

a = Point()
b = Point(3, 2)
print(a, b)
print(a.distance(b))

应用

读 csv 文件

以读入一个储存英语单词的 csv 文件为例。

import csv
from collections import namedtuple

# 定义命名元组
# 按照 csv 列名来定义字段
Word = namedtuple('Word', 'word, type, chs_def, eng_ch, context, example')

file_path = r'C:\Users\ZhouXiaokang\Desktop\单词 Vol 1 Ch 1 Ep 2.csv'
with open(file_path, 'r', encoding='utf-8') as f:
	reader = csv.reader(f)
	next(reader) # 跳过标题行
	for word in map(Word._make, reader):
		print(f'{word.word} {word.type}. {word.chs_def} | 例:{word.context}')

输出

chirp n&v. (鸟、昆虫)啾啾叫,发唧唧声 | 例:(*chirp* *chirp* *chirp*)
screech v. (车辆、汽车轮胎)发出刺耳声 | 例:(*screech*)
Shiroko term. 白子 | 例:
mug v. 对…行凶抢劫 | 例:You didn't get mugged, did you?
faint v. 晕厥;晕倒 | 例:What's that? You fainted from hunger?
......

作为字典的代替品表示数据

相对于字典的优势:
1.快、小
2..field['field'] 更清晰

以下源码摘自 baidupcs_py 库:

class PcsFile(NamedTuple):
    """
    A Baidu PCS file

    path: str  # remote absolute path
    is_dir: Optional[bool] = None
    is_file: Optional[bool] = None
    fs_id: Optional[int] = None  # file id
    size: Optional[int] = None
    md5: Optional[str] = None
    block_list: Optional[List[str]] = None  # block md5 list
    category: Optional[int] = None
    user_id: Optional[int] = None
    ctime: Optional[int] = None  # server created time
    mtime: Optional[int] = None  # server modifed time
    local_ctime: Optional[int] = None  # local created time
    local_mtime: Optional[int] = None  # local modifed time
    server_ctime: Optional[int] = None  # server created time
    server_mtime: Optional[int] = None  # server modifed time
    shared: Optional[bool] = None  # this file is shared if True
    """

    path: str  # remote absolute path
    is_dir: Optional[bool] = None
    is_file: Optional[bool] = None
    fs_id: Optional[int] = None  # file id
    size: Optional[int] = None
    md5: Optional[str] = None
    block_list: Optional[List[str]] = None  # block md5 list
    category: Optional[int] = None
    user_id: Optional[int] = None
    ctime: Optional[int] = None  # server created time
    mtime: Optional[int] = None  # server modifed time
    local_ctime: Optional[int] = None  # local created time
    local_mtime: Optional[int] = None  # local modifed time
    server_ctime: Optional[int] = None  # server created time
    server_mtime: Optional[int] = None  # server modifed time
    shared: Optional[bool] = None  # this file is shared if True

    rapid_upload_info: Optional[PcsRapidUploadInfo] = None
    dl_link: Optional[str] = None

    @staticmethod
    def from_(info) -> "PcsFile":
        return PcsFile(
            path=info.get("path"),
            is_dir=info.get("isdir") == 1,
            is_file=info.get("isdir") == 0,
            fs_id=info.get("fs_id"),
            size=info.get("size"),
            md5=info.get("md5"),
            block_list=info.get("block_list"),
            category=info.get("category"),
            user_id=info.get("user_id"),
            ctime=info.get("ctime"),
            mtime=info.get("mtime"),
            local_ctime=info.get("local_ctime"),
            local_mtime=info.get("local_mtime"),
            server_ctime=info.get("server_ctime"),
            server_mtime=info.get("server_mtime"),
            shared=info.get("shared"),
        )

源码

见 Github。

关键部分在这里:

    # Build-up the class namespace dictionary
    # and use type() to build the result class
    # 收集类的方法、字段等
    class_namespace = {
        '__doc__': f'{typename}({arg_list})',
        '__slots__': (),
        '_fields': field_names,
        '_field_defaults': field_defaults,
        '__new__': __new__,
        '_make': _make,
        '__replace__': _replace,
        '_replace': _replace,
        '__repr__': __repr__,
        '_asdict': _asdict,
        '__getnewargs__': __getnewargs__,
        '__match_args__': field_names,
    }
    for index, name in enumerate(field_names):
        doc = _sys.intern(f'Alias for field number {index}')
        class_namespace[name] = _tuplegetter(index, doc)

    # 创建新类
    result = type(typename, (tuple,), class_namespace) 

type() 函数传入一个参数,用来获取对象的类;如果传入三个参数,就变成了动态创建类,相当于 class 的动态写法。文章来源地址https://www.toymoban.com/news/detail-848081.html

class Foo:
    def hello(self):
        print('Hello')
# 等价于
def hello(self):
    print('Hello')
Foo = type('Foo', (object,), {'hello': hello})

参考文章

  1. https://docs.python.org/zh-cn/3/library/collections.html#collections.namedtuple
  2. https://realpython.com/python-namedtuple/

到了这里,关于【Python 高级特性】深入 NamedTuple 命名元组的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 重温《深入理解Java虚拟机:JVM高级特性与最佳实践(第二版)》 –– 学习笔记(一)

    第1章:走近Java 1.1 Java的技术体系 SUN 官方所定义的 Java 技术体系包括:Java程序设计语言、Java虚拟机、Class文件格式、Java API类库、第三方(商业机构和开源社区)Java类库。 其中,「Java程序设计语言」、「Java虚拟机」、「Java API类」这三个被称为 JDK(Java Deployment Kit),即

    2024年01月23日
    浏览(39)
  • 《深入理解Java虚拟机:JVM高级特性与最佳实践(第3版) 周志明》 - 第12章代码示例

            最近在看《深入理解Java虚拟机:JVM高级特性与最佳实践(第3版) 周志明》这本书,书中有些代码示例是为了让读者理解作者表达的意思,但不是完整的代码示例,所以针对这些不完整的代码,自己动手写出完整的代码示例。 (1)在看这本书的同学,可以拿我这里的示

    2024年01月22日
    浏览(37)
  • python-高级特性

    列表生成式就是一个用来生成列表的特定语法形式的表达式。是Python提供的一种生成列表的简洁形式, 可快速生成一个新的list。 普通 的语法格式:[exp for iter_var in iterable] 带过滤功能 语法格式: [exp for iter_var in iterable if_exp] 循环嵌套 语法格式: [exp for iter_var_A in iterable_A for it

    2024年02月08日
    浏览(26)
  • C++11 新特性:tuple 元组

    std::tuple 是 C++11 中引入的一个非常强大的类型,它允许将多个类型不同的值,组合成单一对象。 std::tuple 非常适合用于那些需要返回多个值的场景,而且它的灵活性和通用性使得其成为现代 C++ 编程中不可或缺的一部分。下面,我们将探讨一下 std::tuple 的内部实现、使用场景

    2024年04月14日
    浏览(32)
  • (三十三)补充Python经典面试题(吸收高级编程特性)

    这个函数定义有一个默认参数b,它的默认值是一个空列表[]。这道面试题涉及到Python中 函数参数默认值的一些重要概念和陷阱 。 首先,当你调用这个函数时,如果不传递参数b的值,它将使用默认的空列表[]。例如: 但是,这里有一个陷阱。默认参数b(即空列表[])在函数定

    2024年02月04日
    浏览(39)
  • 深入NLTK:Python自然语言处理库高级教程

    在前面的初级和中级教程中,我们了解了NLTK库中的基本和进阶功能,如词干提取、词形还原、n-gram模型和词云的绘制等。在本篇高级教程中,我们将深入探索NLTK的更多高级功能,包括句法解析、命名实体识别、情感分析以及文本分类。 句法解析是自然语言处理中的一项重要

    2024年02月14日
    浏览(46)
  • 深入Matplotlib:画布分区与高级图形展示【第33篇—python:Matplotlib】

    Matplotlib是一个强大的Python绘图库,通过其灵活的画布分区技术,用户可以在一个画布上创建多个子图,以更清晰地呈现数据图形。本文将深入介绍Matplotlib中的画布分区方法,并通过实例演示如何在子图中展示不同类型的数据。 首先,我们使用 plt.subplot() 方法来实现画布分区

    2024年01月23日
    浏览(37)
  • 开启C++之旅(上):探索命名空间与函数特性(缺省参数和函数重载)

    之前浅显的讲解了数据结构的部分内容:数据结构专栏 那么今天我们迎来了新的起点:C++的探索之旅 在c中: 严格的编译器会直接 报错 : rand我们都知道是产生随机数的函数,现在我定义了一个全局变量rand,显然是有 命名冲突 所以c++就提供了解决方案 想必学过c的大家第一

    2024年02月01日
    浏览(39)
  • 高级篇-rabbitmq的高级特性

         启动MQ 创建Queues:  两种Callback: 1.ReturnCallback:全局callback   2.ComfirmCallback: 发送信息时候设置    执行成功:  监控页面: 模拟失败:  1.投递到交互机失败 2.投递到交换机了,但是没有进入队列     注意:   演示数据是否默认持久化:       重启mq:  1. 交互机、

    2024年02月09日
    浏览(28)
  • 【实体识别】深入浅出讲解命名实体识别(介绍、常用算法)

    本文收录于《深入浅出讲解自然语言处理》专栏,此专栏聚焦于自然语言处理领域的各大经典算法,将持续更新,欢迎大家订阅! 个人主页:有梦想的程序星空 个人介绍:小编是人工智能领域硕士,全栈工程师,深耕Flask后端开发、数据挖掘、NLP、Android开发、自动化等领域

    2023年04月08日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包