深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

这篇具有很好参考价值的文章主要介绍了深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

在本篇文章当中主要给大家介绍 cpython 当中跟循环相关的字节码,这部分字节码相比起其他字节码来说相对复杂一点,通过分析这部分字节码我们对程序的执行过程将会有更加深刻的理解。

循环

普通 for 循环实现原理

我们使用各种例子来理解和循环相关的字节码:

def test_loop():
    for i in range(10):
        print(i)

上面的代码对应的字节码如下所示:

  8           0 LOAD_GLOBAL              0 (range)
              2 LOAD_CONST               1 (10)
              4 CALL_FUNCTION            1
              6 GET_ITER
        >>    8 FOR_ITER                12 (to 22)
             10 STORE_FAST               0 (i)

  9          12 LOAD_GLOBAL              1 (print)
             14 LOAD_FAST                0 (i)
             16 CALL_FUNCTION            1
             18 POP_TOP
             20 JUMP_ABSOLUTE            8
        >>   22 LOAD_CONST               0 (None)
             24 RETURN_VALUE

首先是 range 他对应一个 builtin 的类型,在执行上面的字节码的过程当中,首先先将 range 将在进入栈空间当中,然后将常量 10 加载进入栈空间当中,最后会调用指令 CALL_FUNCTION,这个时候会将栈顶的两个元素弹出,调用 range 类型的创建函数,这个函数会返回一个 range 的实例对象。

这个时候栈的结果如下所示:

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

接下来的一条字节码为 GET_ITER,这条字节码的含义为,弹出栈顶的对象,并且将弹出的对象变成一个迭代器,并且将得到的迭代器对象再压入栈空间当中。

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

接下来的一条指令是 FOR_ITER,这条指令的含义为:已知栈顶对象是一个迭代器,调用这个迭代器的 __next__ 函数 :

  • 如果迭代器已经迭代完成了,则将栈顶的迭代器弹出,并且将 bytecode 的 counter 加上对应的参数值,在上面的函数字节码当中这个参数值等于 12 ,也就是说下一条指令为字节码序列的 22 这个位置。
  • 如果没有迭代完成则将函数的返回值压入栈顶,并且不需要弹出迭代器,比如当我们第一次调用 __next__ 函数的时候,range 的返回值为0,那么此时栈空间的内容如下所示:

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

接下来执行的字节码为 STORE_FAST,这条字节码的含义就是弹出栈顶的元素,并且将这个元素保存到 co_varnames[var_num] 当中,var_num 就是这条字节码的参数,在上面的函数当中就是 0,对应的变量为 i ,因此这条字节码的含义就是弹出栈顶的元素并且保存到变量 i 当中。

LOAD_GLOBAL,将内嵌函数 print 加载进入栈中,LOAD_FAST 将变量 i 加载进入栈空间当中,此时栈空间的内容如下所示:

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

CALL_FUNCTION 会调用 print 函数打印数字 0,并且将函数的返回值压入栈空间当中,print 函数的返回值为 None,此时栈空间的内容如下所示:

深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理

POP_TOP 将栈顶的元素弹出,JUMP_ABSOLUTE 字节码有一个参数,在上面的函数当中这个参数为 8 ,当执行这条字节码的时候直接将 bytecode 的 counter 直接设置成这个参数值,因此执行完这条字节码之后下一条被执行的字节码又是 FOR_ITER,这便实现了循环的效果。

综合分析上面的分析过程,实现循环的效果主要是有两个字节码实现的,一个是 FOR_ITER,当迭代器迭代完成之后,会直接跳出循环,实现这个的原理是在字节码的 counter 上加上一个值,另外一个就是 JUMP_ABSOLUTE,他可以直接跳到某一处的字节码位置进行执行。

continue 关键字实现原理

def test_continue():
    for i in range(10):
        data = random.randint(0, 10)
        if data < 5:
            continue
        print(f"{data = }")

其实通过对上面的字节码的分析之后,我们可以大致分析出 continue 的实现原理,首先我们知道 continue 的语意直接进行下一次循环,这个语意其实和循环体执行完之后的语意是一样的,在上一份代码的分析当中实现这个语意的字节码是 JUMP_ABSOLUTE,直接跳到 FOR_ITER 指令的位置继续开始执行。我们现在来看看上面的函数对应的字节码是什么:

 13           0 LOAD_GLOBAL              0 (range)
              2 LOAD_CONST               1 (10)
              4 CALL_FUNCTION            1
              6 GET_ITER
        >>    8 FOR_ITER                40 (to 50)
             10 STORE_FAST               0 (i)

 14          12 LOAD_GLOBAL              1 (random)
             14 LOAD_METHOD              2 (randint)
             16 LOAD_CONST               2 (0)
             18 LOAD_CONST               1 (10)
             20 CALL_METHOD              2
             22 STORE_FAST               1 (data)

 15          24 LOAD_FAST                1 (data)
             26 LOAD_CONST               3 (5)
             28 COMPARE_OP               0 (<)
             30 POP_JUMP_IF_FALSE       34

 16          32 JUMP_ABSOLUTE            8

 17     >>   34 LOAD_GLOBAL              3 (print)
             36 LOAD_CONST               4 ('data = ')
             38 LOAD_FAST                1 (data)
             40 FORMAT_VALUE             2 (repr)
             42 BUILD_STRING             2
             44 CALL_FUNCTION            1
             46 POP_TOP
             48 JUMP_ABSOLUTE            8
        >>   50 LOAD_CONST               0 (None)
             52 RETURN_VALUE
  • LOAD_GLOBAL 0 (range): 加载全局变量 range,将其压入栈顶。
  • LOAD_CONST 1 (10): 加载常量值 10,将其压入栈顶。
  • CALL_FUNCTION 1: 调用栈顶的函数,此处为 range 函数,并传入一个参数,参数个数为 1。
  • GET_ITER: 获取迭代器对象。
  • FOR_ITER 40 (to 50): 迭代循环的开始,当迭代完成之后将字节码的 counter 加上 40 ,也就是跳转到 50 的位置执行。
  • STORE_FAST 0 (i): 将迭代器的值存储到局部变量 i 中。
  • LOAD_GLOBAL 1 (random): 加载全局变量 random,将其压入栈顶。
  • LOAD_METHOD 2 (randint): 加载对象 random 的属性 randint,将其压入栈顶。
  • LOAD_CONST 2 (0): 加载常量值 0,将其压入栈顶。
  • LOAD_CONST 1 (10): 加载常量值 10,将其压入栈顶。
  • CALL_METHOD 2: 调用栈顶的方法,此处为 random.randint 方法,并传入两个参数,参数个数为 2。
  • STORE_FAST 1 (data): 将方法返回值存储到局部变量 data 中。
  • LOAD_FAST 1 (data): 加载局部变量 data,将其压入栈顶。
  • LOAD_CONST 3 (5): 加载常量值 5,将其压入栈顶。
  • COMPARE_OP 0 (<): 执行比较操作 <,将结果压入栈顶。
  • POP_JUMP_IF_FALSE 34: 如果栈顶的比较结果为假,则跳转到字节码偏移为 34 的位置。
  • JUMP_ABSOLUTE 8: 无条件跳转到字节码偏移为 8 的位置,即循环的下一次迭代。
  • LOAD_GLOBAL 3 (print): 加载全局变量 print,将其压入栈顶。
  • LOAD_CONST 4 ('data = '): 加载常量字符串 'data = ',将其压入栈顶。
  • LOAD_FAST 1 (data): 加载局部变量 data,将其压入栈顶。
  • FORMAT_VALUE 2 (repr): 格式化栈顶的值,并指定格式化方式为 repr。
  • BUILD_STRING 2: 构建字符串对象,包含两个格式化后的值。
  • CALL_FUNCTION 1: 调用栈顶的函数,此处为 print 函数,并传入一个参数,参数个数为 1。
  • POP_TOP: 弹出栈顶的值,也就是函数 print 的返回值,print 函数返回值为 None 。
  • JUMP_ABSOLUTE 8: 无条件跳转到字节码偏移为 8 的位置,即循环的下一次迭代。
  • LOAD_CONST 0 (None): 加载常量值 None,将其压入栈顶。
  • RETURN_VALUE: 返回栈顶的值,即 None。

这段字节码实现了一个简单的循环,使用 range 函数生成一个迭代器,然后对迭代器进行遍历,每次遍历都会调用 random.randint 方法生成一个随机数并存储到局部变量 data 中,然后根据 data 的值进行条件判断,如果小于 5 则打印 "data = " 和 data 的值,否则继续下一次循环,直到迭代器结束。最后返回 None。

break 关键字实现原理

def test_break():
    for i in range(10):
        data = random.randint(0, 10)
        if data < 5:
            break
    return "BREAK"

上面的函数对应的字节码如下所示:

 21           0 LOAD_GLOBAL              0 (range)
              2 LOAD_CONST               1 (10)
              4 CALL_FUNCTION            1
              6 GET_ITER
        >>    8 FOR_ITER                28 (to 38)
             10 STORE_FAST               0 (i)

 22          12 LOAD_GLOBAL              1 (random)
             14 LOAD_METHOD              2 (randint)
             16 LOAD_CONST               2 (0)
             18 LOAD_CONST               1 (10)
             20 CALL_METHOD              2
             22 STORE_FAST               1 (data)

 23          24 LOAD_FAST                1 (data)
             26 LOAD_CONST               3 (5)
             28 COMPARE_OP               0 (<)
             30 POP_JUMP_IF_FALSE        8

 24          32 POP_TOP
             34 JUMP_ABSOLUTE           38
             36 JUMP_ABSOLUTE            8

 26     >>   38 LOAD_CONST               4 ('BREAK')
             40 RETURN_VALUE

这段字节码与之前的字节码相似,但有一些细微的不同。

  • LOAD_GLOBAL 0 (range): 加载全局变量 range,将其压入栈顶。
  • LOAD_CONST 1 (10): 加载常量值 10,将其压入栈顶。
  • CALL_FUNCTION 1: 调用函数,函数参数个数为 1。
  • GET_ITER: 从栈顶获取可迭代对象,并返回迭代器对象。
  • FOR_ITER 28 (to 38): 遍历迭代器,如果迭代器为空,则跳转到字节码偏移为 38 的位置,即跳出循环,否则继续执行下一条字节码。
  • STORE_FAST 0 (i): 将迭代器的当前值存储到局部变量 i 中。

接下来的字节码与之前的字节码相似,都是调用 random.randint 方法生成随机数,并将随机数存储到局部变量 data 中。然后,对局部变量 data 进行条件判断,如果小于 5 则跳出循环,否则继续下一次循环。不同的是,这里使用了 POP_TOP 操作来弹出栈顶的值,即格式化后的字符串,无需使用。

  • POP_JUMP_IF_FALSE 8: 如果栈顶的值(即 data)不满足条件(小于 5),则跳转到字节码偏移为 8 的位置,即循环的下一次迭代。
  • POP_TOP: 弹出栈顶的值,也就是将迭代器弹出。
  • JUMP_ABSOLUTE 38: 无条件跳转到字节码偏移为 38 的位置,即跳出循环。
  • JUMP_ABSOLUTE 8: 无条件跳转到字节码偏移为 8 的位置,即循环的下一次迭代。

最后,字节码加载了一个常量字符串 'BREAK',并通过 RETURN_VALUE 操作将其作为返回值返回。这段字节码实现了类似于之前的循环,但在满足条件时使用了 POP_TOP 和跳转指令来优化循环的执行。

从上面的分析过程可以看出来 break 的实现也是通过 JUMP_ABSOLUTE 来做到的,直接跳转到循环外部的下一行代码。

总结

在本本篇文章当中主要给大家分析了在python当中也循环有关的字节码,实现循环操作的主要是几个核心的字节码 FOR_ITER ,JUMP_ABSOLUTE,GET_ITER 等等。只要深入了解了这几个字节码的功能理解循环的过程就很简单了。


本篇文章是深入理解 python 虚拟机系列文章之一,文章地址:https://github.com/Chang-LeHung/dive-into-cpython

更多精彩内容合集可访问项目:https://github.com/Chang-LeHung/CSCore

关注公众号:一无是处的研究僧,了解更多计算机(Java、Python、计算机系统基础、算法与数据结构)知识。文章来源地址https://www.toymoban.com/news/detail-414372.html

到了这里,关于深入理解 python 虚拟机:字节码教程(3)——深入剖析循环实现原理的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《深入理解Java虚拟机》 JAVA 字节码指令 基础

    解释时,JVM会为方法分配一个栈帧,而栈帧又由 局部变量表,操作数帧,方法引用,动态链接 组成 方法中的每条指令执行时,要求该指令的操作数已经压入栈中;执行指令时会将操作数从栈中弹出,是否将操作数再次压入栈中取决与具体的命令。 new,dup指令 使用new

    2024年02月05日
    浏览(41)
  • 《深入理解Java虚拟机》读书笔记:基于栈的字节码解释执行引擎

      虚拟机是如何调用方法的内容已经讲解完毕,从本节开始,我们来探讨虚拟机是如何执行方法中的字节码指令的。上文中提到过,许多Java虚拟机的执行引擎在执行Java代码的时候都有 解释执行(通过解释器执行) 和 编译执行(通过即时编译器产生本地代码执行) 两种选

    2024年02月11日
    浏览(51)
  • “深入剖析JVM内部机制:理解Java虚拟机的工作原理“

    标题:深入剖析JVM内部机制:理解Java虚拟机的工作原理 介绍: Java虚拟机(JVM)是Java语言的核心组件,负责将Java源代码转换为可以在计算机上运行的机器码。了解JVM的内部机制对于开发人员来说非常重要,因为它可以帮助我们更好地理解Java程序的运行行为和性能优化。本文

    2024年02月12日
    浏览(45)
  • 深入理解JVM虚拟机第二篇:虚拟机概念和JVM整体架构以及字节码的执行路线

      😉😉 学习交流群: ✅✅1:这是孙哥suns给大家的福利! ✨✨2:我们免费分享Netty、Dubbo、k8s、Mybatis、Spring...应用和源码级别的视频资料 🥭🥭3:QQ群:583783824   📚📚  工作微信:BigTreeJava 拉你进微信群,免费领取! 🍎🍎4:本文章内容出自上述:Spring应用课程!💞💞

    2024年02月09日
    浏览(54)
  • 深入理解python虚拟机:调试器实现原理与源码分析

    调试器是一个编程语言非常重要的部分,调试器是一种用于诊断和修复代码错误(或称为 bug)的工具,它允许开发者在程序执行时逐步查看和分析代码的状态和行为,它可以帮助开发者诊断和修复代码错误,理解程序的行为,优化性能。无论在哪种编程语言中,调试器都是一

    2023年04月26日
    浏览(49)
  • 深入理解JVM虚拟机第二十七篇:详解JVM当中InvokeDynamic字节码指令,Java是动态类型语言么?

     😉😉 学习交流群: ✅✅1:这是孙哥suns给大家的福利! ✨✨ 2:我们免费分享Netty、Dubbo、k8s、Mybatis、Spring...应用和源码级别的视频资料 🥭🥭3:QQ群: 583783824   📚📚  工作微信: BigTreeJava 拉你进微信群,免费领取! 🍎🍎4:本文章内容出自上述:Spring应用课程!💞💞

    2024年02月04日
    浏览(44)
  • 循环掌控:深入理解C语言循环结构,高效实现重复性任务

    ✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:C语言学习 贝蒂的主页:Betty‘s blog 前面贝蒂带大家了解了选择结构,今天就来为大家介绍 循环结构 ,也就是我们熟悉的 while,do while,还有for 的用法。只要给定的条件为真,C 语言中的

    2024年03月09日
    浏览(36)
  • 深入理解python虚拟机:程序执行的载体——栈帧

    栈帧(Stack Frame)是 Python 虚拟机中程序执行的载体之一,也是 Python 中的一种执行上下文。每当 Python 执行一个函数或方法时,都会创建一个栈帧来表示当前的函数调用,并将其压入一个称为调用栈(Call Stack)的数据结构中。调用栈是一个后进先出(LIFO)的数据结构,用于管

    2023年04月25日
    浏览(38)
  • 深入理解 python 虚拟机:魔术方法之数学计算

    在本篇文章当中主要给大家介绍在 python 当中一些常见的魔术方法,本篇文章主要是关于与数学计算相关的一些魔术方法,在很多科学计算的包当中都使用到了这些魔术方法。 当我们在Python中定义自己的类时,可以通过重写一些特殊方法来改变对象的比较行为。这些特殊方法

    2024年02月05日
    浏览(40)
  • Linux源码解读系列是一套深入剖析Linux内核源码的教程,旨在帮助读者理解Linux操作系统的底层原理和工作机制

    Linux源码解读系列是一套深入剖析Linux内核源码的教程,旨在帮助读者理解Linux操作系统的底层原理和工作机制。该系列教程从Linux内核的各个模块入手,逐一分析其源码实现,并结合实际应用场景进行讲解。通过学习本系列,读者可以深入了解Linux操作系统的底层机制,掌握

    2024年01月21日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包