Python多线程与GIL锁
python多线程
Python的多线程编程可以在单个进程内创建多个线程来同时执行多个任务,从而提高程序的效率和性能。Python的多线程实现依赖于操作系统的线程调度器,并且受到全局解释器锁(GIL)的限制,因此在某些情况下,多线程并不能真正实现并行执行。
import threading
def print_numbers():
for i in range(1, 6):
print(i)
thread1 = threading.Thread(target=print_numbers)
thread2 = threading.Thread(target=print_numbers)
thread1.start()
thread2.start()
thread1.join()
thread2.join()
print("Done")
上述代码创建了两个线程分别同时去打印1-5数字,但是即使有多个cpu,同一时刻也只能打印一个数字!why?
这是由于Python中的全局解释器锁(GIL)导致的。GIL是一种机制,用于确保在任何给定时间内,只有一个线程在Python解释器中执行字节码。这意味着无论有多少个CPU核心,每个线程都无法并行执行Python字节码。因此在执行CPU密集型任务时,多个线程之间的执行是交替进行的,而不是并行的。因此对于CPU任务,python的多线程是假的。而对于IO任务,确实是真正的多线程。
GIL锁
GIL的存在主要是为了防止Python解释器中的数据结构被多个线程同时修改,导致数据结构出现不一致的情况。通过限制同一时刻只有一个线程能够执行Python字节码,GIL可以确保Python解释器中的数据结构不会被多个线程同时修改,从而保证线程安全。
IO任务
I/O资源(Input/Output resources),是指计算机系统中用于输入输出数据的设备和接口,例如硬盘、网络接口、键盘、鼠标等。在计算机编程中,I/O操作指的是程序和外部设备之间进行的数据传输和交互,如读取文件、网络传输,爬虫等。I/O操作通常是非常耗时的,因为它们需要等待外部设备响应或者等待数据的读取。
这些IO任务通常只占用内存和网络,不占用CPU资源,所以也不占用python解释器,因此如果是IO密集型任务,python的多线程优势才能体现出来,而CPU密集型任务python的多线程效率无法有效提升。
破解GIL锁的限制
如果需要处理CPU密集型任务,可以考虑使用多进程编程,因为在多进程中,每个进程都有自己的解释器和内存空间,从而避免了GIL的限制。可以充分利用多核处理器(必须是真正的多核处理器才能体现,否则还是单进程)的优势。
python多进程
使用Python多进程编程的一般步骤如下:
- 导入multiprocessing模块,创建进程池对象。可以通过Pool()函数创建进程池对象,指定最大进程数。
- 定义需要执行的任务函数。这个函数应该能够接受任务参数,处理任务,返回任务结果。
- 调用进程池对象的map()函数,传入任务函数和任务参数。该函数会将任务参数分配给进程池中的进程执行,并返回任务结果列表。
- 处理任务结果。根据任务函数的返回值,对任务结果进行处理。可以使用Python中的其他模块,如pandas、numpy等进行数据处理或结果可视化。
需要注意的是,在Python中使用多进程编程时,进程之间的通信和同步是需要考虑的问题。Python中的multiprocessing模块提供了一些同步原语,如Lock、Semaphore等,用于控制进程之间的访问。此外,也可以使用Python中的Queue模块实现进程之间的通信。
代码示例:文章来源地址https://www.toymoban.com/news/detail-407731.html
import multiprocessing
def worker(num):
"""任务函数"""
print('Worker %d is running' % num)
return num**2
if __name__ == '__main__':
# 创建进程池对象
pool = multiprocessing.Pool(processes=4)
# 任务参数列表
nums = [1, 2, 3, 4, 5]
# 执行任务并获取结果
results = pool.map(worker, nums)
print(results)
python多进程与多线程的结合
每个进程用多个线程执行,这样可以在每个进程内部实现并行处理IO任务,同时也可以充分利用多核处理器的优势。文章来源:https://www.toymoban.com/news/detail-407731.html
代码示例:
import multiprocessing
import threading
def worker(num):
"""线程函数,用于处理任务"""
print(f"Worker {num} is running...")
def main():
"""主函数,创建多个进程和线程"""
# 创建3个进程
processes = []
for i in range(3):
p = multiprocessing.Process(target=process_worker, args=(i,))
processes.append(p)
p.start()
# 在每个进程内部创建2个线程
for p in processes:
for i in range(2):
t = threading.Thread(target=worker, args=(i,))
t.start()
if __name__ == '__main__':
main()
到了这里,关于Python多线程与GIL锁的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!