学习Python的多线程(Multi-threading),至少应该要有进程与线程的基本概念,可以看我转载的一篇文章:。
在前面使用Python Socket来编写简版SSH程序的时候,其实已经有使用多线程,不过当时对多线程的概念并不能很好的理解,在看了《进程与线程的一个简单解释》与学习了Python多线程之后,也算是有一个大致的理解了。
内容主要如下:
1.Python中的多线程2.Python多线程使用方法13.Python多线程使用方法2
1.Python中的多线程
执行一个程序,即在操作系统中开启了一个进程,在某一时刻,一个CPU内核只能进行一个进程的任务,现在的计算机所说的多进程/多任务其实是通过加快CPU的执行速度来实现的,因为一个CPU每秒能执行上亿次的计算,能够对进程进行很多次切换,所以在人为可以感知的时间里,看上去,计算机确实是在同时执行多个程序,即同时处理多个进程。
一个进程中可以包含有多个线程,这多个线程为实现该进程的某个主要功能而运行着,多个线程可以进行串行工作,也可以并发同时进行工作,显然后者可以节省更多的时间。
在Python中是支持多线程并发执行的,只是Python中的多线程只能利用单核,也就是说Python中的某一个进程的多个线程只能在一个CPU核心上运行,而不能分配在多个CPU核心中运行,这是考虑到线程安全的缘故,而Python中的GIL则保证了线程安全。关于Python中的GIL,可以参考下面一篇文章:。
下面是自己在学习过程中的一些课堂笔记,因为还没有真正学习一些理论,所以可能会有些错误,但目前是方便自己的理解:
即GLI是以CPU核心为单位来控制全局锁,所以是不能跨不同的CPU(核心 )的GLI可以保证同一个进程中,某一个线程的共享数据在某一时刻只能同时被另外一个线程修改(使用),而不能同时被多个线程修改(使用),如果去掉GLI,则需要自己为线程加锁,这样之后,性能比原来还要差。当然,难道就不能充分利用多核CPU或多个CPU了?做成多进程就可以了,不同的进程运行在不同的CPU(核心)上,也可以实现并发,只是这样的话就会比较浪费内存空间,考虑同时运行10个QQ程序的情况,假如1个QQ占用500M的内存空间,则10个QQ就要占用5G的内存空间了。但如果是多线程的话,可能10个QQ还是共享着这500M的内存空间。还有一个缺点就是,多进程间的数据直接访问可能会比较麻烦,但其实也是可以实现的,比如chrome浏览器就是用多进程实现的。
目前首先要明确的是,Python中是不能把一个进程的多个线程分布在不同的CPU核心上运行的。
2.Python多线程使用方法1
给出下面的程序代码及注释:
import threading #Python多线程模块import timedef run(num): print 'Hi, I am thread %s..lalala' % num time.sleep(1)for i in range(20): t = threading.Thread(target=run, args=(i,)) #多线程使用方法,target为需要执行多线程的函数,args为函数中的参数,注意这里的参数写成(i,),即如果只能一个参数,也要加上一个"," t.start() #开始执行多线程
程序运行结果如下:
xpleaf@xpleaf-machine:/mnt/hgfs/Python/day6$ python thread4.py Hi, I am thread 0..lalalaHi, I am thread 1..lalalaHi, I am thread 2..lalalaHi, I am thread 3..lalalaHi, I am thread 4..lalalaHi, I am thread 5..lalalaHi, I am thread 6..lalalaHi, I am thread 7..lalalaHi, I am thread 8..lalalaHi, I am thread 9..lalalaHi, I am thread 10..lalalaHi, I am thread 11..lalalaHi, I am thread 12..lalalaHi, I am thread 13..lalalaHi, I am thread 14..lalalaHi, I am thread 15..lalalaHi, I am thread 16..lalalaHi, I am thread 17..lalalaHi, I am thread 18..lalalaHi, I am thread 19..lalala
直接看执行结果是看不出什么的,这里说一下这个程序的执行过程:0到19是同时打印输入的,在打印19后,程序sleep 1秒后才结束程序的运行。
上面这个程序有20个线程执行,每个线程都是:打印字符串+sleep(1)。我们实际看到的结果是0到19同时打印,然后才sleep 1秒,但是需要注意的是,并非是20个线程才执行一次sleep(1),而是在每个线程中都执行了一次sleep(1),即该程序实际上是执行了20次sleep(1),而我们实际看到的结果是程序运行时仅仅是暂停了1秒,那是因为这20次sleep(1)是并发执行的。
上面的程序可以这么去理解:20个线程相当于有20匹马,20匹马同时起跑(打印字符串),然后以同时停1秒(sleep(1)),最后同时到达终点(20个线程运行结束,即程序执行结束)。
为了更好的理解上面的程序,可以把上面的代码改为如下:
import threadingimport timedef run(num): print 'Hi, I am thread %s..lalala' % num time.sleep(1)for i in range(20): t = threading.Thread(target=run, args=(i,)) t.start() t.join() #等上一个线程执行完后再执行下一个线程
执行结果如下:
xpleaf@xpleaf-machine:/mnt/hgfs/Python/day6$ python thread4.py Hi, I am thread 0..lalalaHi, I am thread 1..lalalaHi, I am thread 2..lalalaHi, I am thread 3..lalalaHi, I am thread 4..lalalaHi, I am thread 5..lalalaHi, I am thread 6..lalalaHi, I am thread 7..lalalaHi, I am thread 8..lalalaHi, I am thread 9..lalalaHi, I am thread 10..lalalaHi, I am thread 11..lalalaHi, I am thread 12..lalalaHi, I am thread 13..lalalaHi, I am thread 14..lalalaHi, I am thread 15..lalalaHi, I am thread 16..lalalaHi, I am thread 17..lalalaHi, I am thread 18..lalalaHi, I am thread 19..lalala
执行结果看上去跟前面是一样的,但执行过程却是这样的:每打印一次字符串,再暂停一秒。
通过这个程序,也就可以更好的理解Python的多线程并发执行了,当然,因为这是一个动态的过程,所以把程序执行一遍后会有更好的理解。
3.Python多线程使用方法2
程序代码如下:
import threading,timeclass MyThread(threading.Thread): def __init__(self, num): threading.Thread.__init__(self) self.num = num def run(self): #this name must be 'run' print 'I am thread %s' % self.num time.sleep(2)for i in range(20): t = MyThread(i) t.start()
程序的执行结果与方法1是一样的,这里就不给出了,只是这里利用了面向对象编程的思想方法来设计程序代码。