使用线程编写程序需要技巧,而多线程的程序中的bug非常难以跟踪、调试,因为这些bug经常是难以再现的。
竞争条件: 当一个线程访问一个数据结构的时候,另一个线程也访问同一个数据结构,这时就出现了竞争条件——两个线程(也可能是多个)竞争对同一个资源的访问。 当其中一个线程处理到一部分的时候,另外的线程可能进入了对同一数据的处理,而且出于调度的原因,它运行的比前一个更快;这时,同样的处理可能就出现了多次。 例如,一个代表任务列表的单向链表(队列),一个线程从当前元素中读出了下一个任务,并发现下一个任务不是空,准备将此一个任务置为NULL并执行任务;这时,调度使得这个线程停下来,另一个线程也从当前元素中读出了下一个任务,当然下个任务仍然不是空值,这个线程也将要执行下一个任务。这样,在某些不幸的情况下,这个任务被执行了两次。 更为不幸的情况下,执行任务的过程中线程被中断,此时另一个线程释放了任务的内存,那么执行中的线程会导致段错误。 在比较“幸运”的情况下,这些事情可能从来也不发生;但是当程序运行在负荷很高的系统中时,这个bug就会凸现出来。
互斥锁: 为了排除竞争条件的影响,应该使一些操作变成“原子的”——这些操作既不能分割也不能中断。 当一个线程锁定了互斥锁后,其他线程也要求锁定这个互斥锁的时候,就会被阻塞;直到前面的线程解除锁定后,其他线程才可以解除阻塞恢复运行。 GNU/Linux保证线程在锁定互斥锁的过程中不会发生竞争条件,只有一个线程可以锁定互斥锁,其他线程的锁定请求都会被阻塞。
创建互斥锁(Mutex),需要: `创建一个pthread_mutex_t类型的变量,将其指针传入函数pthread_mutex_init中;该函数的第二个参数是指向一个mutex属性对象(这个对象用来指定mutex的属性)的指针。mutex对象只能初始化一次。 `更简单的办法是,使用PTHREAD_MUTEX_INITIALIZER来获得默认属性的mutex对象: pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
使用mutex: `调用pthread_mutex_lock函数,如果mutex对象未被锁定,则此函数立即返回;如果已被锁定,则此函数阻塞此线程的执行,直到mutex被解除锁定。 `每次解除锁定后,只有一个线程可以解除阻塞恢复执行,其他调用线程都会继续阻塞。选定的解除阻塞的线程是不可预知的。 `调用pthread_mutex_unlock函数,可以解除调用线程对mutex对象的锁定。在锁定mutex的线程中,必须调用此函数以解除锁定。
mutex提供了解决竞争条件的方案,但是它带来了一种新的bug——死锁(deadlock)。 所谓死锁,就是说一个线程在等待永远不会发生的条件。 一个简单的死锁:一个线程锁定它自己已经锁定的mutex。这时程序的表现依赖于mutex的类型: `快速排他锁(fast mutex)——导致死锁。 `递归排他锁(recursive mutex)——不导致死锁。同一个线程可以安全的多次锁定同一个已锁定的mutex,但是锁定的次数会被记录下来,该线程还必须调用相应次数的pthread_mutex_unlock才能真正解除对mutex的锁定。 `检错排他锁(error-checking mutex)——GNU/Linux视此操作为死锁,但是对锁定的mutex调用pthread_mutex_lock函数,函数立即返回错误码EDEADLK。
mutex的锁定函数会阻塞,有时需要一个不阻塞就能知道mutex是否已锁定的函数,以在发现mutex已锁的情况下去完成其他工作并在以后再来检查。这样的函数是: pthread_mutex_trylock 如果传入的mutex已经被其他线程锁定,那么这个函数返回错误码EBUSY;如果未被锁定,此函数会锁定mutex,并返回0。这个函数不会阻塞。
|