接触kubernetes两年有余,从18年初加入kubernetes社区来算,已经一年半,或许是时候写点什么。简单文章如何写好,难点文章如何写透,或许是一种学问,打算推一个系列:《Kubernetes GO》算是对这两年的一个总结。
首先flock和fcntl是系统调用,而lockf是库函数。lockf实际上是fcntl的封装,所以lockf和fcntl的底层实现是一样的,对文件加锁的效果也是一样的。后面分析不同点时大多数情况是将fcntl和lockf放在一起的。下面首先看每个函数的使用,从使用的方式和效果来看各个函数的区别。
1、flock
函数原型
1 | int flock(int fd, int operation); // Apply or remove an advisory lock on the open file specified by fd,只是建议性锁 |
其中fd是系统调用open返回的文件描述符,operation的选项有:
- LOCK_SH :共享锁
- LOCK_EX :排他锁或者独占锁
- LOCK_UN : 解锁。
- LOCK_NB:非阻塞(与以上三种操作一起使用)
关于flock函数,首先要知道flock函数只能对整个文件上锁,而不能对文件的某一部分上锁,这是于fcntl/lockf的第一个重要区别,后者可以对文件的某个区域上锁。其次,flock只能产生劝告性锁。我们知道,linux存在强制锁(mandatory lock)和劝告锁(advisory lock)。所谓强制锁,比较好理解,就是你家大门上的那把锁,最要命的是只有一把钥匙,只有一个进程可以操作。所谓劝告锁,本质是一种协议,你访问文件前,先检查锁,这时候锁才其作用,如果你不那么kind,不管三七二十一,就要读写,那么劝告锁没有任何的作用。而遵守协议,读写前先检查锁的那些进程,叫做合作进程。再次,flock和fcntl/lockf的区别主要在fork和dup。
(1)、flock创建的锁是和文件打开表项(struct file)相关联的,而不是fd。这就意味着复制文件fd(通过fork或者dup)后,那么通过这两个fd都可以操作这把锁(例如通过一个fd加锁,通过另一个fd可以释放锁),也就是说子进程继承父进程的锁。但是上锁过程中关闭其中一个fd,锁并不会释放(因为file结构并没有释放),只有关闭所有复制出的fd,锁才会释放。对fd1上锁,并不影响程序通过fd2上锁。子进程持有锁,并不影响父进程通过相同的fd获取锁,反之亦然。
(2)、使用open两次打开同一个文件,得到的两个fd是独立的(因为底层对应两个file对象),通过其中一个加锁,通过另一个无法解锁,并且在前一个解锁前也无法上锁。通过fd1获取锁后,无法再通过fd2获取锁。
(3)、使用exec后,文件锁的状态不变。
(4)、flock不能再NFS文件系统上使用,如果要在NFS使用文件锁,请使用fcntl。
(5)、flock锁可递归,即通过dup或者或者fork产生的两个fd,都可以加锁而不会产生死锁。
2、lockf与fcntl
函数原型
1 | int lockf(int fd, int cmd, off_t len); // fd为通过open返回的打开文件描述符。 |
cmd的取值为:
- F_LOCK:给文件互斥加锁,若文件以被加锁,则会一直阻塞到锁被释放。
- F_TLOCK:同F_LOCK,但若文件已被加锁,不会阻塞,而回返回错误。
- F_ULOCK:解锁。
- F_TEST:测试文件是否被上锁,若文件没被上锁则返回0,否则返回-1。
- len:为从文件当前位置的起始要锁住的长度。
通过函数参数的功能,可以看出lockf只支持排他锁,不支持共享锁。
文件记录加锁相关的cmd 分三种:
- F_SETLK:申请锁(读锁F_RDLCK,写锁F_WRLCK)或者释放所(F_UNLCK),但是如果kernel无法将锁授予本进程(被其他进程抢了先,占了锁),不傻等,返回error。
- F_SETLKW:和F_SETLK几乎一样,唯一的区别,这厮是个死心眼的主儿,申请不到,就傻等。
- F_GETLK:这个接口是获取锁的相关信息: 这个接口会修改我们传入的struct flock。
通过函数参数功能可以看出fcntl是功能最强大的,它既支持共享锁又支持排他锁,即可以锁住整个文件,又能只锁文件的某一部分。
fcntl/lockf特性
(1) 上锁可递归,如果一个进程对一个文件区间已经有一把锁,后来进程又企图在同一区间再加一把锁,则新锁将替换老锁。
(2) 加读锁(共享锁)文件必须是读打开的,加写锁(排他锁)文件必须是写打开。
(3) 进程不能使用F_GETLK命令来测试它自己是否再文件的某一部分持有一把锁。F_GETLK命令定义说明,返回信息指示是否现存的锁阻止调用进程设置它自己的锁。因为,F_SETLK和F_SETLKW命令总是替换进程的现有锁,所以调用进程绝不会阻塞再自己持有的锁上,于是F_GETLK命令绝不会报告调用进程自己持有的锁。
(4) 进程终止时,他所建立的所有文件锁都会被释放,队医flock也是一样的。
(5) 任何时候关闭一个描述符时,则该进程通过这一描述符可以引用的文件上的任何一把锁都被释放(这些锁都是该进程设置的),这一点与flock不同。
(6) 由fork产生的子进程不继承父进程所设置的锁,这点与flock也不同。
(8) 支持强制性锁:对一个特定文件打开其设置组ID位(S_ISGID),并关闭其组执行位(S_IXGRP),则对该文件开启了强制性锁机制。再Linux中如果要使用强制性锁,则要在文件系统mount时,使用_omand打开该机制。
fcntl/lockf关联
flock和lockf/fcntl所上的锁有什么关系呢?答案时互不影响。测试程序如下:
1 |
|
测试结果如下:
1 | $./a.out |
可见flock的加锁,并不影响lockf的加锁。另外我们可以通过/proc/locks
查看进程获取锁的状态。
1 | $ps aux | grep a.out | grep -v grep |
我们可以看到/proc/locks下面有锁的信息:我现在分别叙述下含义:
(1) POSIX FLOCK 这个比较明确,就是哪个类型的锁。flock系统调用产生的是FLOCK,fcntl调用F_SETLK,F_SETLKW或者lockf产生的是POSIX类型,有次可见两种调用产生的锁的类型是不同的;
(2) ADVISORY表明是劝告锁;
(3) WRITE顾名思义,是写锁,还有读锁;
(4) 18849是持有锁的进程ID。当然对于flock这种类型的锁,会出现进程已经退出的状况。
(5) 08:02:852674表示的对应磁盘文件的所在设备的主设备好,次设备号,还有文件对应的inode number。
(6) 0表示的是所的其实位置
(7) EOF表示的是结束位置。 这两个字段对fcntl类型比较有用,对flock来是总是0 和EOF。
后续
该文为kubelet相关内容的铺垫,涉及到kubelet对于锁的使用。