Home | History | Annotate | Line # | Download | only in union
union_subr.c revision 1.45
      1  1.45   hannken /*	$NetBSD: union_subr.c,v 1.45 2011/08/10 06:19:54 hannken Exp $	*/
      2   1.1  jdolecek 
      3   1.1  jdolecek /*
      4   1.1  jdolecek  * Copyright (c) 1994
      5   1.1  jdolecek  *	The Regents of the University of California.  All rights reserved.
      6   1.1  jdolecek  *
      7   1.1  jdolecek  * This code is derived from software contributed to Berkeley by
      8   1.1  jdolecek  * Jan-Simon Pendry.
      9   1.1  jdolecek  *
     10   1.1  jdolecek  * Redistribution and use in source and binary forms, with or without
     11   1.1  jdolecek  * modification, are permitted provided that the following conditions
     12   1.1  jdolecek  * are met:
     13   1.1  jdolecek  * 1. Redistributions of source code must retain the above copyright
     14   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer.
     15   1.1  jdolecek  * 2. Redistributions in binary form must reproduce the above copyright
     16   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer in the
     17   1.1  jdolecek  *    documentation and/or other materials provided with the distribution.
     18   1.7       agc  * 3. Neither the name of the University nor the names of its contributors
     19   1.7       agc  *    may be used to endorse or promote products derived from this software
     20   1.7       agc  *    without specific prior written permission.
     21   1.7       agc  *
     22   1.7       agc  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     23   1.7       agc  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     24   1.7       agc  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     25   1.7       agc  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     26   1.7       agc  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     27   1.7       agc  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     28   1.7       agc  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     29   1.7       agc  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     30   1.7       agc  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     31   1.7       agc  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     32   1.7       agc  * SUCH DAMAGE.
     33   1.7       agc  *
     34   1.7       agc  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     35   1.7       agc  */
     36   1.7       agc 
     37   1.7       agc /*
     38   1.7       agc  * Copyright (c) 1994 Jan-Simon Pendry
     39   1.7       agc  *
     40   1.7       agc  * This code is derived from software contributed to Berkeley by
     41   1.7       agc  * Jan-Simon Pendry.
     42   1.7       agc  *
     43   1.7       agc  * Redistribution and use in source and binary forms, with or without
     44   1.7       agc  * modification, are permitted provided that the following conditions
     45   1.7       agc  * are met:
     46   1.7       agc  * 1. Redistributions of source code must retain the above copyright
     47   1.7       agc  *    notice, this list of conditions and the following disclaimer.
     48   1.7       agc  * 2. Redistributions in binary form must reproduce the above copyright
     49   1.7       agc  *    notice, this list of conditions and the following disclaimer in the
     50   1.7       agc  *    documentation and/or other materials provided with the distribution.
     51   1.1  jdolecek  * 3. All advertising materials mentioning features or use of this software
     52   1.1  jdolecek  *    must display the following acknowledgement:
     53   1.1  jdolecek  *	This product includes software developed by the University of
     54   1.1  jdolecek  *	California, Berkeley and its contributors.
     55   1.1  jdolecek  * 4. Neither the name of the University nor the names of its contributors
     56   1.1  jdolecek  *    may be used to endorse or promote products derived from this software
     57   1.1  jdolecek  *    without specific prior written permission.
     58   1.1  jdolecek  *
     59   1.1  jdolecek  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     60   1.1  jdolecek  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     61   1.1  jdolecek  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     62   1.1  jdolecek  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     63   1.1  jdolecek  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     64   1.1  jdolecek  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     65   1.1  jdolecek  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     66   1.1  jdolecek  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     67   1.1  jdolecek  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     68   1.1  jdolecek  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     69   1.1  jdolecek  * SUCH DAMAGE.
     70   1.1  jdolecek  *
     71   1.1  jdolecek  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     72   1.1  jdolecek  */
     73   1.1  jdolecek 
     74   1.1  jdolecek #include <sys/cdefs.h>
     75  1.45   hannken __KERNEL_RCSID(0, "$NetBSD: union_subr.c,v 1.45 2011/08/10 06:19:54 hannken Exp $");
     76   1.1  jdolecek 
     77   1.1  jdolecek #include <sys/param.h>
     78   1.1  jdolecek #include <sys/systm.h>
     79   1.1  jdolecek #include <sys/proc.h>
     80   1.1  jdolecek #include <sys/time.h>
     81   1.1  jdolecek #include <sys/kernel.h>
     82   1.1  jdolecek #include <sys/vnode.h>
     83   1.1  jdolecek #include <sys/namei.h>
     84   1.1  jdolecek #include <sys/malloc.h>
     85  1.44   hannken #include <sys/dirent.h>
     86   1.1  jdolecek #include <sys/file.h>
     87   1.1  jdolecek #include <sys/filedesc.h>
     88   1.1  jdolecek #include <sys/queue.h>
     89   1.1  jdolecek #include <sys/mount.h>
     90   1.1  jdolecek #include <sys/stat.h>
     91  1.18      elad #include <sys/kauth.h>
     92   1.1  jdolecek 
     93   1.1  jdolecek #include <uvm/uvm_extern.h>
     94   1.1  jdolecek 
     95   1.1  jdolecek #include <fs/union/union.h>
     96   1.1  jdolecek 
     97   1.1  jdolecek /* must be power of two, otherwise change UNION_HASH() */
     98   1.1  jdolecek #define NHASH 32
     99   1.1  jdolecek 
    100   1.1  jdolecek /* unsigned int ... */
    101   1.1  jdolecek #define UNION_HASH(u, l) \
    102   1.1  jdolecek 	(((((unsigned long) (u)) + ((unsigned long) l)) >> 8) & (NHASH-1))
    103   1.1  jdolecek 
    104   1.1  jdolecek static LIST_HEAD(unhead, union_node) unhead[NHASH];
    105   1.1  jdolecek static int unvplock[NHASH];
    106   1.1  jdolecek 
    107  1.14   xtraeme static int union_list_lock(int);
    108  1.14   xtraeme static void union_list_unlock(int);
    109  1.14   xtraeme void union_updatevp(struct union_node *, struct vnode *, struct vnode *);
    110  1.14   xtraeme static int union_relookup(struct union_mount *, struct vnode *,
    111   1.1  jdolecek 			       struct vnode **, struct componentname *,
    112  1.40  dholland 			       struct componentname *, char **,
    113  1.40  dholland 			       const char *, int);
    114  1.18      elad int union_vn_close(struct vnode *, int, kauth_cred_t, struct lwp *);
    115  1.14   xtraeme static void union_dircache_r(struct vnode *, struct vnode ***, int *);
    116  1.15  christos struct vnode *union_dircache(struct vnode *, struct lwp *);
    117   1.1  jdolecek 
    118   1.1  jdolecek void
    119  1.32      matt union_init(void)
    120   1.1  jdolecek {
    121   1.1  jdolecek 	int i;
    122   1.1  jdolecek 
    123   1.1  jdolecek 	for (i = 0; i < NHASH; i++)
    124   1.1  jdolecek 		LIST_INIT(&unhead[i]);
    125   1.9       jrf 	memset(unvplock, 0, sizeof(unvplock));
    126   1.1  jdolecek }
    127   1.1  jdolecek 
    128   1.1  jdolecek /*
    129   1.1  jdolecek  * Free global unionfs resources.
    130   1.1  jdolecek  */
    131   1.1  jdolecek void
    132  1.32      matt union_done(void)
    133   1.1  jdolecek {
    134  1.12     perry 
    135   1.2  jdolecek 	/* Make sure to unset the readdir hook. */
    136   1.2  jdolecek 	vn_union_readdir_hook = NULL;
    137   1.1  jdolecek }
    138   1.1  jdolecek 
    139   1.1  jdolecek static int
    140  1.32      matt union_list_lock(int ix)
    141   1.1  jdolecek {
    142   1.1  jdolecek 
    143   1.1  jdolecek 	if (unvplock[ix] & UN_LOCKED) {
    144   1.1  jdolecek 		unvplock[ix] |= UN_WANTED;
    145   1.1  jdolecek 		(void) tsleep(&unvplock[ix], PINOD, "unionlk", 0);
    146   1.1  jdolecek 		return (1);
    147   1.1  jdolecek 	}
    148   1.1  jdolecek 
    149   1.1  jdolecek 	unvplock[ix] |= UN_LOCKED;
    150   1.1  jdolecek 
    151   1.1  jdolecek 	return (0);
    152   1.1  jdolecek }
    153   1.1  jdolecek 
    154   1.1  jdolecek static void
    155  1.32      matt union_list_unlock(int ix)
    156   1.1  jdolecek {
    157   1.1  jdolecek 
    158   1.1  jdolecek 	unvplock[ix] &= ~UN_LOCKED;
    159   1.1  jdolecek 
    160   1.1  jdolecek 	if (unvplock[ix] & UN_WANTED) {
    161   1.1  jdolecek 		unvplock[ix] &= ~UN_WANTED;
    162   1.9       jrf 		wakeup(&unvplock[ix]);
    163   1.1  jdolecek 	}
    164   1.1  jdolecek }
    165   1.1  jdolecek 
    166   1.1  jdolecek void
    167  1.32      matt union_updatevp(struct union_node *un, struct vnode *uppervp,
    168  1.32      matt 	struct vnode *lowervp)
    169   1.1  jdolecek {
    170   1.1  jdolecek 	int ohash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    171   1.1  jdolecek 	int nhash = UNION_HASH(uppervp, lowervp);
    172   1.1  jdolecek 	int docache = (lowervp != NULLVP || uppervp != NULLVP);
    173   1.1  jdolecek 	int lhash, uhash;
    174   1.1  jdolecek 
    175   1.1  jdolecek 	/*
    176   1.1  jdolecek 	 * Ensure locking is ordered from lower to higher
    177   1.1  jdolecek 	 * to avoid deadlocks.
    178   1.1  jdolecek 	 */
    179   1.1  jdolecek 	if (nhash < ohash) {
    180   1.1  jdolecek 		lhash = nhash;
    181   1.1  jdolecek 		uhash = ohash;
    182   1.1  jdolecek 	} else {
    183   1.1  jdolecek 		lhash = ohash;
    184   1.1  jdolecek 		uhash = nhash;
    185   1.1  jdolecek 	}
    186   1.1  jdolecek 
    187   1.1  jdolecek 	if (lhash != uhash)
    188   1.1  jdolecek 		while (union_list_lock(lhash))
    189   1.1  jdolecek 			continue;
    190   1.1  jdolecek 
    191   1.1  jdolecek 	while (union_list_lock(uhash))
    192   1.1  jdolecek 		continue;
    193   1.1  jdolecek 
    194   1.1  jdolecek 	if (ohash != nhash || !docache) {
    195   1.1  jdolecek 		if (un->un_flags & UN_CACHED) {
    196   1.1  jdolecek 			un->un_flags &= ~UN_CACHED;
    197   1.1  jdolecek 			LIST_REMOVE(un, un_cache);
    198   1.1  jdolecek 		}
    199   1.1  jdolecek 	}
    200   1.1  jdolecek 
    201   1.1  jdolecek 	if (ohash != nhash)
    202   1.1  jdolecek 		union_list_unlock(ohash);
    203   1.1  jdolecek 
    204   1.1  jdolecek 	if (un->un_lowervp != lowervp) {
    205   1.1  jdolecek 		if (un->un_lowervp) {
    206   1.1  jdolecek 			vrele(un->un_lowervp);
    207   1.1  jdolecek 			if (un->un_path) {
    208   1.1  jdolecek 				free(un->un_path, M_TEMP);
    209   1.1  jdolecek 				un->un_path = 0;
    210   1.1  jdolecek 			}
    211   1.1  jdolecek 			if (un->un_dirvp) {
    212   1.1  jdolecek 				vrele(un->un_dirvp);
    213   1.1  jdolecek 				un->un_dirvp = NULLVP;
    214   1.1  jdolecek 			}
    215   1.1  jdolecek 		}
    216   1.1  jdolecek 		un->un_lowervp = lowervp;
    217   1.1  jdolecek 		un->un_lowersz = VNOVAL;
    218   1.1  jdolecek 	}
    219   1.1  jdolecek 
    220   1.1  jdolecek 	if (un->un_uppervp != uppervp) {
    221   1.1  jdolecek 		if (un->un_uppervp)
    222   1.1  jdolecek 			vrele(un->un_uppervp);
    223   1.1  jdolecek 
    224   1.1  jdolecek 		un->un_uppervp = uppervp;
    225   1.1  jdolecek 		un->un_uppersz = VNOVAL;
    226   1.1  jdolecek 	}
    227   1.1  jdolecek 
    228   1.1  jdolecek 	if (docache && (ohash != nhash)) {
    229   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[nhash], un, un_cache);
    230   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    231   1.1  jdolecek 	}
    232   1.1  jdolecek 
    233   1.1  jdolecek 	union_list_unlock(nhash);
    234   1.1  jdolecek }
    235   1.1  jdolecek 
    236   1.1  jdolecek void
    237  1.32      matt union_newlower(struct union_node *un, struct vnode *lowervp)
    238   1.1  jdolecek {
    239   1.1  jdolecek 
    240   1.1  jdolecek 	union_updatevp(un, un->un_uppervp, lowervp);
    241   1.1  jdolecek }
    242   1.1  jdolecek 
    243   1.1  jdolecek void
    244  1.32      matt union_newupper(struct union_node *un, struct vnode *uppervp)
    245   1.1  jdolecek {
    246   1.1  jdolecek 
    247   1.1  jdolecek 	union_updatevp(un, uppervp, un->un_lowervp);
    248   1.1  jdolecek }
    249   1.1  jdolecek 
    250   1.1  jdolecek /*
    251   1.1  jdolecek  * Keep track of size changes in the underlying vnodes.
    252   1.1  jdolecek  * If the size changes, then callback to the vm layer
    253   1.1  jdolecek  * giving priority to the upper layer size.
    254   1.1  jdolecek  */
    255   1.1  jdolecek void
    256  1.32      matt union_newsize(struct vnode *vp, off_t uppersz, off_t lowersz)
    257   1.1  jdolecek {
    258   1.1  jdolecek 	struct union_node *un;
    259   1.1  jdolecek 	off_t sz;
    260   1.1  jdolecek 
    261   1.1  jdolecek 	/* only interested in regular files */
    262  1.26     pooka 	if (vp->v_type != VREG) {
    263  1.26     pooka 		uvm_vnp_setsize(vp, 0);
    264   1.1  jdolecek 		return;
    265  1.26     pooka 	}
    266   1.1  jdolecek 
    267   1.1  jdolecek 	un = VTOUNION(vp);
    268   1.1  jdolecek 	sz = VNOVAL;
    269   1.1  jdolecek 
    270   1.1  jdolecek 	if ((uppersz != VNOVAL) && (un->un_uppersz != uppersz)) {
    271   1.1  jdolecek 		un->un_uppersz = uppersz;
    272   1.1  jdolecek 		if (sz == VNOVAL)
    273   1.1  jdolecek 			sz = un->un_uppersz;
    274   1.1  jdolecek 	}
    275   1.1  jdolecek 
    276   1.1  jdolecek 	if ((lowersz != VNOVAL) && (un->un_lowersz != lowersz)) {
    277   1.1  jdolecek 		un->un_lowersz = lowersz;
    278   1.1  jdolecek 		if (sz == VNOVAL)
    279   1.1  jdolecek 			sz = un->un_lowersz;
    280   1.1  jdolecek 	}
    281   1.1  jdolecek 
    282   1.1  jdolecek 	if (sz != VNOVAL) {
    283   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    284   1.1  jdolecek 		printf("union: %s size now %qd\n",
    285   1.1  jdolecek 		    uppersz != VNOVAL ? "upper" : "lower", sz);
    286   1.1  jdolecek #endif
    287   1.1  jdolecek 		uvm_vnp_setsize(vp, sz);
    288   1.1  jdolecek 	}
    289   1.1  jdolecek }
    290   1.1  jdolecek 
    291   1.1  jdolecek /*
    292   1.1  jdolecek  * allocate a union_node/vnode pair.  the vnode is
    293   1.1  jdolecek  * referenced and locked.  the new vnode is returned
    294   1.1  jdolecek  * via (vpp).  (mp) is the mountpoint of the union filesystem,
    295   1.1  jdolecek  * (dvp) is the parent directory where the upper layer object
    296   1.1  jdolecek  * should exist (but doesn't) and (cnp) is the componentname
    297   1.1  jdolecek  * information which is partially copied to allow the upper
    298   1.1  jdolecek  * layer object to be created at a later time.  (uppervp)
    299   1.1  jdolecek  * and (lowervp) reference the upper and lower layer objects
    300   1.1  jdolecek  * being mapped.  either, but not both, can be nil.
    301   1.1  jdolecek  * if supplied, (uppervp) is locked.
    302   1.1  jdolecek  * the reference is either maintained in the new union_node
    303   1.1  jdolecek  * object which is allocated, or they are vrele'd.
    304   1.1  jdolecek  *
    305   1.1  jdolecek  * all union_nodes are maintained on a singly-linked
    306   1.1  jdolecek  * list.  new nodes are only allocated when they cannot
    307   1.1  jdolecek  * be found on this list.  entries on the list are
    308   1.1  jdolecek  * removed when the vfs reclaim entry is called.
    309   1.1  jdolecek  *
    310   1.1  jdolecek  * a single lock is kept for the entire list.  this is
    311   1.1  jdolecek  * needed because the getnewvnode() function can block
    312   1.1  jdolecek  * waiting for a vnode to become free, in which case there
    313   1.1  jdolecek  * may be more than one process trying to get the same
    314   1.1  jdolecek  * vnode.  this lock is only taken if we are going to
    315   1.1  jdolecek  * call getnewvnode, since the kernel itself is single-threaded.
    316   1.1  jdolecek  *
    317   1.1  jdolecek  * if an entry is found on the list, then call vget() to
    318   1.1  jdolecek  * take a reference.  this is done because there may be
    319   1.1  jdolecek  * zero references to it and so it needs to removed from
    320   1.1  jdolecek  * the vnode free list.
    321   1.1  jdolecek  */
    322   1.1  jdolecek int
    323  1.32      matt union_allocvp(
    324  1.32      matt 	struct vnode **vpp,
    325  1.32      matt 	struct mount *mp,
    326  1.32      matt 	struct vnode *undvp,		/* parent union vnode */
    327  1.32      matt 	struct vnode *dvp,		/* may be null */
    328  1.32      matt 	struct componentname *cnp,	/* may be null */
    329  1.32      matt 	struct vnode *uppervp,		/* may be null */
    330  1.32      matt 	struct vnode *lowervp,		/* may be null */
    331  1.32      matt 	int docache)
    332   1.1  jdolecek {
    333   1.1  jdolecek 	int error;
    334  1.26     pooka 	struct vattr va;
    335  1.38   hannken 	struct union_node *un = NULL, *un1;
    336  1.38   hannken 	struct vnode *vp, *xlowervp = NULLVP;
    337   1.1  jdolecek 	struct union_mount *um = MOUNTTOUNIONMOUNT(mp);
    338  1.26     pooka 	voff_t uppersz, lowersz;
    339   1.1  jdolecek 	int hash = 0;
    340  1.28        ad 	int vflag, iflag;
    341   1.1  jdolecek 	int try;
    342   1.1  jdolecek 
    343   1.1  jdolecek 	if (uppervp == NULLVP && lowervp == NULLVP)
    344   1.1  jdolecek 		panic("union: unidentifiable allocation");
    345   1.1  jdolecek 
    346   1.1  jdolecek 	if (uppervp && lowervp && (uppervp->v_type != lowervp->v_type)) {
    347   1.1  jdolecek 		xlowervp = lowervp;
    348   1.1  jdolecek 		lowervp = NULLVP;
    349   1.1  jdolecek 	}
    350   1.1  jdolecek 
    351   1.1  jdolecek 	/* detect the root vnode (and aliases) */
    352  1.28        ad 	iflag = VI_LAYER;
    353  1.28        ad 	vflag = 0;
    354   1.1  jdolecek 	if ((uppervp == um->um_uppervp) &&
    355   1.1  jdolecek 	    ((lowervp == NULLVP) || lowervp == um->um_lowervp)) {
    356   1.1  jdolecek 		if (lowervp == NULLVP) {
    357   1.1  jdolecek 			lowervp = um->um_lowervp;
    358   1.1  jdolecek 			if (lowervp != NULLVP)
    359  1.35     pooka 				vref(lowervp);
    360   1.1  jdolecek 		}
    361  1.28        ad 		iflag = 0;
    362  1.28        ad 		vflag = VV_ROOT;
    363   1.1  jdolecek 	}
    364   1.1  jdolecek 
    365   1.1  jdolecek loop:
    366   1.1  jdolecek 	if (!docache) {
    367   1.1  jdolecek 		un = 0;
    368   1.1  jdolecek 	} else for (try = 0; try < 3; try++) {
    369   1.1  jdolecek 		switch (try) {
    370   1.1  jdolecek 		case 0:
    371   1.1  jdolecek 			if (lowervp == NULLVP)
    372   1.1  jdolecek 				continue;
    373   1.1  jdolecek 			hash = UNION_HASH(uppervp, lowervp);
    374   1.1  jdolecek 			break;
    375   1.1  jdolecek 
    376   1.1  jdolecek 		case 1:
    377   1.1  jdolecek 			if (uppervp == NULLVP)
    378   1.1  jdolecek 				continue;
    379   1.1  jdolecek 			hash = UNION_HASH(uppervp, NULLVP);
    380   1.1  jdolecek 			break;
    381   1.1  jdolecek 
    382   1.1  jdolecek 		case 2:
    383   1.1  jdolecek 			if (lowervp == NULLVP)
    384   1.1  jdolecek 				continue;
    385   1.1  jdolecek 			hash = UNION_HASH(NULLVP, lowervp);
    386   1.1  jdolecek 			break;
    387   1.1  jdolecek 		}
    388   1.1  jdolecek 
    389   1.1  jdolecek 		while (union_list_lock(hash))
    390   1.1  jdolecek 			continue;
    391   1.1  jdolecek 
    392   1.1  jdolecek 		for (un = unhead[hash].lh_first; un != 0;
    393   1.1  jdolecek 					un = un->un_cache.le_next) {
    394   1.1  jdolecek 			if ((un->un_lowervp == lowervp ||
    395   1.1  jdolecek 			     un->un_lowervp == NULLVP) &&
    396   1.1  jdolecek 			    (un->un_uppervp == uppervp ||
    397   1.1  jdolecek 			     un->un_uppervp == NULLVP) &&
    398   1.1  jdolecek 			    (UNIONTOV(un)->v_mount == mp)) {
    399  1.38   hannken 				vp = UNIONTOV(un);
    400  1.43     rmind 				mutex_enter(vp->v_interlock);
    401  1.39   hannken 				if (vget(vp, 0)) {
    402   1.1  jdolecek 					union_list_unlock(hash);
    403   1.1  jdolecek 					goto loop;
    404   1.1  jdolecek 				}
    405   1.1  jdolecek 				break;
    406   1.1  jdolecek 			}
    407   1.1  jdolecek 		}
    408   1.1  jdolecek 
    409   1.1  jdolecek 		union_list_unlock(hash);
    410   1.1  jdolecek 
    411   1.1  jdolecek 		if (un)
    412   1.1  jdolecek 			break;
    413   1.1  jdolecek 	}
    414   1.1  jdolecek 
    415   1.1  jdolecek 	if (un) {
    416   1.1  jdolecek 		/*
    417   1.1  jdolecek 		 * Obtain a lock on the union_node.
    418   1.1  jdolecek 		 * uppervp is locked, though un->un_uppervp
    419   1.1  jdolecek 		 * may not be.  this doesn't break the locking
    420   1.1  jdolecek 		 * hierarchy since in the case that un->un_uppervp
    421   1.1  jdolecek 		 * is not yet locked it will be vrele'd and replaced
    422   1.1  jdolecek 		 * with uppervp.
    423   1.1  jdolecek 		 */
    424   1.1  jdolecek 
    425   1.1  jdolecek 		if ((dvp != NULLVP) && (uppervp == dvp)) {
    426   1.1  jdolecek 			/*
    427   1.1  jdolecek 			 * Access ``.'', so (un) will already
    428   1.1  jdolecek 			 * be locked.  Since this process has
    429   1.1  jdolecek 			 * the lock on (uppervp) no other
    430   1.1  jdolecek 			 * process can hold the lock on (un).
    431   1.1  jdolecek 			 */
    432   1.1  jdolecek #ifdef DIAGNOSTIC
    433   1.1  jdolecek 			if ((un->un_flags & UN_LOCKED) == 0)
    434   1.1  jdolecek 				panic("union: . not locked");
    435   1.1  jdolecek 			else if (curproc && un->un_pid != curproc->p_pid &&
    436   1.1  jdolecek 				    un->un_pid > -1 && curproc->p_pid > -1)
    437   1.1  jdolecek 				panic("union: allocvp not lock owner");
    438   1.1  jdolecek #endif
    439   1.1  jdolecek 		} else {
    440   1.1  jdolecek 			if (un->un_flags & UN_LOCKED) {
    441   1.1  jdolecek 				vrele(UNIONTOV(un));
    442   1.1  jdolecek 				un->un_flags |= UN_WANTED;
    443   1.1  jdolecek 				(void) tsleep(&un->un_flags, PINOD,
    444   1.1  jdolecek 				    "unionalloc", 0);
    445   1.1  jdolecek 				goto loop;
    446   1.1  jdolecek 			}
    447   1.1  jdolecek 			un->un_flags |= UN_LOCKED;
    448   1.1  jdolecek 
    449   1.1  jdolecek #ifdef DIAGNOSTIC
    450   1.1  jdolecek 			if (curproc)
    451   1.1  jdolecek 				un->un_pid = curproc->p_pid;
    452   1.1  jdolecek 			else
    453   1.1  jdolecek 				un->un_pid = -1;
    454   1.1  jdolecek #endif
    455   1.1  jdolecek 		}
    456   1.1  jdolecek 
    457   1.1  jdolecek 		/*
    458   1.1  jdolecek 		 * At this point, the union_node is locked,
    459   1.1  jdolecek 		 * un->un_uppervp may not be locked, and uppervp
    460   1.1  jdolecek 		 * is locked or nil.
    461   1.1  jdolecek 		 */
    462   1.1  jdolecek 
    463   1.1  jdolecek 		/*
    464   1.1  jdolecek 		 * Save information about the upper layer.
    465   1.1  jdolecek 		 */
    466   1.1  jdolecek 		if (uppervp != un->un_uppervp) {
    467   1.1  jdolecek 			union_newupper(un, uppervp);
    468   1.1  jdolecek 		} else if (uppervp) {
    469   1.1  jdolecek 			vrele(uppervp);
    470   1.1  jdolecek 		}
    471   1.1  jdolecek 
    472   1.1  jdolecek 		if (un->un_uppervp) {
    473   1.1  jdolecek 			un->un_flags |= UN_ULOCK;
    474   1.1  jdolecek 			un->un_flags &= ~UN_KLOCK;
    475   1.1  jdolecek 		}
    476   1.1  jdolecek 
    477   1.1  jdolecek 		/*
    478   1.1  jdolecek 		 * Save information about the lower layer.
    479   1.1  jdolecek 		 * This needs to keep track of pathname
    480   1.1  jdolecek 		 * and directory information which union_vn_create
    481   1.1  jdolecek 		 * might need.
    482   1.1  jdolecek 		 */
    483   1.1  jdolecek 		if (lowervp != un->un_lowervp) {
    484   1.1  jdolecek 			union_newlower(un, lowervp);
    485   1.1  jdolecek 			if (cnp && (lowervp != NULLVP)) {
    486   1.1  jdolecek 				un->un_hash = cnp->cn_hash;
    487   1.1  jdolecek 				un->un_path = malloc(cnp->cn_namelen+1,
    488   1.1  jdolecek 						M_TEMP, M_WAITOK);
    489   1.1  jdolecek 				memcpy(un->un_path, cnp->cn_nameptr,
    490   1.1  jdolecek 						cnp->cn_namelen);
    491   1.1  jdolecek 				un->un_path[cnp->cn_namelen] = '\0';
    492  1.35     pooka 				vref(dvp);
    493   1.1  jdolecek 				un->un_dirvp = dvp;
    494   1.1  jdolecek 			}
    495   1.1  jdolecek 		} else if (lowervp) {
    496   1.1  jdolecek 			vrele(lowervp);
    497   1.1  jdolecek 		}
    498   1.1  jdolecek 		*vpp = UNIONTOV(un);
    499   1.1  jdolecek 		return (0);
    500   1.1  jdolecek 	}
    501   1.1  jdolecek 
    502  1.27     pooka 	uppersz = lowersz = VNOVAL;
    503  1.27     pooka 	if (uppervp != NULLVP)
    504  1.29     pooka 		if (VOP_GETATTR(uppervp, &va, FSCRED) == 0)
    505  1.27     pooka 			uppersz = va.va_size;
    506  1.27     pooka 	if (lowervp != NULLVP)
    507  1.29     pooka 		if (VOP_GETATTR(lowervp, &va, FSCRED) == 0)
    508  1.27     pooka 			lowersz = va.va_size;
    509  1.38   hannken 	hash = UNION_HASH(uppervp, lowervp);
    510   1.1  jdolecek 
    511  1.43     rmind 	/*
    512  1.43     rmind 	 * Get a new vnode and share the lock with upper layer vnode,
    513  1.43     rmind 	 * unless layers are inverted.
    514  1.43     rmind 	 */
    515  1.43     rmind 	vnode_t *svp = (uppervp != NULLVP) ? uppervp : lowervp;
    516  1.43     rmind 	error = getnewvnode(VT_UNION, mp, union_vnodeop_p,
    517  1.43     rmind 	    svp->v_interlock, vpp);
    518   1.1  jdolecek 	if (error) {
    519   1.1  jdolecek 		if (uppervp) {
    520   1.1  jdolecek 			if (dvp == uppervp)
    521   1.1  jdolecek 				vrele(uppervp);
    522   1.1  jdolecek 			else
    523   1.1  jdolecek 				vput(uppervp);
    524   1.1  jdolecek 		}
    525   1.1  jdolecek 		if (lowervp)
    526   1.1  jdolecek 			vrele(lowervp);
    527   1.1  jdolecek 
    528   1.1  jdolecek 		goto out;
    529   1.1  jdolecek 	}
    530   1.1  jdolecek 
    531  1.38   hannken 	if (docache) {
    532  1.38   hannken 		while (union_list_lock(hash))
    533  1.38   hannken 			continue;
    534  1.38   hannken 		LIST_FOREACH(un1, &unhead[hash], un_cache) {
    535  1.38   hannken 			if (un1->un_lowervp == lowervp &&
    536  1.38   hannken 			    un1->un_uppervp == uppervp &&
    537  1.38   hannken 			    UNIONTOV(un1)->v_mount == mp) {
    538  1.38   hannken 				/*
    539  1.38   hannken 				 * Another thread beat us, push back freshly
    540  1.38   hannken 				 * allocated vnode and retry.
    541  1.38   hannken 				 */
    542  1.38   hannken 				union_list_unlock(hash);
    543  1.38   hannken 				ungetnewvnode(*vpp);
    544  1.38   hannken 				goto loop;
    545  1.38   hannken 			}
    546  1.38   hannken 		}
    547  1.38   hannken 	}
    548  1.38   hannken 
    549  1.34    cegger 	(*vpp)->v_data = malloc(sizeof(struct union_node), M_TEMP, M_WAITOK);
    550   1.1  jdolecek 
    551  1.28        ad 	(*vpp)->v_vflag |= vflag;
    552  1.28        ad 	(*vpp)->v_iflag |= iflag;
    553   1.1  jdolecek 	if (uppervp)
    554   1.1  jdolecek 		(*vpp)->v_type = uppervp->v_type;
    555   1.1  jdolecek 	else
    556   1.1  jdolecek 		(*vpp)->v_type = lowervp->v_type;
    557   1.1  jdolecek 	un = VTOUNION(*vpp);
    558   1.1  jdolecek 	un->un_vnode = *vpp;
    559   1.1  jdolecek 	un->un_uppervp = uppervp;
    560   1.1  jdolecek 	un->un_lowervp = lowervp;
    561   1.1  jdolecek 	un->un_pvp = undvp;
    562   1.1  jdolecek 	if (undvp != NULLVP)
    563  1.35     pooka 		vref(undvp);
    564   1.1  jdolecek 	un->un_dircache = 0;
    565   1.1  jdolecek 	un->un_openl = 0;
    566   1.1  jdolecek 	un->un_flags = UN_LOCKED;
    567  1.26     pooka 
    568  1.26     pooka 	un->un_uppersz = VNOVAL;
    569  1.26     pooka 	un->un_lowersz = VNOVAL;
    570  1.26     pooka 	union_newsize(*vpp, uppersz, lowersz);
    571  1.26     pooka 
    572   1.1  jdolecek 	if (un->un_uppervp)
    573   1.1  jdolecek 		un->un_flags |= UN_ULOCK;
    574   1.1  jdolecek #ifdef DIAGNOSTIC
    575   1.1  jdolecek 	if (curproc)
    576   1.1  jdolecek 		un->un_pid = curproc->p_pid;
    577   1.1  jdolecek 	else
    578   1.1  jdolecek 		un->un_pid = -1;
    579   1.1  jdolecek #endif
    580  1.17  christos 	if (dvp && cnp && (lowervp != NULLVP)) {
    581   1.1  jdolecek 		un->un_hash = cnp->cn_hash;
    582   1.1  jdolecek 		un->un_path = malloc(cnp->cn_namelen+1, M_TEMP, M_WAITOK);
    583   1.1  jdolecek 		memcpy(un->un_path, cnp->cn_nameptr, cnp->cn_namelen);
    584   1.1  jdolecek 		un->un_path[cnp->cn_namelen] = '\0';
    585  1.35     pooka 		vref(dvp);
    586   1.1  jdolecek 		un->un_dirvp = dvp;
    587   1.1  jdolecek 	} else {
    588   1.1  jdolecek 		un->un_hash = 0;
    589   1.1  jdolecek 		un->un_path = 0;
    590   1.1  jdolecek 		un->un_dirvp = 0;
    591   1.1  jdolecek 	}
    592   1.1  jdolecek 
    593   1.1  jdolecek 	if (docache) {
    594   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[hash], un, un_cache);
    595   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    596   1.1  jdolecek 	}
    597   1.1  jdolecek 
    598   1.1  jdolecek 	if (xlowervp)
    599   1.1  jdolecek 		vrele(xlowervp);
    600   1.1  jdolecek 
    601   1.1  jdolecek out:
    602   1.1  jdolecek 	if (docache)
    603   1.1  jdolecek 		union_list_unlock(hash);
    604   1.1  jdolecek 
    605   1.1  jdolecek 	return (error);
    606   1.1  jdolecek }
    607   1.1  jdolecek 
    608   1.1  jdolecek int
    609  1.32      matt union_freevp(struct vnode *vp)
    610   1.1  jdolecek {
    611  1.38   hannken 	int hash;
    612   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
    613   1.1  jdolecek 
    614  1.38   hannken 	hash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    615  1.38   hannken 
    616  1.38   hannken 	while (union_list_lock(hash))
    617  1.38   hannken 		continue;
    618   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
    619   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
    620   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
    621   1.1  jdolecek 	}
    622  1.38   hannken 	union_list_unlock(hash);
    623   1.1  jdolecek 
    624   1.1  jdolecek 	if (un->un_pvp != NULLVP)
    625   1.1  jdolecek 		vrele(un->un_pvp);
    626   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
    627   1.1  jdolecek 		vrele(un->un_uppervp);
    628   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
    629   1.1  jdolecek 		vrele(un->un_lowervp);
    630   1.1  jdolecek 	if (un->un_dirvp != NULLVP)
    631   1.1  jdolecek 		vrele(un->un_dirvp);
    632   1.1  jdolecek 	if (un->un_path)
    633   1.1  jdolecek 		free(un->un_path, M_TEMP);
    634   1.1  jdolecek 
    635  1.34    cegger 	free(vp->v_data, M_TEMP);
    636  1.34    cegger 	vp->v_data = NULL;
    637   1.1  jdolecek 
    638   1.1  jdolecek 	return (0);
    639   1.1  jdolecek }
    640   1.1  jdolecek 
    641   1.1  jdolecek /*
    642   1.1  jdolecek  * copyfile.  copy the vnode (fvp) to the vnode (tvp)
    643   1.1  jdolecek  * using a sequence of reads and writes.  both (fvp)
    644   1.1  jdolecek  * and (tvp) are locked on entry and exit.
    645   1.1  jdolecek  */
    646   1.1  jdolecek int
    647  1.32      matt union_copyfile(struct vnode *fvp, struct vnode *tvp, kauth_cred_t cred,
    648  1.32      matt 	struct lwp *l)
    649   1.1  jdolecek {
    650  1.13  christos 	char *tbuf;
    651   1.1  jdolecek 	struct uio uio;
    652   1.1  jdolecek 	struct iovec iov;
    653   1.1  jdolecek 	int error = 0;
    654   1.1  jdolecek 
    655   1.1  jdolecek 	/*
    656   1.1  jdolecek 	 * strategy:
    657   1.1  jdolecek 	 * allocate a buffer of size MAXBSIZE.
    658   1.1  jdolecek 	 * loop doing reads and writes, keeping track
    659   1.1  jdolecek 	 * of the current uio offset.
    660   1.1  jdolecek 	 * give up at the first sign of trouble.
    661   1.1  jdolecek 	 */
    662   1.1  jdolecek 
    663   1.1  jdolecek 	uio.uio_offset = 0;
    664  1.16      yamt 	UIO_SETUP_SYSSPACE(&uio);
    665   1.1  jdolecek 
    666  1.37   hannken 	VOP_UNLOCK(fvp);			/* XXX */
    667   1.1  jdolecek 	vn_lock(fvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    668  1.37   hannken 	VOP_UNLOCK(tvp);			/* XXX */
    669   1.1  jdolecek 	vn_lock(tvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    670   1.1  jdolecek 
    671  1.13  christos 	tbuf = malloc(MAXBSIZE, M_TEMP, M_WAITOK);
    672   1.1  jdolecek 
    673   1.1  jdolecek 	/* ugly loop follows... */
    674   1.1  jdolecek 	do {
    675   1.1  jdolecek 		off_t offset = uio.uio_offset;
    676   1.1  jdolecek 
    677   1.1  jdolecek 		uio.uio_iov = &iov;
    678   1.1  jdolecek 		uio.uio_iovcnt = 1;
    679  1.13  christos 		iov.iov_base = tbuf;
    680   1.1  jdolecek 		iov.iov_len = MAXBSIZE;
    681   1.1  jdolecek 		uio.uio_resid = iov.iov_len;
    682   1.1  jdolecek 		uio.uio_rw = UIO_READ;
    683   1.1  jdolecek 		error = VOP_READ(fvp, &uio, 0, cred);
    684   1.1  jdolecek 
    685   1.1  jdolecek 		if (error == 0) {
    686   1.1  jdolecek 			uio.uio_iov = &iov;
    687   1.1  jdolecek 			uio.uio_iovcnt = 1;
    688  1.13  christos 			iov.iov_base = tbuf;
    689   1.1  jdolecek 			iov.iov_len = MAXBSIZE - uio.uio_resid;
    690   1.1  jdolecek 			uio.uio_offset = offset;
    691   1.1  jdolecek 			uio.uio_rw = UIO_WRITE;
    692   1.1  jdolecek 			uio.uio_resid = iov.iov_len;
    693   1.1  jdolecek 
    694   1.1  jdolecek 			if (uio.uio_resid == 0)
    695   1.1  jdolecek 				break;
    696   1.1  jdolecek 
    697   1.1  jdolecek 			do {
    698   1.1  jdolecek 				error = VOP_WRITE(tvp, &uio, 0, cred);
    699   1.1  jdolecek 			} while ((uio.uio_resid > 0) && (error == 0));
    700   1.1  jdolecek 		}
    701   1.1  jdolecek 
    702   1.1  jdolecek 	} while (error == 0);
    703   1.1  jdolecek 
    704  1.13  christos 	free(tbuf, M_TEMP);
    705   1.1  jdolecek 	return (error);
    706   1.1  jdolecek }
    707   1.1  jdolecek 
    708   1.1  jdolecek /*
    709   1.1  jdolecek  * (un) is assumed to be locked on entry and remains
    710   1.1  jdolecek  * locked on exit.
    711   1.1  jdolecek  */
    712   1.1  jdolecek int
    713  1.32      matt union_copyup(struct union_node *un, int docopy, kauth_cred_t cred,
    714  1.32      matt 	struct lwp *l)
    715   1.1  jdolecek {
    716   1.1  jdolecek 	int error;
    717   1.1  jdolecek 	struct vnode *lvp, *uvp;
    718   1.1  jdolecek 	struct vattr lvattr, uvattr;
    719   1.1  jdolecek 
    720  1.15  christos 	error = union_vn_create(&uvp, un, l);
    721  1.25   hannken 	if (error)
    722   1.1  jdolecek 		return (error);
    723   1.1  jdolecek 
    724   1.1  jdolecek 	/* at this point, uppervp is locked */
    725   1.1  jdolecek 	union_newupper(un, uvp);
    726   1.1  jdolecek 	un->un_flags |= UN_ULOCK;
    727   1.1  jdolecek 
    728   1.1  jdolecek 	lvp = un->un_lowervp;
    729   1.1  jdolecek 
    730   1.1  jdolecek 	if (docopy) {
    731   1.1  jdolecek 		/*
    732   1.1  jdolecek 		 * XX - should not ignore errors
    733   1.1  jdolecek 		 * from VOP_CLOSE
    734   1.1  jdolecek 		 */
    735   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    736   1.1  jdolecek 
    737  1.29     pooka         	error = VOP_GETATTR(lvp, &lvattr, cred);
    738   1.1  jdolecek 		if (error == 0)
    739  1.29     pooka 			error = VOP_OPEN(lvp, FREAD, cred);
    740   1.1  jdolecek 		if (error == 0) {
    741  1.15  christos 			error = union_copyfile(lvp, uvp, cred, l);
    742  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    743   1.1  jdolecek 		}
    744   1.1  jdolecek 		if (error == 0) {
    745   1.1  jdolecek 			/* Copy permissions up too */
    746  1.35     pooka 			vattr_null(&uvattr);
    747   1.1  jdolecek 			uvattr.va_mode = lvattr.va_mode;
    748   1.1  jdolecek 			uvattr.va_flags = lvattr.va_flags;
    749  1.29     pooka         		error = VOP_SETATTR(uvp, &uvattr, cred);
    750   1.1  jdolecek 		}
    751  1.37   hannken 		VOP_UNLOCK(lvp);
    752   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    753   1.1  jdolecek 		if (error == 0)
    754   1.1  jdolecek 			uprintf("union: copied up %s\n", un->un_path);
    755   1.1  jdolecek #endif
    756   1.1  jdolecek 
    757   1.1  jdolecek 	}
    758  1.15  christos 	union_vn_close(uvp, FWRITE, cred, l);
    759   1.1  jdolecek 
    760   1.1  jdolecek 	/*
    761   1.1  jdolecek 	 * Subsequent IOs will go to the top layer, so
    762   1.1  jdolecek 	 * call close on the lower vnode and open on the
    763   1.1  jdolecek 	 * upper vnode to ensure that the filesystem keeps
    764   1.1  jdolecek 	 * its references counts right.  This doesn't do
    765   1.1  jdolecek 	 * the right thing with (cred) and (FREAD) though.
    766   1.1  jdolecek 	 * Ignoring error returns is not right, either.
    767   1.1  jdolecek 	 */
    768   1.1  jdolecek 	if (error == 0) {
    769   1.1  jdolecek 		int i;
    770   1.1  jdolecek 
    771   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    772   1.1  jdolecek 		for (i = 0; i < un->un_openl; i++) {
    773  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    774  1.29     pooka 			(void) VOP_OPEN(uvp, FREAD, cred);
    775   1.1  jdolecek 		}
    776   1.1  jdolecek 		un->un_openl = 0;
    777  1.37   hannken 		VOP_UNLOCK(lvp);
    778   1.1  jdolecek 	}
    779   1.1  jdolecek 
    780   1.1  jdolecek 	return (error);
    781   1.1  jdolecek 
    782   1.1  jdolecek }
    783   1.1  jdolecek 
    784   1.1  jdolecek static int
    785  1.32      matt union_relookup(
    786  1.32      matt 	struct union_mount *um,
    787  1.32      matt 	struct vnode *dvp,
    788  1.32      matt 	struct vnode **vpp,
    789  1.32      matt 	struct componentname *cnp,
    790  1.32      matt 	struct componentname *cn,
    791  1.40  dholland 	char **pnbuf_ret,
    792  1.32      matt 	const char *path,
    793  1.32      matt 	int pathlen)
    794   1.1  jdolecek {
    795   1.1  jdolecek 	int error;
    796  1.40  dholland 	char *pnbuf;
    797   1.1  jdolecek 
    798   1.1  jdolecek 	/*
    799   1.1  jdolecek 	 * A new componentname structure must be faked up because
    800   1.1  jdolecek 	 * there is no way to know where the upper level cnp came
    801   1.1  jdolecek 	 * from or what it is being used for.  This must duplicate
    802   1.1  jdolecek 	 * some of the work done by NDINIT, some of the work done
    803   1.1  jdolecek 	 * by namei, some of the work done by lookup and some of
    804   1.1  jdolecek 	 * the work done by VOP_LOOKUP when given a CREATE flag.
    805   1.1  jdolecek 	 * Conclusion: Horrible.
    806   1.1  jdolecek 	 */
    807   1.1  jdolecek 	cn->cn_namelen = pathlen;
    808   1.1  jdolecek 	if ((cn->cn_namelen + 1) > MAXPATHLEN)
    809   1.1  jdolecek 		return (ENAMETOOLONG);
    810  1.40  dholland 	pnbuf = PNBUF_GET();
    811  1.40  dholland 	memcpy(pnbuf, path, cn->cn_namelen);
    812  1.40  dholland 	pnbuf[cn->cn_namelen] = '\0';
    813  1.40  dholland 	*pnbuf_ret = pnbuf;
    814   1.1  jdolecek 
    815   1.1  jdolecek 	cn->cn_nameiop = CREATE;
    816  1.41  dholland 	cn->cn_flags = (LOCKPARENT|ISLASTCN);
    817   1.1  jdolecek 	if (um->um_op == UNMNT_ABOVE)
    818   1.1  jdolecek 		cn->cn_cred = cnp->cn_cred;
    819   1.1  jdolecek 	else
    820   1.1  jdolecek 		cn->cn_cred = um->um_cred;
    821  1.40  dholland 	cn->cn_nameptr = pnbuf;
    822   1.1  jdolecek 	cn->cn_hash = cnp->cn_hash;
    823   1.1  jdolecek 	cn->cn_consume = cnp->cn_consume;
    824   1.1  jdolecek 
    825  1.42  dholland 	error = relookup(dvp, vpp, cn, 0);
    826  1.22       chs 	if (error) {
    827  1.40  dholland 		PNBUF_PUT(pnbuf);
    828  1.40  dholland 		*pnbuf_ret = NULL;
    829   1.1  jdolecek 	}
    830   1.1  jdolecek 
    831   1.1  jdolecek 	return (error);
    832   1.1  jdolecek }
    833   1.1  jdolecek 
    834   1.1  jdolecek /*
    835   1.1  jdolecek  * Create a shadow directory in the upper layer.
    836   1.1  jdolecek  * The new vnode is returned locked.
    837   1.1  jdolecek  *
    838   1.1  jdolecek  * (um) points to the union mount structure for access to the
    839   1.1  jdolecek  * the mounting process's credentials.
    840   1.1  jdolecek  * (dvp) is the directory in which to create the shadow directory.
    841   1.1  jdolecek  * it is unlocked on entry and exit.
    842   1.1  jdolecek  * (cnp) is the componentname to be created.
    843   1.1  jdolecek  * (vpp) is the returned newly created shadow directory, which
    844   1.1  jdolecek  * is returned locked.
    845   1.1  jdolecek  *
    846   1.1  jdolecek  * N.B. We still attempt to create shadow directories even if the union
    847   1.1  jdolecek  * is mounted read-only, which is a little nonintuitive.
    848   1.1  jdolecek  */
    849   1.1  jdolecek int
    850  1.32      matt union_mkshadow(struct union_mount *um, struct vnode *dvp,
    851  1.32      matt 	struct componentname *cnp, struct vnode **vpp)
    852   1.1  jdolecek {
    853   1.1  jdolecek 	int error;
    854   1.1  jdolecek 	struct vattr va;
    855   1.1  jdolecek 	struct componentname cn;
    856  1.40  dholland 	char *pnbuf;
    857   1.1  jdolecek 
    858  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    859  1.40  dholland 	error = union_relookup(um, dvp, vpp, cnp, &cn, &pnbuf,
    860   1.1  jdolecek 			cnp->cn_nameptr, cnp->cn_namelen);
    861   1.8   hannken 	if (error) {
    862  1.37   hannken 		VOP_UNLOCK(dvp);
    863   1.1  jdolecek 		return (error);
    864   1.8   hannken 	}
    865   1.1  jdolecek 
    866   1.1  jdolecek 	if (*vpp) {
    867   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    868  1.40  dholland 		PNBUF_PUT(pnbuf);
    869  1.24       chs 		if (dvp != *vpp)
    870  1.37   hannken 			VOP_UNLOCK(dvp);
    871  1.22       chs 		vput(*vpp);
    872   1.1  jdolecek 		*vpp = NULLVP;
    873   1.1  jdolecek 		return (EEXIST);
    874   1.1  jdolecek 	}
    875   1.1  jdolecek 
    876   1.1  jdolecek 	/*
    877   1.1  jdolecek 	 * policy: when creating the shadow directory in the
    878   1.1  jdolecek 	 * upper layer, create it owned by the user who did
    879   1.1  jdolecek 	 * the mount, group from parent directory, and mode
    880   1.1  jdolecek 	 * 777 modified by umask (ie mostly identical to the
    881   1.1  jdolecek 	 * mkdir syscall).  (jsp, kb)
    882   1.1  jdolecek 	 */
    883   1.1  jdolecek 
    884  1.35     pooka 	vattr_null(&va);
    885   1.1  jdolecek 	va.va_type = VDIR;
    886   1.1  jdolecek 	va.va_mode = um->um_cmode;
    887   1.1  jdolecek 
    888  1.24       chs 	vref(dvp);
    889   1.1  jdolecek 	error = VOP_MKDIR(dvp, vpp, &cn, &va);
    890  1.40  dholland 	PNBUF_PUT(pnbuf);
    891   1.1  jdolecek 	return (error);
    892   1.1  jdolecek }
    893   1.1  jdolecek 
    894   1.1  jdolecek /*
    895   1.1  jdolecek  * Create a whiteout entry in the upper layer.
    896   1.1  jdolecek  *
    897   1.1  jdolecek  * (um) points to the union mount structure for access to the
    898   1.1  jdolecek  * the mounting process's credentials.
    899   1.1  jdolecek  * (dvp) is the directory in which to create the whiteout.
    900   1.1  jdolecek  * it is locked on entry and exit.
    901   1.1  jdolecek  * (cnp) is the componentname to be created.
    902   1.1  jdolecek  */
    903   1.1  jdolecek int
    904  1.32      matt union_mkwhiteout(struct union_mount *um, struct vnode *dvp,
    905  1.32      matt 	struct componentname *cnp, char *path)
    906   1.1  jdolecek {
    907   1.1  jdolecek 	int error;
    908   1.1  jdolecek 	struct vnode *wvp;
    909   1.1  jdolecek 	struct componentname cn;
    910  1.40  dholland 	char *pnbuf;
    911   1.1  jdolecek 
    912  1.37   hannken 	VOP_UNLOCK(dvp);
    913  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    914  1.40  dholland 	error = union_relookup(um, dvp, &wvp, cnp, &cn, &pnbuf,
    915  1.40  dholland 			       path, strlen(path));
    916  1.25   hannken 	if (error)
    917   1.1  jdolecek 		return (error);
    918   1.1  jdolecek 
    919   1.1  jdolecek 	if (wvp) {
    920   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    921  1.40  dholland 		PNBUF_PUT(pnbuf);
    922  1.24       chs 		if (dvp != wvp)
    923  1.37   hannken 			VOP_UNLOCK(dvp);
    924  1.22       chs 		vput(wvp);
    925   1.1  jdolecek 		return (EEXIST);
    926   1.1  jdolecek 	}
    927   1.1  jdolecek 
    928   1.1  jdolecek 	error = VOP_WHITEOUT(dvp, &cn, CREATE);
    929  1.40  dholland 	if (error) {
    930   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    931  1.40  dholland 	}
    932   1.1  jdolecek 
    933  1.40  dholland 	PNBUF_PUT(pnbuf);
    934   1.1  jdolecek 	return (error);
    935   1.1  jdolecek }
    936   1.1  jdolecek 
    937   1.1  jdolecek /*
    938   1.1  jdolecek  * union_vn_create: creates and opens a new shadow file
    939   1.1  jdolecek  * on the upper union layer.  this function is similar
    940   1.1  jdolecek  * in spirit to calling vn_open but it avoids calling namei().
    941   1.1  jdolecek  * the problem with calling namei is that a) it locks too many
    942   1.1  jdolecek  * things, and b) it doesn't start at the "right" directory,
    943   1.1  jdolecek  * whereas relookup is told where to start.
    944   1.1  jdolecek  */
    945   1.1  jdolecek int
    946  1.32      matt union_vn_create(struct vnode **vpp, struct union_node *un, struct lwp *l)
    947   1.1  jdolecek {
    948   1.1  jdolecek 	struct vnode *vp;
    949  1.19        ad 	kauth_cred_t cred = l->l_cred;
    950   1.1  jdolecek 	struct vattr vat;
    951   1.1  jdolecek 	struct vattr *vap = &vat;
    952   1.1  jdolecek 	int fmode = FFLAGS(O_WRONLY|O_CREAT|O_TRUNC|O_EXCL);
    953   1.1  jdolecek 	int error;
    954  1.15  christos 	int cmode = UN_FILEMODE & ~l->l_proc->p_cwdi->cwdi_cmask;
    955   1.1  jdolecek 	struct componentname cn;
    956  1.40  dholland 	char *pnbuf;
    957   1.1  jdolecek 
    958   1.1  jdolecek 	*vpp = NULLVP;
    959   1.1  jdolecek 
    960   1.1  jdolecek 	/*
    961   1.1  jdolecek 	 * Build a new componentname structure (for the same
    962   1.1  jdolecek 	 * reasons outlines in union_mkshadow).
    963   1.1  jdolecek 	 * The difference here is that the file is owned by
    964   1.1  jdolecek 	 * the current user, rather than by the person who
    965   1.1  jdolecek 	 * did the mount, since the current user needs to be
    966   1.1  jdolecek 	 * able to write the file (that's why it is being
    967   1.1  jdolecek 	 * copied in the first place).
    968   1.1  jdolecek 	 */
    969   1.1  jdolecek 	cn.cn_namelen = strlen(un->un_path);
    970   1.1  jdolecek 	if ((cn.cn_namelen + 1) > MAXPATHLEN)
    971   1.1  jdolecek 		return (ENAMETOOLONG);
    972  1.40  dholland 	pnbuf = PNBUF_GET();
    973  1.40  dholland 	memcpy(pnbuf, un->un_path, cn.cn_namelen+1);
    974   1.1  jdolecek 	cn.cn_nameiop = CREATE;
    975  1.41  dholland 	cn.cn_flags = (LOCKPARENT|ISLASTCN);
    976  1.19        ad 	cn.cn_cred = l->l_cred;
    977  1.40  dholland 	cn.cn_nameptr = pnbuf;
    978   1.1  jdolecek 	cn.cn_hash = un->un_hash;
    979   1.1  jdolecek 	cn.cn_consume = 0;
    980   1.1  jdolecek 
    981  1.24       chs 	vn_lock(un->un_dirvp, LK_EXCLUSIVE | LK_RETRY);
    982  1.42  dholland 	error = relookup(un->un_dirvp, &vp, &cn, 0);
    983  1.22       chs 	if (error) {
    984  1.40  dholland 		PNBUF_PUT(pnbuf);
    985  1.37   hannken 		VOP_UNLOCK(un->un_dirvp);
    986   1.1  jdolecek 		return (error);
    987  1.22       chs 	}
    988   1.1  jdolecek 
    989   1.1  jdolecek 	if (vp) {
    990   1.1  jdolecek 		VOP_ABORTOP(un->un_dirvp, &cn);
    991  1.40  dholland 		PNBUF_PUT(pnbuf);
    992  1.24       chs 		if (un->un_dirvp != vp)
    993  1.37   hannken 			VOP_UNLOCK(un->un_dirvp);
    994  1.22       chs 		vput(vp);
    995   1.1  jdolecek 		return (EEXIST);
    996   1.1  jdolecek 	}
    997   1.1  jdolecek 
    998   1.1  jdolecek 	/*
    999   1.1  jdolecek 	 * Good - there was no race to create the file
   1000   1.1  jdolecek 	 * so go ahead and create it.  The permissions
   1001   1.1  jdolecek 	 * on the file will be 0666 modified by the
   1002   1.1  jdolecek 	 * current user's umask.  Access to the file, while
   1003   1.1  jdolecek 	 * it is unioned, will require access to the top *and*
   1004   1.1  jdolecek 	 * bottom files.  Access when not unioned will simply
   1005   1.1  jdolecek 	 * require access to the top-level file.
   1006   1.1  jdolecek 	 * TODO: confirm choice of access permissions.
   1007   1.1  jdolecek 	 */
   1008  1.35     pooka 	vattr_null(vap);
   1009   1.1  jdolecek 	vap->va_type = VREG;
   1010   1.1  jdolecek 	vap->va_mode = cmode;
   1011  1.24       chs 	vref(un->un_dirvp);
   1012  1.40  dholland 	if ((error = VOP_CREATE(un->un_dirvp, &vp, &cn, vap)) != 0) {
   1013  1.40  dholland 		PNBUF_PUT(pnbuf);
   1014   1.1  jdolecek 		return (error);
   1015  1.40  dholland 	}
   1016   1.1  jdolecek 
   1017  1.29     pooka 	if ((error = VOP_OPEN(vp, fmode, cred)) != 0) {
   1018   1.1  jdolecek 		vput(vp);
   1019  1.40  dholland 		PNBUF_PUT(pnbuf);
   1020   1.1  jdolecek 		return (error);
   1021   1.1  jdolecek 	}
   1022   1.1  jdolecek 
   1023   1.1  jdolecek 	vp->v_writecount++;
   1024   1.1  jdolecek 	*vpp = vp;
   1025  1.40  dholland 	PNBUF_PUT(pnbuf);
   1026   1.1  jdolecek 	return (0);
   1027   1.1  jdolecek }
   1028   1.1  jdolecek 
   1029   1.1  jdolecek int
   1030  1.32      matt union_vn_close(struct vnode *vp, int fmode, kauth_cred_t cred, struct lwp *l)
   1031   1.1  jdolecek {
   1032   1.1  jdolecek 
   1033   1.1  jdolecek 	if (fmode & FWRITE)
   1034   1.1  jdolecek 		--vp->v_writecount;
   1035  1.29     pooka 	return (VOP_CLOSE(vp, fmode, cred));
   1036   1.1  jdolecek }
   1037   1.1  jdolecek 
   1038   1.1  jdolecek void
   1039  1.32      matt union_removed_upper(struct union_node *un)
   1040   1.1  jdolecek {
   1041  1.38   hannken 	int hash;
   1042  1.38   hannken 
   1043   1.1  jdolecek #if 1
   1044   1.1  jdolecek 	/*
   1045   1.1  jdolecek 	 * We do not set the uppervp to NULLVP here, because lowervp
   1046   1.1  jdolecek 	 * may also be NULLVP, so this routine would end up creating
   1047   1.1  jdolecek 	 * a bogus union node with no upper or lower VP (that causes
   1048   1.1  jdolecek 	 * pain in many places that assume at least one VP exists).
   1049   1.1  jdolecek 	 * Since we've removed this node from the cache hash chains,
   1050   1.1  jdolecek 	 * it won't be found again.  When all current holders
   1051   1.1  jdolecek 	 * release it, union_inactive() will vgone() it.
   1052   1.1  jdolecek 	 */
   1053   1.1  jdolecek 	union_diruncache(un);
   1054   1.1  jdolecek #else
   1055   1.1  jdolecek 	union_newupper(un, NULLVP);
   1056   1.1  jdolecek #endif
   1057   1.1  jdolecek 
   1058  1.38   hannken 	hash = UNION_HASH(un->un_uppervp, un->un_lowervp);
   1059  1.38   hannken 
   1060  1.38   hannken 	while (union_list_lock(hash))
   1061  1.38   hannken 		continue;
   1062   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
   1063   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
   1064   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
   1065   1.1  jdolecek 	}
   1066  1.38   hannken 	union_list_unlock(hash);
   1067   1.1  jdolecek 
   1068   1.1  jdolecek 	if (un->un_flags & UN_ULOCK) {
   1069   1.1  jdolecek 		un->un_flags &= ~UN_ULOCK;
   1070  1.37   hannken 		VOP_UNLOCK(un->un_uppervp);
   1071   1.1  jdolecek 	}
   1072   1.1  jdolecek }
   1073   1.1  jdolecek 
   1074   1.1  jdolecek #if 0
   1075   1.1  jdolecek struct vnode *
   1076  1.32      matt union_lowervp(struct vnode *vp)
   1077   1.1  jdolecek {
   1078   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
   1079   1.1  jdolecek 
   1080   1.1  jdolecek 	if ((un->un_lowervp != NULLVP) &&
   1081   1.1  jdolecek 	    (vp->v_type == un->un_lowervp->v_type)) {
   1082   1.1  jdolecek 		if (vget(un->un_lowervp, 0) == 0)
   1083   1.1  jdolecek 			return (un->un_lowervp);
   1084   1.1  jdolecek 	}
   1085   1.1  jdolecek 
   1086   1.1  jdolecek 	return (NULLVP);
   1087   1.1  jdolecek }
   1088   1.1  jdolecek #endif
   1089   1.1  jdolecek 
   1090   1.1  jdolecek /*
   1091   1.1  jdolecek  * determine whether a whiteout is needed
   1092   1.1  jdolecek  * during a remove/rmdir operation.
   1093   1.1  jdolecek  */
   1094   1.1  jdolecek int
   1095  1.32      matt union_dowhiteout(struct union_node *un, kauth_cred_t cred)
   1096   1.1  jdolecek {
   1097   1.1  jdolecek 	struct vattr va;
   1098   1.1  jdolecek 
   1099   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1100   1.1  jdolecek 		return (1);
   1101   1.1  jdolecek 
   1102  1.29     pooka 	if (VOP_GETATTR(un->un_uppervp, &va, cred) == 0 &&
   1103   1.1  jdolecek 	    (va.va_flags & OPAQUE))
   1104   1.1  jdolecek 		return (1);
   1105   1.1  jdolecek 
   1106   1.1  jdolecek 	return (0);
   1107   1.1  jdolecek }
   1108   1.1  jdolecek 
   1109   1.1  jdolecek static void
   1110  1.32      matt union_dircache_r(struct vnode *vp, struct vnode ***vppp, int *cntp)
   1111   1.1  jdolecek {
   1112   1.1  jdolecek 	struct union_node *un;
   1113   1.1  jdolecek 
   1114   1.1  jdolecek 	if (vp->v_op != union_vnodeop_p) {
   1115   1.1  jdolecek 		if (vppp) {
   1116  1.35     pooka 			vref(vp);
   1117   1.1  jdolecek 			*(*vppp)++ = vp;
   1118   1.1  jdolecek 			if (--(*cntp) == 0)
   1119   1.1  jdolecek 				panic("union: dircache table too small");
   1120   1.1  jdolecek 		} else {
   1121   1.1  jdolecek 			(*cntp)++;
   1122   1.1  jdolecek 		}
   1123   1.1  jdolecek 
   1124   1.1  jdolecek 		return;
   1125   1.1  jdolecek 	}
   1126   1.1  jdolecek 
   1127   1.1  jdolecek 	un = VTOUNION(vp);
   1128   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
   1129   1.1  jdolecek 		union_dircache_r(un->un_uppervp, vppp, cntp);
   1130   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1131   1.1  jdolecek 		union_dircache_r(un->un_lowervp, vppp, cntp);
   1132   1.1  jdolecek }
   1133   1.1  jdolecek 
   1134   1.1  jdolecek struct vnode *
   1135  1.21  christos union_dircache(struct vnode *vp, struct lwp *l)
   1136   1.1  jdolecek {
   1137   1.1  jdolecek 	int cnt;
   1138   1.1  jdolecek 	struct vnode *nvp = NULLVP;
   1139   1.1  jdolecek 	struct vnode **vpp;
   1140   1.1  jdolecek 	struct vnode **dircache;
   1141   1.1  jdolecek 	int error;
   1142   1.1  jdolecek 
   1143   1.1  jdolecek 	vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
   1144   1.1  jdolecek 	dircache = VTOUNION(vp)->un_dircache;
   1145   1.1  jdolecek 
   1146   1.1  jdolecek 	nvp = NULLVP;
   1147   1.1  jdolecek 
   1148   1.1  jdolecek 	if (dircache == 0) {
   1149   1.1  jdolecek 		cnt = 0;
   1150   1.1  jdolecek 		union_dircache_r(vp, 0, &cnt);
   1151   1.1  jdolecek 		cnt++;
   1152   1.1  jdolecek 		dircache = (struct vnode **)
   1153   1.1  jdolecek 				malloc(cnt * sizeof(struct vnode *),
   1154   1.1  jdolecek 					M_TEMP, M_WAITOK);
   1155   1.1  jdolecek 		vpp = dircache;
   1156   1.1  jdolecek 		union_dircache_r(vp, &vpp, &cnt);
   1157   1.1  jdolecek 		VTOUNION(vp)->un_dircache = dircache;
   1158   1.1  jdolecek 		*vpp = NULLVP;
   1159   1.1  jdolecek 		vpp = dircache + 1;
   1160   1.1  jdolecek 	} else {
   1161   1.1  jdolecek 		vpp = dircache;
   1162   1.1  jdolecek 		do {
   1163   1.1  jdolecek 			if (*vpp++ == VTOUNION(vp)->un_uppervp)
   1164   1.1  jdolecek 				break;
   1165   1.1  jdolecek 		} while (*vpp != NULLVP);
   1166   1.1  jdolecek 	}
   1167   1.1  jdolecek 
   1168   1.1  jdolecek 	if (*vpp == NULLVP)
   1169   1.1  jdolecek 		goto out;
   1170   1.1  jdolecek 
   1171   1.1  jdolecek 	vn_lock(*vpp, LK_EXCLUSIVE | LK_RETRY);
   1172  1.35     pooka 	vref(*vpp);
   1173   1.5   thorpej 	error = union_allocvp(&nvp, vp->v_mount, NULLVP, NULLVP, 0, *vpp, NULLVP, 0);
   1174   1.1  jdolecek 	if (!error) {
   1175   1.1  jdolecek 		VTOUNION(vp)->un_dircache = 0;
   1176   1.1  jdolecek 		VTOUNION(nvp)->un_dircache = dircache;
   1177   1.1  jdolecek 	}
   1178   1.1  jdolecek 
   1179   1.1  jdolecek out:
   1180  1.37   hannken 	VOP_UNLOCK(vp);
   1181   1.1  jdolecek 	return (nvp);
   1182   1.1  jdolecek }
   1183   1.1  jdolecek 
   1184   1.1  jdolecek void
   1185  1.32      matt union_diruncache(struct union_node *un)
   1186   1.1  jdolecek {
   1187   1.1  jdolecek 	struct vnode **vpp;
   1188   1.1  jdolecek 
   1189   1.1  jdolecek 	if (un->un_dircache != 0) {
   1190   1.1  jdolecek 		for (vpp = un->un_dircache; *vpp != NULLVP; vpp++)
   1191   1.1  jdolecek 			vrele(*vpp);
   1192   1.1  jdolecek 		free(un->un_dircache, M_TEMP);
   1193   1.1  jdolecek 		un->un_dircache = 0;
   1194   1.1  jdolecek 	}
   1195   1.2  jdolecek }
   1196   1.2  jdolecek 
   1197   1.2  jdolecek /*
   1198  1.44   hannken  * Check whether node can rmdir (check empty).
   1199  1.44   hannken  */
   1200  1.44   hannken int
   1201  1.44   hannken union_check_rmdir(struct union_node *un, kauth_cred_t cred)
   1202  1.44   hannken {
   1203  1.44   hannken 	int dirlen, eofflag, error;
   1204  1.44   hannken 	char *dirbuf;
   1205  1.44   hannken 	struct vattr va;
   1206  1.44   hannken 	struct vnode *tvp;
   1207  1.44   hannken 	struct dirent *dp, *edp;
   1208  1.44   hannken 	struct componentname cn;
   1209  1.44   hannken 	struct iovec aiov;
   1210  1.44   hannken 	struct uio auio;
   1211  1.44   hannken 
   1212  1.44   hannken 	KASSERT(un->un_uppervp != NULL);
   1213  1.44   hannken 
   1214  1.44   hannken 	/* Check upper for being opaque. */
   1215  1.44   hannken 	KASSERT(VOP_ISLOCKED(un->un_uppervp));
   1216  1.44   hannken 	error = VOP_GETATTR(un->un_uppervp, &va, cred);
   1217  1.44   hannken 	if (error || (va.va_flags & OPAQUE))
   1218  1.44   hannken 		return error;
   1219  1.44   hannken 
   1220  1.44   hannken 	if (un->un_lowervp == NULL)
   1221  1.44   hannken 		return 0;
   1222  1.44   hannken 
   1223  1.44   hannken 	/* Check lower for being empty. */
   1224  1.45   hannken 	vn_lock(un->un_lowervp, LK_SHARED | LK_RETRY);
   1225  1.44   hannken 	error = VOP_GETATTR(un->un_lowervp, &va, cred);
   1226  1.44   hannken 	if (error) {
   1227  1.44   hannken 		VOP_UNLOCK(un->un_lowervp);
   1228  1.44   hannken 		return error;
   1229  1.44   hannken 	}
   1230  1.44   hannken 	dirlen = va.va_blocksize;
   1231  1.44   hannken 	dirbuf = kmem_alloc(dirlen, KM_SLEEP);
   1232  1.44   hannken 	if (dirbuf == NULL) {
   1233  1.44   hannken 		VOP_UNLOCK(un->un_lowervp);
   1234  1.44   hannken 		return ENOMEM;
   1235  1.44   hannken 	}
   1236  1.44   hannken 	/* error = 0; */
   1237  1.44   hannken 	eofflag = 0;
   1238  1.44   hannken 	auio.uio_offset = 0;
   1239  1.44   hannken 	do {
   1240  1.44   hannken 		aiov.iov_len = dirlen;
   1241  1.44   hannken 		aiov.iov_base = dirbuf;
   1242  1.44   hannken 		auio.uio_iov = &aiov;
   1243  1.44   hannken 		auio.uio_iovcnt = 1;
   1244  1.44   hannken 		auio.uio_resid = aiov.iov_len;
   1245  1.44   hannken 		auio.uio_rw = UIO_READ;
   1246  1.44   hannken 		UIO_SETUP_SYSSPACE(&auio);
   1247  1.44   hannken 		error = VOP_READDIR(un->un_lowervp, &auio, cred, &eofflag,
   1248  1.44   hannken 		    NULL, NULL);
   1249  1.44   hannken 		if (error)
   1250  1.44   hannken 			break;
   1251  1.44   hannken 		edp = (struct dirent *)&dirbuf[dirlen - auio.uio_resid];
   1252  1.44   hannken 		for (dp = (struct dirent *)dirbuf;
   1253  1.44   hannken 		    error == 0 && dp < edp;
   1254  1.44   hannken 		    dp = (struct dirent *)((char *)dp + dp->d_reclen)) {
   1255  1.44   hannken 			if (dp->d_reclen == 0) {
   1256  1.44   hannken 				error = ENOTEMPTY;
   1257  1.44   hannken 				break;
   1258  1.44   hannken 			}
   1259  1.44   hannken 			if (dp->d_type == DT_WHT ||
   1260  1.44   hannken 			    (dp->d_namlen == 1 && dp->d_name[0] == '.') ||
   1261  1.44   hannken 			    (dp->d_namlen == 2 && !memcmp(dp->d_name, "..", 2)))
   1262  1.44   hannken 				continue;
   1263  1.44   hannken 			/* Check for presence in the upper layer. */
   1264  1.44   hannken 			cn.cn_nameiop = LOOKUP;
   1265  1.44   hannken 			cn.cn_flags = ISLASTCN | RDONLY;
   1266  1.44   hannken 			cn.cn_cred = cred;
   1267  1.44   hannken 			cn.cn_nameptr = dp->d_name;
   1268  1.44   hannken 			cn.cn_namelen = dp->d_namlen;
   1269  1.44   hannken 			cn.cn_hash = 0;
   1270  1.44   hannken 			cn.cn_consume = 0;
   1271  1.44   hannken 			error = VOP_LOOKUP(un->un_uppervp, &tvp, &cn);
   1272  1.44   hannken 			if (error == ENOENT && (cn.cn_flags & ISWHITEOUT)) {
   1273  1.44   hannken 				error = 0;
   1274  1.44   hannken 				continue;
   1275  1.44   hannken 			}
   1276  1.44   hannken 			if (error == 0)
   1277  1.44   hannken 				vput(tvp);
   1278  1.44   hannken 			error = ENOTEMPTY;
   1279  1.44   hannken 		}
   1280  1.44   hannken 	} while (error == 0 && !eofflag);
   1281  1.44   hannken 	kmem_free(dirbuf, dirlen);
   1282  1.44   hannken 	VOP_UNLOCK(un->un_lowervp);
   1283  1.44   hannken 
   1284  1.44   hannken 	return error;
   1285  1.44   hannken }
   1286  1.44   hannken 
   1287  1.44   hannken /*
   1288   1.2  jdolecek  * This hook is called from vn_readdir() to switch to lower directory
   1289   1.2  jdolecek  * entry after the upper directory is read.
   1290   1.2  jdolecek  */
   1291   1.2  jdolecek int
   1292  1.15  christos union_readdirhook(struct vnode **vpp, struct file *fp, struct lwp *l)
   1293   1.2  jdolecek {
   1294   1.2  jdolecek 	struct vnode *vp = *vpp, *lvp;
   1295   1.2  jdolecek 	struct vattr va;
   1296   1.2  jdolecek 	int error;
   1297   1.2  jdolecek 
   1298   1.2  jdolecek 	if (vp->v_op != union_vnodeop_p)
   1299   1.2  jdolecek 		return (0);
   1300   1.2  jdolecek 
   1301  1.15  christos 	if ((lvp = union_dircache(vp, l)) == NULLVP)
   1302   1.2  jdolecek 		return (0);
   1303   1.2  jdolecek 
   1304   1.2  jdolecek 	/*
   1305   1.2  jdolecek 	 * If the directory is opaque,
   1306   1.2  jdolecek 	 * then don't show lower entries
   1307   1.2  jdolecek 	 */
   1308  1.29     pooka 	error = VOP_GETATTR(vp, &va, fp->f_cred);
   1309   1.2  jdolecek 	if (error || (va.va_flags & OPAQUE)) {
   1310   1.2  jdolecek 		vput(lvp);
   1311   1.2  jdolecek 		return (error);
   1312   1.2  jdolecek 	}
   1313  1.12     perry 
   1314  1.29     pooka 	error = VOP_OPEN(lvp, FREAD, fp->f_cred);
   1315   1.2  jdolecek 	if (error) {
   1316   1.2  jdolecek 		vput(lvp);
   1317   1.2  jdolecek 		return (error);
   1318   1.2  jdolecek 	}
   1319  1.37   hannken 	VOP_UNLOCK(lvp);
   1320  1.10       jrf 	fp->f_data = lvp;
   1321   1.2  jdolecek 	fp->f_offset = 0;
   1322  1.33        ad 	error = vn_close(vp, FREAD, fp->f_cred);
   1323   1.2  jdolecek 	if (error)
   1324   1.2  jdolecek 		return (error);
   1325   1.2  jdolecek 	*vpp = lvp;
   1326   1.2  jdolecek 	return (0);
   1327   1.1  jdolecek }
   1328