Home | History | Annotate | Line # | Download | only in union
union_subr.c revision 1.46
      1  1.46   hannken /*	$NetBSD: union_subr.c,v 1.46 2011/08/10 15:56:01 hannken Exp $	*/
      2   1.1  jdolecek 
      3   1.1  jdolecek /*
      4   1.1  jdolecek  * Copyright (c) 1994
      5   1.1  jdolecek  *	The Regents of the University of California.  All rights reserved.
      6   1.1  jdolecek  *
      7   1.1  jdolecek  * This code is derived from software contributed to Berkeley by
      8   1.1  jdolecek  * Jan-Simon Pendry.
      9   1.1  jdolecek  *
     10   1.1  jdolecek  * Redistribution and use in source and binary forms, with or without
     11   1.1  jdolecek  * modification, are permitted provided that the following conditions
     12   1.1  jdolecek  * are met:
     13   1.1  jdolecek  * 1. Redistributions of source code must retain the above copyright
     14   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer.
     15   1.1  jdolecek  * 2. Redistributions in binary form must reproduce the above copyright
     16   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer in the
     17   1.1  jdolecek  *    documentation and/or other materials provided with the distribution.
     18   1.7       agc  * 3. Neither the name of the University nor the names of its contributors
     19   1.7       agc  *    may be used to endorse or promote products derived from this software
     20   1.7       agc  *    without specific prior written permission.
     21   1.7       agc  *
     22   1.7       agc  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     23   1.7       agc  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     24   1.7       agc  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     25   1.7       agc  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     26   1.7       agc  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     27   1.7       agc  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     28   1.7       agc  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     29   1.7       agc  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     30   1.7       agc  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     31   1.7       agc  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     32   1.7       agc  * SUCH DAMAGE.
     33   1.7       agc  *
     34   1.7       agc  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     35   1.7       agc  */
     36   1.7       agc 
     37   1.7       agc /*
     38   1.7       agc  * Copyright (c) 1994 Jan-Simon Pendry
     39   1.7       agc  *
     40   1.7       agc  * This code is derived from software contributed to Berkeley by
     41   1.7       agc  * Jan-Simon Pendry.
     42   1.7       agc  *
     43   1.7       agc  * Redistribution and use in source and binary forms, with or without
     44   1.7       agc  * modification, are permitted provided that the following conditions
     45   1.7       agc  * are met:
     46   1.7       agc  * 1. Redistributions of source code must retain the above copyright
     47   1.7       agc  *    notice, this list of conditions and the following disclaimer.
     48   1.7       agc  * 2. Redistributions in binary form must reproduce the above copyright
     49   1.7       agc  *    notice, this list of conditions and the following disclaimer in the
     50   1.7       agc  *    documentation and/or other materials provided with the distribution.
     51   1.1  jdolecek  * 3. All advertising materials mentioning features or use of this software
     52   1.1  jdolecek  *    must display the following acknowledgement:
     53   1.1  jdolecek  *	This product includes software developed by the University of
     54   1.1  jdolecek  *	California, Berkeley and its contributors.
     55   1.1  jdolecek  * 4. Neither the name of the University nor the names of its contributors
     56   1.1  jdolecek  *    may be used to endorse or promote products derived from this software
     57   1.1  jdolecek  *    without specific prior written permission.
     58   1.1  jdolecek  *
     59   1.1  jdolecek  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     60   1.1  jdolecek  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     61   1.1  jdolecek  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     62   1.1  jdolecek  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     63   1.1  jdolecek  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     64   1.1  jdolecek  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     65   1.1  jdolecek  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     66   1.1  jdolecek  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     67   1.1  jdolecek  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     68   1.1  jdolecek  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     69   1.1  jdolecek  * SUCH DAMAGE.
     70   1.1  jdolecek  *
     71   1.1  jdolecek  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     72   1.1  jdolecek  */
     73   1.1  jdolecek 
     74   1.1  jdolecek #include <sys/cdefs.h>
     75  1.46   hannken __KERNEL_RCSID(0, "$NetBSD: union_subr.c,v 1.46 2011/08/10 15:56:01 hannken Exp $");
     76   1.1  jdolecek 
     77   1.1  jdolecek #include <sys/param.h>
     78   1.1  jdolecek #include <sys/systm.h>
     79   1.1  jdolecek #include <sys/proc.h>
     80   1.1  jdolecek #include <sys/time.h>
     81   1.1  jdolecek #include <sys/kernel.h>
     82   1.1  jdolecek #include <sys/vnode.h>
     83   1.1  jdolecek #include <sys/namei.h>
     84   1.1  jdolecek #include <sys/malloc.h>
     85  1.44   hannken #include <sys/dirent.h>
     86   1.1  jdolecek #include <sys/file.h>
     87   1.1  jdolecek #include <sys/filedesc.h>
     88   1.1  jdolecek #include <sys/queue.h>
     89   1.1  jdolecek #include <sys/mount.h>
     90   1.1  jdolecek #include <sys/stat.h>
     91  1.18      elad #include <sys/kauth.h>
     92   1.1  jdolecek 
     93   1.1  jdolecek #include <uvm/uvm_extern.h>
     94   1.1  jdolecek 
     95   1.1  jdolecek #include <fs/union/union.h>
     96   1.1  jdolecek 
     97   1.1  jdolecek /* must be power of two, otherwise change UNION_HASH() */
     98   1.1  jdolecek #define NHASH 32
     99   1.1  jdolecek 
    100   1.1  jdolecek /* unsigned int ... */
    101   1.1  jdolecek #define UNION_HASH(u, l) \
    102   1.1  jdolecek 	(((((unsigned long) (u)) + ((unsigned long) l)) >> 8) & (NHASH-1))
    103   1.1  jdolecek 
    104   1.1  jdolecek static LIST_HEAD(unhead, union_node) unhead[NHASH];
    105   1.1  jdolecek static int unvplock[NHASH];
    106   1.1  jdolecek 
    107  1.14   xtraeme static int union_list_lock(int);
    108  1.14   xtraeme static void union_list_unlock(int);
    109  1.14   xtraeme void union_updatevp(struct union_node *, struct vnode *, struct vnode *);
    110  1.14   xtraeme static int union_relookup(struct union_mount *, struct vnode *,
    111   1.1  jdolecek 			       struct vnode **, struct componentname *,
    112  1.40  dholland 			       struct componentname *, char **,
    113  1.40  dholland 			       const char *, int);
    114  1.18      elad int union_vn_close(struct vnode *, int, kauth_cred_t, struct lwp *);
    115  1.14   xtraeme static void union_dircache_r(struct vnode *, struct vnode ***, int *);
    116  1.15  christos struct vnode *union_dircache(struct vnode *, struct lwp *);
    117   1.1  jdolecek 
    118   1.1  jdolecek void
    119  1.32      matt union_init(void)
    120   1.1  jdolecek {
    121   1.1  jdolecek 	int i;
    122   1.1  jdolecek 
    123   1.1  jdolecek 	for (i = 0; i < NHASH; i++)
    124   1.1  jdolecek 		LIST_INIT(&unhead[i]);
    125   1.9       jrf 	memset(unvplock, 0, sizeof(unvplock));
    126   1.1  jdolecek }
    127   1.1  jdolecek 
    128   1.1  jdolecek /*
    129   1.1  jdolecek  * Free global unionfs resources.
    130   1.1  jdolecek  */
    131   1.1  jdolecek void
    132  1.32      matt union_done(void)
    133   1.1  jdolecek {
    134  1.12     perry 
    135   1.2  jdolecek 	/* Make sure to unset the readdir hook. */
    136   1.2  jdolecek 	vn_union_readdir_hook = NULL;
    137   1.1  jdolecek }
    138   1.1  jdolecek 
    139   1.1  jdolecek static int
    140  1.32      matt union_list_lock(int ix)
    141   1.1  jdolecek {
    142   1.1  jdolecek 
    143   1.1  jdolecek 	if (unvplock[ix] & UN_LOCKED) {
    144   1.1  jdolecek 		unvplock[ix] |= UN_WANTED;
    145   1.1  jdolecek 		(void) tsleep(&unvplock[ix], PINOD, "unionlk", 0);
    146   1.1  jdolecek 		return (1);
    147   1.1  jdolecek 	}
    148   1.1  jdolecek 
    149   1.1  jdolecek 	unvplock[ix] |= UN_LOCKED;
    150   1.1  jdolecek 
    151   1.1  jdolecek 	return (0);
    152   1.1  jdolecek }
    153   1.1  jdolecek 
    154   1.1  jdolecek static void
    155  1.32      matt union_list_unlock(int ix)
    156   1.1  jdolecek {
    157   1.1  jdolecek 
    158   1.1  jdolecek 	unvplock[ix] &= ~UN_LOCKED;
    159   1.1  jdolecek 
    160   1.1  jdolecek 	if (unvplock[ix] & UN_WANTED) {
    161   1.1  jdolecek 		unvplock[ix] &= ~UN_WANTED;
    162   1.9       jrf 		wakeup(&unvplock[ix]);
    163   1.1  jdolecek 	}
    164   1.1  jdolecek }
    165   1.1  jdolecek 
    166   1.1  jdolecek void
    167  1.32      matt union_updatevp(struct union_node *un, struct vnode *uppervp,
    168  1.32      matt 	struct vnode *lowervp)
    169   1.1  jdolecek {
    170   1.1  jdolecek 	int ohash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    171   1.1  jdolecek 	int nhash = UNION_HASH(uppervp, lowervp);
    172   1.1  jdolecek 	int docache = (lowervp != NULLVP || uppervp != NULLVP);
    173   1.1  jdolecek 	int lhash, uhash;
    174   1.1  jdolecek 
    175   1.1  jdolecek 	/*
    176   1.1  jdolecek 	 * Ensure locking is ordered from lower to higher
    177   1.1  jdolecek 	 * to avoid deadlocks.
    178   1.1  jdolecek 	 */
    179   1.1  jdolecek 	if (nhash < ohash) {
    180   1.1  jdolecek 		lhash = nhash;
    181   1.1  jdolecek 		uhash = ohash;
    182   1.1  jdolecek 	} else {
    183   1.1  jdolecek 		lhash = ohash;
    184   1.1  jdolecek 		uhash = nhash;
    185   1.1  jdolecek 	}
    186   1.1  jdolecek 
    187   1.1  jdolecek 	if (lhash != uhash)
    188   1.1  jdolecek 		while (union_list_lock(lhash))
    189   1.1  jdolecek 			continue;
    190   1.1  jdolecek 
    191   1.1  jdolecek 	while (union_list_lock(uhash))
    192   1.1  jdolecek 		continue;
    193   1.1  jdolecek 
    194   1.1  jdolecek 	if (ohash != nhash || !docache) {
    195   1.1  jdolecek 		if (un->un_flags & UN_CACHED) {
    196   1.1  jdolecek 			un->un_flags &= ~UN_CACHED;
    197   1.1  jdolecek 			LIST_REMOVE(un, un_cache);
    198   1.1  jdolecek 		}
    199   1.1  jdolecek 	}
    200   1.1  jdolecek 
    201   1.1  jdolecek 	if (ohash != nhash)
    202   1.1  jdolecek 		union_list_unlock(ohash);
    203   1.1  jdolecek 
    204   1.1  jdolecek 	if (un->un_lowervp != lowervp) {
    205   1.1  jdolecek 		if (un->un_lowervp) {
    206   1.1  jdolecek 			vrele(un->un_lowervp);
    207   1.1  jdolecek 			if (un->un_path) {
    208   1.1  jdolecek 				free(un->un_path, M_TEMP);
    209   1.1  jdolecek 				un->un_path = 0;
    210   1.1  jdolecek 			}
    211   1.1  jdolecek 			if (un->un_dirvp) {
    212   1.1  jdolecek 				vrele(un->un_dirvp);
    213   1.1  jdolecek 				un->un_dirvp = NULLVP;
    214   1.1  jdolecek 			}
    215   1.1  jdolecek 		}
    216   1.1  jdolecek 		un->un_lowervp = lowervp;
    217   1.1  jdolecek 		un->un_lowersz = VNOVAL;
    218   1.1  jdolecek 	}
    219   1.1  jdolecek 
    220   1.1  jdolecek 	if (un->un_uppervp != uppervp) {
    221   1.1  jdolecek 		if (un->un_uppervp)
    222   1.1  jdolecek 			vrele(un->un_uppervp);
    223   1.1  jdolecek 
    224   1.1  jdolecek 		un->un_uppervp = uppervp;
    225   1.1  jdolecek 		un->un_uppersz = VNOVAL;
    226  1.46   hannken 		/* Update union vnode interlock. */
    227  1.46   hannken 		if (uppervp != NULL) {
    228  1.46   hannken 			mutex_obj_hold(uppervp->v_interlock);
    229  1.46   hannken 			uvm_obj_setlock(&UNIONTOV(un)->v_uobj,
    230  1.46   hannken 			    uppervp->v_interlock);
    231  1.46   hannken 		}
    232   1.1  jdolecek 	}
    233   1.1  jdolecek 
    234   1.1  jdolecek 	if (docache && (ohash != nhash)) {
    235   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[nhash], un, un_cache);
    236   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    237   1.1  jdolecek 	}
    238   1.1  jdolecek 
    239   1.1  jdolecek 	union_list_unlock(nhash);
    240   1.1  jdolecek }
    241   1.1  jdolecek 
    242   1.1  jdolecek void
    243  1.32      matt union_newlower(struct union_node *un, struct vnode *lowervp)
    244   1.1  jdolecek {
    245   1.1  jdolecek 
    246   1.1  jdolecek 	union_updatevp(un, un->un_uppervp, lowervp);
    247   1.1  jdolecek }
    248   1.1  jdolecek 
    249   1.1  jdolecek void
    250  1.32      matt union_newupper(struct union_node *un, struct vnode *uppervp)
    251   1.1  jdolecek {
    252   1.1  jdolecek 
    253   1.1  jdolecek 	union_updatevp(un, uppervp, un->un_lowervp);
    254   1.1  jdolecek }
    255   1.1  jdolecek 
    256   1.1  jdolecek /*
    257   1.1  jdolecek  * Keep track of size changes in the underlying vnodes.
    258   1.1  jdolecek  * If the size changes, then callback to the vm layer
    259   1.1  jdolecek  * giving priority to the upper layer size.
    260   1.1  jdolecek  */
    261   1.1  jdolecek void
    262  1.32      matt union_newsize(struct vnode *vp, off_t uppersz, off_t lowersz)
    263   1.1  jdolecek {
    264   1.1  jdolecek 	struct union_node *un;
    265   1.1  jdolecek 	off_t sz;
    266   1.1  jdolecek 
    267   1.1  jdolecek 	/* only interested in regular files */
    268  1.26     pooka 	if (vp->v_type != VREG) {
    269  1.26     pooka 		uvm_vnp_setsize(vp, 0);
    270   1.1  jdolecek 		return;
    271  1.26     pooka 	}
    272   1.1  jdolecek 
    273   1.1  jdolecek 	un = VTOUNION(vp);
    274   1.1  jdolecek 	sz = VNOVAL;
    275   1.1  jdolecek 
    276   1.1  jdolecek 	if ((uppersz != VNOVAL) && (un->un_uppersz != uppersz)) {
    277   1.1  jdolecek 		un->un_uppersz = uppersz;
    278   1.1  jdolecek 		if (sz == VNOVAL)
    279   1.1  jdolecek 			sz = un->un_uppersz;
    280   1.1  jdolecek 	}
    281   1.1  jdolecek 
    282   1.1  jdolecek 	if ((lowersz != VNOVAL) && (un->un_lowersz != lowersz)) {
    283   1.1  jdolecek 		un->un_lowersz = lowersz;
    284   1.1  jdolecek 		if (sz == VNOVAL)
    285   1.1  jdolecek 			sz = un->un_lowersz;
    286   1.1  jdolecek 	}
    287   1.1  jdolecek 
    288   1.1  jdolecek 	if (sz != VNOVAL) {
    289   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    290   1.1  jdolecek 		printf("union: %s size now %qd\n",
    291   1.1  jdolecek 		    uppersz != VNOVAL ? "upper" : "lower", sz);
    292   1.1  jdolecek #endif
    293   1.1  jdolecek 		uvm_vnp_setsize(vp, sz);
    294   1.1  jdolecek 	}
    295   1.1  jdolecek }
    296   1.1  jdolecek 
    297   1.1  jdolecek /*
    298   1.1  jdolecek  * allocate a union_node/vnode pair.  the vnode is
    299   1.1  jdolecek  * referenced and locked.  the new vnode is returned
    300   1.1  jdolecek  * via (vpp).  (mp) is the mountpoint of the union filesystem,
    301   1.1  jdolecek  * (dvp) is the parent directory where the upper layer object
    302   1.1  jdolecek  * should exist (but doesn't) and (cnp) is the componentname
    303   1.1  jdolecek  * information which is partially copied to allow the upper
    304   1.1  jdolecek  * layer object to be created at a later time.  (uppervp)
    305   1.1  jdolecek  * and (lowervp) reference the upper and lower layer objects
    306   1.1  jdolecek  * being mapped.  either, but not both, can be nil.
    307   1.1  jdolecek  * if supplied, (uppervp) is locked.
    308   1.1  jdolecek  * the reference is either maintained in the new union_node
    309   1.1  jdolecek  * object which is allocated, or they are vrele'd.
    310   1.1  jdolecek  *
    311   1.1  jdolecek  * all union_nodes are maintained on a singly-linked
    312   1.1  jdolecek  * list.  new nodes are only allocated when they cannot
    313   1.1  jdolecek  * be found on this list.  entries on the list are
    314   1.1  jdolecek  * removed when the vfs reclaim entry is called.
    315   1.1  jdolecek  *
    316   1.1  jdolecek  * a single lock is kept for the entire list.  this is
    317   1.1  jdolecek  * needed because the getnewvnode() function can block
    318   1.1  jdolecek  * waiting for a vnode to become free, in which case there
    319   1.1  jdolecek  * may be more than one process trying to get the same
    320   1.1  jdolecek  * vnode.  this lock is only taken if we are going to
    321   1.1  jdolecek  * call getnewvnode, since the kernel itself is single-threaded.
    322   1.1  jdolecek  *
    323   1.1  jdolecek  * if an entry is found on the list, then call vget() to
    324   1.1  jdolecek  * take a reference.  this is done because there may be
    325   1.1  jdolecek  * zero references to it and so it needs to removed from
    326   1.1  jdolecek  * the vnode free list.
    327   1.1  jdolecek  */
    328   1.1  jdolecek int
    329  1.32      matt union_allocvp(
    330  1.32      matt 	struct vnode **vpp,
    331  1.32      matt 	struct mount *mp,
    332  1.32      matt 	struct vnode *undvp,		/* parent union vnode */
    333  1.32      matt 	struct vnode *dvp,		/* may be null */
    334  1.32      matt 	struct componentname *cnp,	/* may be null */
    335  1.32      matt 	struct vnode *uppervp,		/* may be null */
    336  1.32      matt 	struct vnode *lowervp,		/* may be null */
    337  1.32      matt 	int docache)
    338   1.1  jdolecek {
    339   1.1  jdolecek 	int error;
    340  1.26     pooka 	struct vattr va;
    341  1.38   hannken 	struct union_node *un = NULL, *un1;
    342  1.38   hannken 	struct vnode *vp, *xlowervp = NULLVP;
    343   1.1  jdolecek 	struct union_mount *um = MOUNTTOUNIONMOUNT(mp);
    344  1.26     pooka 	voff_t uppersz, lowersz;
    345   1.1  jdolecek 	int hash = 0;
    346  1.28        ad 	int vflag, iflag;
    347   1.1  jdolecek 	int try;
    348   1.1  jdolecek 
    349   1.1  jdolecek 	if (uppervp == NULLVP && lowervp == NULLVP)
    350   1.1  jdolecek 		panic("union: unidentifiable allocation");
    351   1.1  jdolecek 
    352   1.1  jdolecek 	if (uppervp && lowervp && (uppervp->v_type != lowervp->v_type)) {
    353   1.1  jdolecek 		xlowervp = lowervp;
    354   1.1  jdolecek 		lowervp = NULLVP;
    355   1.1  jdolecek 	}
    356   1.1  jdolecek 
    357   1.1  jdolecek 	/* detect the root vnode (and aliases) */
    358  1.28        ad 	iflag = VI_LAYER;
    359  1.28        ad 	vflag = 0;
    360   1.1  jdolecek 	if ((uppervp == um->um_uppervp) &&
    361   1.1  jdolecek 	    ((lowervp == NULLVP) || lowervp == um->um_lowervp)) {
    362   1.1  jdolecek 		if (lowervp == NULLVP) {
    363   1.1  jdolecek 			lowervp = um->um_lowervp;
    364   1.1  jdolecek 			if (lowervp != NULLVP)
    365  1.35     pooka 				vref(lowervp);
    366   1.1  jdolecek 		}
    367  1.28        ad 		iflag = 0;
    368  1.28        ad 		vflag = VV_ROOT;
    369   1.1  jdolecek 	}
    370   1.1  jdolecek 
    371   1.1  jdolecek loop:
    372   1.1  jdolecek 	if (!docache) {
    373   1.1  jdolecek 		un = 0;
    374   1.1  jdolecek 	} else for (try = 0; try < 3; try++) {
    375   1.1  jdolecek 		switch (try) {
    376   1.1  jdolecek 		case 0:
    377   1.1  jdolecek 			if (lowervp == NULLVP)
    378   1.1  jdolecek 				continue;
    379   1.1  jdolecek 			hash = UNION_HASH(uppervp, lowervp);
    380   1.1  jdolecek 			break;
    381   1.1  jdolecek 
    382   1.1  jdolecek 		case 1:
    383   1.1  jdolecek 			if (uppervp == NULLVP)
    384   1.1  jdolecek 				continue;
    385   1.1  jdolecek 			hash = UNION_HASH(uppervp, NULLVP);
    386   1.1  jdolecek 			break;
    387   1.1  jdolecek 
    388   1.1  jdolecek 		case 2:
    389   1.1  jdolecek 			if (lowervp == NULLVP)
    390   1.1  jdolecek 				continue;
    391   1.1  jdolecek 			hash = UNION_HASH(NULLVP, lowervp);
    392   1.1  jdolecek 			break;
    393   1.1  jdolecek 		}
    394   1.1  jdolecek 
    395   1.1  jdolecek 		while (union_list_lock(hash))
    396   1.1  jdolecek 			continue;
    397   1.1  jdolecek 
    398   1.1  jdolecek 		for (un = unhead[hash].lh_first; un != 0;
    399   1.1  jdolecek 					un = un->un_cache.le_next) {
    400   1.1  jdolecek 			if ((un->un_lowervp == lowervp ||
    401   1.1  jdolecek 			     un->un_lowervp == NULLVP) &&
    402   1.1  jdolecek 			    (un->un_uppervp == uppervp ||
    403   1.1  jdolecek 			     un->un_uppervp == NULLVP) &&
    404   1.1  jdolecek 			    (UNIONTOV(un)->v_mount == mp)) {
    405  1.38   hannken 				vp = UNIONTOV(un);
    406  1.43     rmind 				mutex_enter(vp->v_interlock);
    407  1.39   hannken 				if (vget(vp, 0)) {
    408   1.1  jdolecek 					union_list_unlock(hash);
    409   1.1  jdolecek 					goto loop;
    410   1.1  jdolecek 				}
    411   1.1  jdolecek 				break;
    412   1.1  jdolecek 			}
    413   1.1  jdolecek 		}
    414   1.1  jdolecek 
    415   1.1  jdolecek 		union_list_unlock(hash);
    416   1.1  jdolecek 
    417   1.1  jdolecek 		if (un)
    418   1.1  jdolecek 			break;
    419   1.1  jdolecek 	}
    420   1.1  jdolecek 
    421   1.1  jdolecek 	if (un) {
    422   1.1  jdolecek 		/*
    423   1.1  jdolecek 		 * Obtain a lock on the union_node.
    424   1.1  jdolecek 		 * uppervp is locked, though un->un_uppervp
    425   1.1  jdolecek 		 * may not be.  this doesn't break the locking
    426   1.1  jdolecek 		 * hierarchy since in the case that un->un_uppervp
    427   1.1  jdolecek 		 * is not yet locked it will be vrele'd and replaced
    428   1.1  jdolecek 		 * with uppervp.
    429   1.1  jdolecek 		 */
    430   1.1  jdolecek 
    431   1.1  jdolecek 		if ((dvp != NULLVP) && (uppervp == dvp)) {
    432   1.1  jdolecek 			/*
    433   1.1  jdolecek 			 * Access ``.'', so (un) will already
    434   1.1  jdolecek 			 * be locked.  Since this process has
    435   1.1  jdolecek 			 * the lock on (uppervp) no other
    436   1.1  jdolecek 			 * process can hold the lock on (un).
    437   1.1  jdolecek 			 */
    438   1.1  jdolecek #ifdef DIAGNOSTIC
    439   1.1  jdolecek 			if ((un->un_flags & UN_LOCKED) == 0)
    440   1.1  jdolecek 				panic("union: . not locked");
    441   1.1  jdolecek 			else if (curproc && un->un_pid != curproc->p_pid &&
    442   1.1  jdolecek 				    un->un_pid > -1 && curproc->p_pid > -1)
    443   1.1  jdolecek 				panic("union: allocvp not lock owner");
    444   1.1  jdolecek #endif
    445   1.1  jdolecek 		} else {
    446   1.1  jdolecek 			if (un->un_flags & UN_LOCKED) {
    447   1.1  jdolecek 				vrele(UNIONTOV(un));
    448   1.1  jdolecek 				un->un_flags |= UN_WANTED;
    449   1.1  jdolecek 				(void) tsleep(&un->un_flags, PINOD,
    450   1.1  jdolecek 				    "unionalloc", 0);
    451   1.1  jdolecek 				goto loop;
    452   1.1  jdolecek 			}
    453   1.1  jdolecek 			un->un_flags |= UN_LOCKED;
    454   1.1  jdolecek 
    455   1.1  jdolecek #ifdef DIAGNOSTIC
    456   1.1  jdolecek 			if (curproc)
    457   1.1  jdolecek 				un->un_pid = curproc->p_pid;
    458   1.1  jdolecek 			else
    459   1.1  jdolecek 				un->un_pid = -1;
    460   1.1  jdolecek #endif
    461   1.1  jdolecek 		}
    462   1.1  jdolecek 
    463   1.1  jdolecek 		/*
    464   1.1  jdolecek 		 * At this point, the union_node is locked,
    465   1.1  jdolecek 		 * un->un_uppervp may not be locked, and uppervp
    466   1.1  jdolecek 		 * is locked or nil.
    467   1.1  jdolecek 		 */
    468   1.1  jdolecek 
    469   1.1  jdolecek 		/*
    470   1.1  jdolecek 		 * Save information about the upper layer.
    471   1.1  jdolecek 		 */
    472   1.1  jdolecek 		if (uppervp != un->un_uppervp) {
    473   1.1  jdolecek 			union_newupper(un, uppervp);
    474   1.1  jdolecek 		} else if (uppervp) {
    475   1.1  jdolecek 			vrele(uppervp);
    476   1.1  jdolecek 		}
    477   1.1  jdolecek 
    478   1.1  jdolecek 		if (un->un_uppervp) {
    479   1.1  jdolecek 			un->un_flags |= UN_ULOCK;
    480   1.1  jdolecek 			un->un_flags &= ~UN_KLOCK;
    481   1.1  jdolecek 		}
    482   1.1  jdolecek 
    483   1.1  jdolecek 		/*
    484   1.1  jdolecek 		 * Save information about the lower layer.
    485   1.1  jdolecek 		 * This needs to keep track of pathname
    486   1.1  jdolecek 		 * and directory information which union_vn_create
    487   1.1  jdolecek 		 * might need.
    488   1.1  jdolecek 		 */
    489   1.1  jdolecek 		if (lowervp != un->un_lowervp) {
    490   1.1  jdolecek 			union_newlower(un, lowervp);
    491   1.1  jdolecek 			if (cnp && (lowervp != NULLVP)) {
    492   1.1  jdolecek 				un->un_hash = cnp->cn_hash;
    493   1.1  jdolecek 				un->un_path = malloc(cnp->cn_namelen+1,
    494   1.1  jdolecek 						M_TEMP, M_WAITOK);
    495   1.1  jdolecek 				memcpy(un->un_path, cnp->cn_nameptr,
    496   1.1  jdolecek 						cnp->cn_namelen);
    497   1.1  jdolecek 				un->un_path[cnp->cn_namelen] = '\0';
    498  1.35     pooka 				vref(dvp);
    499   1.1  jdolecek 				un->un_dirvp = dvp;
    500   1.1  jdolecek 			}
    501   1.1  jdolecek 		} else if (lowervp) {
    502   1.1  jdolecek 			vrele(lowervp);
    503   1.1  jdolecek 		}
    504   1.1  jdolecek 		*vpp = UNIONTOV(un);
    505   1.1  jdolecek 		return (0);
    506   1.1  jdolecek 	}
    507   1.1  jdolecek 
    508  1.27     pooka 	uppersz = lowersz = VNOVAL;
    509  1.27     pooka 	if (uppervp != NULLVP)
    510  1.29     pooka 		if (VOP_GETATTR(uppervp, &va, FSCRED) == 0)
    511  1.27     pooka 			uppersz = va.va_size;
    512  1.27     pooka 	if (lowervp != NULLVP)
    513  1.29     pooka 		if (VOP_GETATTR(lowervp, &va, FSCRED) == 0)
    514  1.27     pooka 			lowersz = va.va_size;
    515  1.38   hannken 	hash = UNION_HASH(uppervp, lowervp);
    516   1.1  jdolecek 
    517  1.43     rmind 	/*
    518  1.43     rmind 	 * Get a new vnode and share the lock with upper layer vnode,
    519  1.43     rmind 	 * unless layers are inverted.
    520  1.43     rmind 	 */
    521  1.43     rmind 	vnode_t *svp = (uppervp != NULLVP) ? uppervp : lowervp;
    522  1.43     rmind 	error = getnewvnode(VT_UNION, mp, union_vnodeop_p,
    523  1.43     rmind 	    svp->v_interlock, vpp);
    524   1.1  jdolecek 	if (error) {
    525   1.1  jdolecek 		if (uppervp) {
    526   1.1  jdolecek 			if (dvp == uppervp)
    527   1.1  jdolecek 				vrele(uppervp);
    528   1.1  jdolecek 			else
    529   1.1  jdolecek 				vput(uppervp);
    530   1.1  jdolecek 		}
    531   1.1  jdolecek 		if (lowervp)
    532   1.1  jdolecek 			vrele(lowervp);
    533   1.1  jdolecek 
    534   1.1  jdolecek 		goto out;
    535   1.1  jdolecek 	}
    536   1.1  jdolecek 
    537  1.38   hannken 	if (docache) {
    538  1.38   hannken 		while (union_list_lock(hash))
    539  1.38   hannken 			continue;
    540  1.38   hannken 		LIST_FOREACH(un1, &unhead[hash], un_cache) {
    541  1.38   hannken 			if (un1->un_lowervp == lowervp &&
    542  1.38   hannken 			    un1->un_uppervp == uppervp &&
    543  1.38   hannken 			    UNIONTOV(un1)->v_mount == mp) {
    544  1.38   hannken 				/*
    545  1.38   hannken 				 * Another thread beat us, push back freshly
    546  1.38   hannken 				 * allocated vnode and retry.
    547  1.38   hannken 				 */
    548  1.38   hannken 				union_list_unlock(hash);
    549  1.38   hannken 				ungetnewvnode(*vpp);
    550  1.38   hannken 				goto loop;
    551  1.38   hannken 			}
    552  1.38   hannken 		}
    553  1.38   hannken 	}
    554  1.38   hannken 
    555  1.34    cegger 	(*vpp)->v_data = malloc(sizeof(struct union_node), M_TEMP, M_WAITOK);
    556   1.1  jdolecek 
    557  1.28        ad 	(*vpp)->v_vflag |= vflag;
    558  1.28        ad 	(*vpp)->v_iflag |= iflag;
    559   1.1  jdolecek 	if (uppervp)
    560   1.1  jdolecek 		(*vpp)->v_type = uppervp->v_type;
    561   1.1  jdolecek 	else
    562   1.1  jdolecek 		(*vpp)->v_type = lowervp->v_type;
    563   1.1  jdolecek 	un = VTOUNION(*vpp);
    564   1.1  jdolecek 	un->un_vnode = *vpp;
    565   1.1  jdolecek 	un->un_uppervp = uppervp;
    566   1.1  jdolecek 	un->un_lowervp = lowervp;
    567   1.1  jdolecek 	un->un_pvp = undvp;
    568   1.1  jdolecek 	if (undvp != NULLVP)
    569  1.35     pooka 		vref(undvp);
    570   1.1  jdolecek 	un->un_dircache = 0;
    571   1.1  jdolecek 	un->un_openl = 0;
    572   1.1  jdolecek 	un->un_flags = UN_LOCKED;
    573  1.26     pooka 
    574  1.26     pooka 	un->un_uppersz = VNOVAL;
    575  1.26     pooka 	un->un_lowersz = VNOVAL;
    576  1.26     pooka 	union_newsize(*vpp, uppersz, lowersz);
    577  1.26     pooka 
    578   1.1  jdolecek 	if (un->un_uppervp)
    579   1.1  jdolecek 		un->un_flags |= UN_ULOCK;
    580   1.1  jdolecek #ifdef DIAGNOSTIC
    581   1.1  jdolecek 	if (curproc)
    582   1.1  jdolecek 		un->un_pid = curproc->p_pid;
    583   1.1  jdolecek 	else
    584   1.1  jdolecek 		un->un_pid = -1;
    585   1.1  jdolecek #endif
    586  1.17  christos 	if (dvp && cnp && (lowervp != NULLVP)) {
    587   1.1  jdolecek 		un->un_hash = cnp->cn_hash;
    588   1.1  jdolecek 		un->un_path = malloc(cnp->cn_namelen+1, M_TEMP, M_WAITOK);
    589   1.1  jdolecek 		memcpy(un->un_path, cnp->cn_nameptr, cnp->cn_namelen);
    590   1.1  jdolecek 		un->un_path[cnp->cn_namelen] = '\0';
    591  1.35     pooka 		vref(dvp);
    592   1.1  jdolecek 		un->un_dirvp = dvp;
    593   1.1  jdolecek 	} else {
    594   1.1  jdolecek 		un->un_hash = 0;
    595   1.1  jdolecek 		un->un_path = 0;
    596   1.1  jdolecek 		un->un_dirvp = 0;
    597   1.1  jdolecek 	}
    598   1.1  jdolecek 
    599   1.1  jdolecek 	if (docache) {
    600   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[hash], un, un_cache);
    601   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    602   1.1  jdolecek 	}
    603   1.1  jdolecek 
    604   1.1  jdolecek 	if (xlowervp)
    605   1.1  jdolecek 		vrele(xlowervp);
    606   1.1  jdolecek 
    607   1.1  jdolecek out:
    608   1.1  jdolecek 	if (docache)
    609   1.1  jdolecek 		union_list_unlock(hash);
    610   1.1  jdolecek 
    611   1.1  jdolecek 	return (error);
    612   1.1  jdolecek }
    613   1.1  jdolecek 
    614   1.1  jdolecek int
    615  1.32      matt union_freevp(struct vnode *vp)
    616   1.1  jdolecek {
    617  1.38   hannken 	int hash;
    618   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
    619   1.1  jdolecek 
    620  1.38   hannken 	hash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    621  1.38   hannken 
    622  1.38   hannken 	while (union_list_lock(hash))
    623  1.38   hannken 		continue;
    624   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
    625   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
    626   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
    627   1.1  jdolecek 	}
    628  1.38   hannken 	union_list_unlock(hash);
    629   1.1  jdolecek 
    630   1.1  jdolecek 	if (un->un_pvp != NULLVP)
    631   1.1  jdolecek 		vrele(un->un_pvp);
    632   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
    633   1.1  jdolecek 		vrele(un->un_uppervp);
    634   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
    635   1.1  jdolecek 		vrele(un->un_lowervp);
    636   1.1  jdolecek 	if (un->un_dirvp != NULLVP)
    637   1.1  jdolecek 		vrele(un->un_dirvp);
    638   1.1  jdolecek 	if (un->un_path)
    639   1.1  jdolecek 		free(un->un_path, M_TEMP);
    640   1.1  jdolecek 
    641  1.34    cegger 	free(vp->v_data, M_TEMP);
    642  1.34    cegger 	vp->v_data = NULL;
    643   1.1  jdolecek 
    644   1.1  jdolecek 	return (0);
    645   1.1  jdolecek }
    646   1.1  jdolecek 
    647   1.1  jdolecek /*
    648   1.1  jdolecek  * copyfile.  copy the vnode (fvp) to the vnode (tvp)
    649   1.1  jdolecek  * using a sequence of reads and writes.  both (fvp)
    650   1.1  jdolecek  * and (tvp) are locked on entry and exit.
    651   1.1  jdolecek  */
    652   1.1  jdolecek int
    653  1.32      matt union_copyfile(struct vnode *fvp, struct vnode *tvp, kauth_cred_t cred,
    654  1.32      matt 	struct lwp *l)
    655   1.1  jdolecek {
    656  1.13  christos 	char *tbuf;
    657   1.1  jdolecek 	struct uio uio;
    658   1.1  jdolecek 	struct iovec iov;
    659   1.1  jdolecek 	int error = 0;
    660   1.1  jdolecek 
    661   1.1  jdolecek 	/*
    662   1.1  jdolecek 	 * strategy:
    663   1.1  jdolecek 	 * allocate a buffer of size MAXBSIZE.
    664   1.1  jdolecek 	 * loop doing reads and writes, keeping track
    665   1.1  jdolecek 	 * of the current uio offset.
    666   1.1  jdolecek 	 * give up at the first sign of trouble.
    667   1.1  jdolecek 	 */
    668   1.1  jdolecek 
    669   1.1  jdolecek 	uio.uio_offset = 0;
    670  1.16      yamt 	UIO_SETUP_SYSSPACE(&uio);
    671   1.1  jdolecek 
    672  1.37   hannken 	VOP_UNLOCK(fvp);			/* XXX */
    673   1.1  jdolecek 	vn_lock(fvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    674  1.37   hannken 	VOP_UNLOCK(tvp);			/* XXX */
    675   1.1  jdolecek 	vn_lock(tvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    676   1.1  jdolecek 
    677  1.13  christos 	tbuf = malloc(MAXBSIZE, M_TEMP, M_WAITOK);
    678   1.1  jdolecek 
    679   1.1  jdolecek 	/* ugly loop follows... */
    680   1.1  jdolecek 	do {
    681   1.1  jdolecek 		off_t offset = uio.uio_offset;
    682   1.1  jdolecek 
    683   1.1  jdolecek 		uio.uio_iov = &iov;
    684   1.1  jdolecek 		uio.uio_iovcnt = 1;
    685  1.13  christos 		iov.iov_base = tbuf;
    686   1.1  jdolecek 		iov.iov_len = MAXBSIZE;
    687   1.1  jdolecek 		uio.uio_resid = iov.iov_len;
    688   1.1  jdolecek 		uio.uio_rw = UIO_READ;
    689   1.1  jdolecek 		error = VOP_READ(fvp, &uio, 0, cred);
    690   1.1  jdolecek 
    691   1.1  jdolecek 		if (error == 0) {
    692   1.1  jdolecek 			uio.uio_iov = &iov;
    693   1.1  jdolecek 			uio.uio_iovcnt = 1;
    694  1.13  christos 			iov.iov_base = tbuf;
    695   1.1  jdolecek 			iov.iov_len = MAXBSIZE - uio.uio_resid;
    696   1.1  jdolecek 			uio.uio_offset = offset;
    697   1.1  jdolecek 			uio.uio_rw = UIO_WRITE;
    698   1.1  jdolecek 			uio.uio_resid = iov.iov_len;
    699   1.1  jdolecek 
    700   1.1  jdolecek 			if (uio.uio_resid == 0)
    701   1.1  jdolecek 				break;
    702   1.1  jdolecek 
    703   1.1  jdolecek 			do {
    704   1.1  jdolecek 				error = VOP_WRITE(tvp, &uio, 0, cred);
    705   1.1  jdolecek 			} while ((uio.uio_resid > 0) && (error == 0));
    706   1.1  jdolecek 		}
    707   1.1  jdolecek 
    708   1.1  jdolecek 	} while (error == 0);
    709   1.1  jdolecek 
    710  1.13  christos 	free(tbuf, M_TEMP);
    711   1.1  jdolecek 	return (error);
    712   1.1  jdolecek }
    713   1.1  jdolecek 
    714   1.1  jdolecek /*
    715   1.1  jdolecek  * (un) is assumed to be locked on entry and remains
    716   1.1  jdolecek  * locked on exit.
    717   1.1  jdolecek  */
    718   1.1  jdolecek int
    719  1.32      matt union_copyup(struct union_node *un, int docopy, kauth_cred_t cred,
    720  1.32      matt 	struct lwp *l)
    721   1.1  jdolecek {
    722   1.1  jdolecek 	int error;
    723   1.1  jdolecek 	struct vnode *lvp, *uvp;
    724   1.1  jdolecek 	struct vattr lvattr, uvattr;
    725   1.1  jdolecek 
    726  1.15  christos 	error = union_vn_create(&uvp, un, l);
    727  1.25   hannken 	if (error)
    728   1.1  jdolecek 		return (error);
    729   1.1  jdolecek 
    730   1.1  jdolecek 	/* at this point, uppervp is locked */
    731   1.1  jdolecek 	union_newupper(un, uvp);
    732   1.1  jdolecek 	un->un_flags |= UN_ULOCK;
    733   1.1  jdolecek 
    734   1.1  jdolecek 	lvp = un->un_lowervp;
    735   1.1  jdolecek 
    736   1.1  jdolecek 	if (docopy) {
    737   1.1  jdolecek 		/*
    738   1.1  jdolecek 		 * XX - should not ignore errors
    739   1.1  jdolecek 		 * from VOP_CLOSE
    740   1.1  jdolecek 		 */
    741   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    742   1.1  jdolecek 
    743  1.29     pooka         	error = VOP_GETATTR(lvp, &lvattr, cred);
    744   1.1  jdolecek 		if (error == 0)
    745  1.29     pooka 			error = VOP_OPEN(lvp, FREAD, cred);
    746   1.1  jdolecek 		if (error == 0) {
    747  1.15  christos 			error = union_copyfile(lvp, uvp, cred, l);
    748  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    749   1.1  jdolecek 		}
    750   1.1  jdolecek 		if (error == 0) {
    751   1.1  jdolecek 			/* Copy permissions up too */
    752  1.35     pooka 			vattr_null(&uvattr);
    753   1.1  jdolecek 			uvattr.va_mode = lvattr.va_mode;
    754   1.1  jdolecek 			uvattr.va_flags = lvattr.va_flags;
    755  1.29     pooka         		error = VOP_SETATTR(uvp, &uvattr, cred);
    756   1.1  jdolecek 		}
    757  1.37   hannken 		VOP_UNLOCK(lvp);
    758   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    759   1.1  jdolecek 		if (error == 0)
    760   1.1  jdolecek 			uprintf("union: copied up %s\n", un->un_path);
    761   1.1  jdolecek #endif
    762   1.1  jdolecek 
    763   1.1  jdolecek 	}
    764  1.15  christos 	union_vn_close(uvp, FWRITE, cred, l);
    765   1.1  jdolecek 
    766   1.1  jdolecek 	/*
    767   1.1  jdolecek 	 * Subsequent IOs will go to the top layer, so
    768   1.1  jdolecek 	 * call close on the lower vnode and open on the
    769   1.1  jdolecek 	 * upper vnode to ensure that the filesystem keeps
    770   1.1  jdolecek 	 * its references counts right.  This doesn't do
    771   1.1  jdolecek 	 * the right thing with (cred) and (FREAD) though.
    772   1.1  jdolecek 	 * Ignoring error returns is not right, either.
    773   1.1  jdolecek 	 */
    774   1.1  jdolecek 	if (error == 0) {
    775   1.1  jdolecek 		int i;
    776   1.1  jdolecek 
    777   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    778   1.1  jdolecek 		for (i = 0; i < un->un_openl; i++) {
    779  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    780  1.29     pooka 			(void) VOP_OPEN(uvp, FREAD, cred);
    781   1.1  jdolecek 		}
    782   1.1  jdolecek 		un->un_openl = 0;
    783  1.37   hannken 		VOP_UNLOCK(lvp);
    784   1.1  jdolecek 	}
    785   1.1  jdolecek 
    786   1.1  jdolecek 	return (error);
    787   1.1  jdolecek 
    788   1.1  jdolecek }
    789   1.1  jdolecek 
    790   1.1  jdolecek static int
    791  1.32      matt union_relookup(
    792  1.32      matt 	struct union_mount *um,
    793  1.32      matt 	struct vnode *dvp,
    794  1.32      matt 	struct vnode **vpp,
    795  1.32      matt 	struct componentname *cnp,
    796  1.32      matt 	struct componentname *cn,
    797  1.40  dholland 	char **pnbuf_ret,
    798  1.32      matt 	const char *path,
    799  1.32      matt 	int pathlen)
    800   1.1  jdolecek {
    801   1.1  jdolecek 	int error;
    802  1.40  dholland 	char *pnbuf;
    803   1.1  jdolecek 
    804   1.1  jdolecek 	/*
    805   1.1  jdolecek 	 * A new componentname structure must be faked up because
    806   1.1  jdolecek 	 * there is no way to know where the upper level cnp came
    807   1.1  jdolecek 	 * from or what it is being used for.  This must duplicate
    808   1.1  jdolecek 	 * some of the work done by NDINIT, some of the work done
    809   1.1  jdolecek 	 * by namei, some of the work done by lookup and some of
    810   1.1  jdolecek 	 * the work done by VOP_LOOKUP when given a CREATE flag.
    811   1.1  jdolecek 	 * Conclusion: Horrible.
    812   1.1  jdolecek 	 */
    813   1.1  jdolecek 	cn->cn_namelen = pathlen;
    814   1.1  jdolecek 	if ((cn->cn_namelen + 1) > MAXPATHLEN)
    815   1.1  jdolecek 		return (ENAMETOOLONG);
    816  1.40  dholland 	pnbuf = PNBUF_GET();
    817  1.40  dholland 	memcpy(pnbuf, path, cn->cn_namelen);
    818  1.40  dholland 	pnbuf[cn->cn_namelen] = '\0';
    819  1.40  dholland 	*pnbuf_ret = pnbuf;
    820   1.1  jdolecek 
    821   1.1  jdolecek 	cn->cn_nameiop = CREATE;
    822  1.41  dholland 	cn->cn_flags = (LOCKPARENT|ISLASTCN);
    823   1.1  jdolecek 	if (um->um_op == UNMNT_ABOVE)
    824   1.1  jdolecek 		cn->cn_cred = cnp->cn_cred;
    825   1.1  jdolecek 	else
    826   1.1  jdolecek 		cn->cn_cred = um->um_cred;
    827  1.40  dholland 	cn->cn_nameptr = pnbuf;
    828   1.1  jdolecek 	cn->cn_hash = cnp->cn_hash;
    829   1.1  jdolecek 	cn->cn_consume = cnp->cn_consume;
    830   1.1  jdolecek 
    831  1.42  dholland 	error = relookup(dvp, vpp, cn, 0);
    832  1.22       chs 	if (error) {
    833  1.40  dholland 		PNBUF_PUT(pnbuf);
    834  1.40  dholland 		*pnbuf_ret = NULL;
    835   1.1  jdolecek 	}
    836   1.1  jdolecek 
    837   1.1  jdolecek 	return (error);
    838   1.1  jdolecek }
    839   1.1  jdolecek 
    840   1.1  jdolecek /*
    841   1.1  jdolecek  * Create a shadow directory in the upper layer.
    842   1.1  jdolecek  * The new vnode is returned locked.
    843   1.1  jdolecek  *
    844   1.1  jdolecek  * (um) points to the union mount structure for access to the
    845   1.1  jdolecek  * the mounting process's credentials.
    846   1.1  jdolecek  * (dvp) is the directory in which to create the shadow directory.
    847   1.1  jdolecek  * it is unlocked on entry and exit.
    848   1.1  jdolecek  * (cnp) is the componentname to be created.
    849   1.1  jdolecek  * (vpp) is the returned newly created shadow directory, which
    850   1.1  jdolecek  * is returned locked.
    851   1.1  jdolecek  *
    852   1.1  jdolecek  * N.B. We still attempt to create shadow directories even if the union
    853   1.1  jdolecek  * is mounted read-only, which is a little nonintuitive.
    854   1.1  jdolecek  */
    855   1.1  jdolecek int
    856  1.32      matt union_mkshadow(struct union_mount *um, struct vnode *dvp,
    857  1.32      matt 	struct componentname *cnp, struct vnode **vpp)
    858   1.1  jdolecek {
    859   1.1  jdolecek 	int error;
    860   1.1  jdolecek 	struct vattr va;
    861   1.1  jdolecek 	struct componentname cn;
    862  1.40  dholland 	char *pnbuf;
    863   1.1  jdolecek 
    864  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    865  1.40  dholland 	error = union_relookup(um, dvp, vpp, cnp, &cn, &pnbuf,
    866   1.1  jdolecek 			cnp->cn_nameptr, cnp->cn_namelen);
    867   1.8   hannken 	if (error) {
    868  1.37   hannken 		VOP_UNLOCK(dvp);
    869   1.1  jdolecek 		return (error);
    870   1.8   hannken 	}
    871   1.1  jdolecek 
    872   1.1  jdolecek 	if (*vpp) {
    873   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    874  1.40  dholland 		PNBUF_PUT(pnbuf);
    875  1.24       chs 		if (dvp != *vpp)
    876  1.37   hannken 			VOP_UNLOCK(dvp);
    877  1.22       chs 		vput(*vpp);
    878   1.1  jdolecek 		*vpp = NULLVP;
    879   1.1  jdolecek 		return (EEXIST);
    880   1.1  jdolecek 	}
    881   1.1  jdolecek 
    882   1.1  jdolecek 	/*
    883   1.1  jdolecek 	 * policy: when creating the shadow directory in the
    884   1.1  jdolecek 	 * upper layer, create it owned by the user who did
    885   1.1  jdolecek 	 * the mount, group from parent directory, and mode
    886   1.1  jdolecek 	 * 777 modified by umask (ie mostly identical to the
    887   1.1  jdolecek 	 * mkdir syscall).  (jsp, kb)
    888   1.1  jdolecek 	 */
    889   1.1  jdolecek 
    890  1.35     pooka 	vattr_null(&va);
    891   1.1  jdolecek 	va.va_type = VDIR;
    892   1.1  jdolecek 	va.va_mode = um->um_cmode;
    893   1.1  jdolecek 
    894  1.24       chs 	vref(dvp);
    895   1.1  jdolecek 	error = VOP_MKDIR(dvp, vpp, &cn, &va);
    896  1.40  dholland 	PNBUF_PUT(pnbuf);
    897   1.1  jdolecek 	return (error);
    898   1.1  jdolecek }
    899   1.1  jdolecek 
    900   1.1  jdolecek /*
    901   1.1  jdolecek  * Create a whiteout entry in the upper layer.
    902   1.1  jdolecek  *
    903   1.1  jdolecek  * (um) points to the union mount structure for access to the
    904   1.1  jdolecek  * the mounting process's credentials.
    905   1.1  jdolecek  * (dvp) is the directory in which to create the whiteout.
    906   1.1  jdolecek  * it is locked on entry and exit.
    907   1.1  jdolecek  * (cnp) is the componentname to be created.
    908   1.1  jdolecek  */
    909   1.1  jdolecek int
    910  1.32      matt union_mkwhiteout(struct union_mount *um, struct vnode *dvp,
    911  1.32      matt 	struct componentname *cnp, char *path)
    912   1.1  jdolecek {
    913   1.1  jdolecek 	int error;
    914   1.1  jdolecek 	struct vnode *wvp;
    915   1.1  jdolecek 	struct componentname cn;
    916  1.40  dholland 	char *pnbuf;
    917   1.1  jdolecek 
    918  1.37   hannken 	VOP_UNLOCK(dvp);
    919  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    920  1.40  dholland 	error = union_relookup(um, dvp, &wvp, cnp, &cn, &pnbuf,
    921  1.40  dholland 			       path, strlen(path));
    922  1.25   hannken 	if (error)
    923   1.1  jdolecek 		return (error);
    924   1.1  jdolecek 
    925   1.1  jdolecek 	if (wvp) {
    926   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    927  1.40  dholland 		PNBUF_PUT(pnbuf);
    928  1.24       chs 		if (dvp != wvp)
    929  1.37   hannken 			VOP_UNLOCK(dvp);
    930  1.22       chs 		vput(wvp);
    931   1.1  jdolecek 		return (EEXIST);
    932   1.1  jdolecek 	}
    933   1.1  jdolecek 
    934   1.1  jdolecek 	error = VOP_WHITEOUT(dvp, &cn, CREATE);
    935  1.40  dholland 	if (error) {
    936   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    937  1.40  dholland 	}
    938   1.1  jdolecek 
    939  1.40  dholland 	PNBUF_PUT(pnbuf);
    940   1.1  jdolecek 	return (error);
    941   1.1  jdolecek }
    942   1.1  jdolecek 
    943   1.1  jdolecek /*
    944   1.1  jdolecek  * union_vn_create: creates and opens a new shadow file
    945   1.1  jdolecek  * on the upper union layer.  this function is similar
    946   1.1  jdolecek  * in spirit to calling vn_open but it avoids calling namei().
    947   1.1  jdolecek  * the problem with calling namei is that a) it locks too many
    948   1.1  jdolecek  * things, and b) it doesn't start at the "right" directory,
    949   1.1  jdolecek  * whereas relookup is told where to start.
    950   1.1  jdolecek  */
    951   1.1  jdolecek int
    952  1.32      matt union_vn_create(struct vnode **vpp, struct union_node *un, struct lwp *l)
    953   1.1  jdolecek {
    954   1.1  jdolecek 	struct vnode *vp;
    955  1.19        ad 	kauth_cred_t cred = l->l_cred;
    956   1.1  jdolecek 	struct vattr vat;
    957   1.1  jdolecek 	struct vattr *vap = &vat;
    958   1.1  jdolecek 	int fmode = FFLAGS(O_WRONLY|O_CREAT|O_TRUNC|O_EXCL);
    959   1.1  jdolecek 	int error;
    960  1.15  christos 	int cmode = UN_FILEMODE & ~l->l_proc->p_cwdi->cwdi_cmask;
    961   1.1  jdolecek 	struct componentname cn;
    962  1.40  dholland 	char *pnbuf;
    963   1.1  jdolecek 
    964   1.1  jdolecek 	*vpp = NULLVP;
    965   1.1  jdolecek 
    966   1.1  jdolecek 	/*
    967   1.1  jdolecek 	 * Build a new componentname structure (for the same
    968   1.1  jdolecek 	 * reasons outlines in union_mkshadow).
    969   1.1  jdolecek 	 * The difference here is that the file is owned by
    970   1.1  jdolecek 	 * the current user, rather than by the person who
    971   1.1  jdolecek 	 * did the mount, since the current user needs to be
    972   1.1  jdolecek 	 * able to write the file (that's why it is being
    973   1.1  jdolecek 	 * copied in the first place).
    974   1.1  jdolecek 	 */
    975   1.1  jdolecek 	cn.cn_namelen = strlen(un->un_path);
    976   1.1  jdolecek 	if ((cn.cn_namelen + 1) > MAXPATHLEN)
    977   1.1  jdolecek 		return (ENAMETOOLONG);
    978  1.40  dholland 	pnbuf = PNBUF_GET();
    979  1.40  dholland 	memcpy(pnbuf, un->un_path, cn.cn_namelen+1);
    980   1.1  jdolecek 	cn.cn_nameiop = CREATE;
    981  1.41  dholland 	cn.cn_flags = (LOCKPARENT|ISLASTCN);
    982  1.19        ad 	cn.cn_cred = l->l_cred;
    983  1.40  dholland 	cn.cn_nameptr = pnbuf;
    984   1.1  jdolecek 	cn.cn_hash = un->un_hash;
    985   1.1  jdolecek 	cn.cn_consume = 0;
    986   1.1  jdolecek 
    987  1.24       chs 	vn_lock(un->un_dirvp, LK_EXCLUSIVE | LK_RETRY);
    988  1.42  dholland 	error = relookup(un->un_dirvp, &vp, &cn, 0);
    989  1.22       chs 	if (error) {
    990  1.40  dholland 		PNBUF_PUT(pnbuf);
    991  1.37   hannken 		VOP_UNLOCK(un->un_dirvp);
    992   1.1  jdolecek 		return (error);
    993  1.22       chs 	}
    994   1.1  jdolecek 
    995   1.1  jdolecek 	if (vp) {
    996   1.1  jdolecek 		VOP_ABORTOP(un->un_dirvp, &cn);
    997  1.40  dholland 		PNBUF_PUT(pnbuf);
    998  1.24       chs 		if (un->un_dirvp != vp)
    999  1.37   hannken 			VOP_UNLOCK(un->un_dirvp);
   1000  1.22       chs 		vput(vp);
   1001   1.1  jdolecek 		return (EEXIST);
   1002   1.1  jdolecek 	}
   1003   1.1  jdolecek 
   1004   1.1  jdolecek 	/*
   1005   1.1  jdolecek 	 * Good - there was no race to create the file
   1006   1.1  jdolecek 	 * so go ahead and create it.  The permissions
   1007   1.1  jdolecek 	 * on the file will be 0666 modified by the
   1008   1.1  jdolecek 	 * current user's umask.  Access to the file, while
   1009   1.1  jdolecek 	 * it is unioned, will require access to the top *and*
   1010   1.1  jdolecek 	 * bottom files.  Access when not unioned will simply
   1011   1.1  jdolecek 	 * require access to the top-level file.
   1012   1.1  jdolecek 	 * TODO: confirm choice of access permissions.
   1013   1.1  jdolecek 	 */
   1014  1.35     pooka 	vattr_null(vap);
   1015   1.1  jdolecek 	vap->va_type = VREG;
   1016   1.1  jdolecek 	vap->va_mode = cmode;
   1017  1.24       chs 	vref(un->un_dirvp);
   1018  1.40  dholland 	if ((error = VOP_CREATE(un->un_dirvp, &vp, &cn, vap)) != 0) {
   1019  1.40  dholland 		PNBUF_PUT(pnbuf);
   1020   1.1  jdolecek 		return (error);
   1021  1.40  dholland 	}
   1022   1.1  jdolecek 
   1023  1.29     pooka 	if ((error = VOP_OPEN(vp, fmode, cred)) != 0) {
   1024   1.1  jdolecek 		vput(vp);
   1025  1.40  dholland 		PNBUF_PUT(pnbuf);
   1026   1.1  jdolecek 		return (error);
   1027   1.1  jdolecek 	}
   1028   1.1  jdolecek 
   1029   1.1  jdolecek 	vp->v_writecount++;
   1030   1.1  jdolecek 	*vpp = vp;
   1031  1.40  dholland 	PNBUF_PUT(pnbuf);
   1032   1.1  jdolecek 	return (0);
   1033   1.1  jdolecek }
   1034   1.1  jdolecek 
   1035   1.1  jdolecek int
   1036  1.32      matt union_vn_close(struct vnode *vp, int fmode, kauth_cred_t cred, struct lwp *l)
   1037   1.1  jdolecek {
   1038   1.1  jdolecek 
   1039   1.1  jdolecek 	if (fmode & FWRITE)
   1040   1.1  jdolecek 		--vp->v_writecount;
   1041  1.29     pooka 	return (VOP_CLOSE(vp, fmode, cred));
   1042   1.1  jdolecek }
   1043   1.1  jdolecek 
   1044   1.1  jdolecek void
   1045  1.32      matt union_removed_upper(struct union_node *un)
   1046   1.1  jdolecek {
   1047  1.38   hannken 	int hash;
   1048  1.38   hannken 
   1049   1.1  jdolecek #if 1
   1050   1.1  jdolecek 	/*
   1051   1.1  jdolecek 	 * We do not set the uppervp to NULLVP here, because lowervp
   1052   1.1  jdolecek 	 * may also be NULLVP, so this routine would end up creating
   1053   1.1  jdolecek 	 * a bogus union node with no upper or lower VP (that causes
   1054   1.1  jdolecek 	 * pain in many places that assume at least one VP exists).
   1055   1.1  jdolecek 	 * Since we've removed this node from the cache hash chains,
   1056   1.1  jdolecek 	 * it won't be found again.  When all current holders
   1057   1.1  jdolecek 	 * release it, union_inactive() will vgone() it.
   1058   1.1  jdolecek 	 */
   1059   1.1  jdolecek 	union_diruncache(un);
   1060   1.1  jdolecek #else
   1061   1.1  jdolecek 	union_newupper(un, NULLVP);
   1062   1.1  jdolecek #endif
   1063   1.1  jdolecek 
   1064  1.38   hannken 	hash = UNION_HASH(un->un_uppervp, un->un_lowervp);
   1065  1.38   hannken 
   1066  1.38   hannken 	while (union_list_lock(hash))
   1067  1.38   hannken 		continue;
   1068   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
   1069   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
   1070   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
   1071   1.1  jdolecek 	}
   1072  1.38   hannken 	union_list_unlock(hash);
   1073   1.1  jdolecek 
   1074   1.1  jdolecek 	if (un->un_flags & UN_ULOCK) {
   1075   1.1  jdolecek 		un->un_flags &= ~UN_ULOCK;
   1076  1.37   hannken 		VOP_UNLOCK(un->un_uppervp);
   1077   1.1  jdolecek 	}
   1078   1.1  jdolecek }
   1079   1.1  jdolecek 
   1080   1.1  jdolecek #if 0
   1081   1.1  jdolecek struct vnode *
   1082  1.32      matt union_lowervp(struct vnode *vp)
   1083   1.1  jdolecek {
   1084   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
   1085   1.1  jdolecek 
   1086   1.1  jdolecek 	if ((un->un_lowervp != NULLVP) &&
   1087   1.1  jdolecek 	    (vp->v_type == un->un_lowervp->v_type)) {
   1088   1.1  jdolecek 		if (vget(un->un_lowervp, 0) == 0)
   1089   1.1  jdolecek 			return (un->un_lowervp);
   1090   1.1  jdolecek 	}
   1091   1.1  jdolecek 
   1092   1.1  jdolecek 	return (NULLVP);
   1093   1.1  jdolecek }
   1094   1.1  jdolecek #endif
   1095   1.1  jdolecek 
   1096   1.1  jdolecek /*
   1097   1.1  jdolecek  * determine whether a whiteout is needed
   1098   1.1  jdolecek  * during a remove/rmdir operation.
   1099   1.1  jdolecek  */
   1100   1.1  jdolecek int
   1101  1.32      matt union_dowhiteout(struct union_node *un, kauth_cred_t cred)
   1102   1.1  jdolecek {
   1103   1.1  jdolecek 	struct vattr va;
   1104   1.1  jdolecek 
   1105   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1106   1.1  jdolecek 		return (1);
   1107   1.1  jdolecek 
   1108  1.29     pooka 	if (VOP_GETATTR(un->un_uppervp, &va, cred) == 0 &&
   1109   1.1  jdolecek 	    (va.va_flags & OPAQUE))
   1110   1.1  jdolecek 		return (1);
   1111   1.1  jdolecek 
   1112   1.1  jdolecek 	return (0);
   1113   1.1  jdolecek }
   1114   1.1  jdolecek 
   1115   1.1  jdolecek static void
   1116  1.32      matt union_dircache_r(struct vnode *vp, struct vnode ***vppp, int *cntp)
   1117   1.1  jdolecek {
   1118   1.1  jdolecek 	struct union_node *un;
   1119   1.1  jdolecek 
   1120   1.1  jdolecek 	if (vp->v_op != union_vnodeop_p) {
   1121   1.1  jdolecek 		if (vppp) {
   1122  1.35     pooka 			vref(vp);
   1123   1.1  jdolecek 			*(*vppp)++ = vp;
   1124   1.1  jdolecek 			if (--(*cntp) == 0)
   1125   1.1  jdolecek 				panic("union: dircache table too small");
   1126   1.1  jdolecek 		} else {
   1127   1.1  jdolecek 			(*cntp)++;
   1128   1.1  jdolecek 		}
   1129   1.1  jdolecek 
   1130   1.1  jdolecek 		return;
   1131   1.1  jdolecek 	}
   1132   1.1  jdolecek 
   1133   1.1  jdolecek 	un = VTOUNION(vp);
   1134   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
   1135   1.1  jdolecek 		union_dircache_r(un->un_uppervp, vppp, cntp);
   1136   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1137   1.1  jdolecek 		union_dircache_r(un->un_lowervp, vppp, cntp);
   1138   1.1  jdolecek }
   1139   1.1  jdolecek 
   1140   1.1  jdolecek struct vnode *
   1141  1.21  christos union_dircache(struct vnode *vp, struct lwp *l)
   1142   1.1  jdolecek {
   1143   1.1  jdolecek 	int cnt;
   1144   1.1  jdolecek 	struct vnode *nvp = NULLVP;
   1145   1.1  jdolecek 	struct vnode **vpp;
   1146   1.1  jdolecek 	struct vnode **dircache;
   1147   1.1  jdolecek 	int error;
   1148   1.1  jdolecek 
   1149   1.1  jdolecek 	vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
   1150   1.1  jdolecek 	dircache = VTOUNION(vp)->un_dircache;
   1151   1.1  jdolecek 
   1152   1.1  jdolecek 	nvp = NULLVP;
   1153   1.1  jdolecek 
   1154   1.1  jdolecek 	if (dircache == 0) {
   1155   1.1  jdolecek 		cnt = 0;
   1156   1.1  jdolecek 		union_dircache_r(vp, 0, &cnt);
   1157   1.1  jdolecek 		cnt++;
   1158   1.1  jdolecek 		dircache = (struct vnode **)
   1159   1.1  jdolecek 				malloc(cnt * sizeof(struct vnode *),
   1160   1.1  jdolecek 					M_TEMP, M_WAITOK);
   1161   1.1  jdolecek 		vpp = dircache;
   1162   1.1  jdolecek 		union_dircache_r(vp, &vpp, &cnt);
   1163   1.1  jdolecek 		VTOUNION(vp)->un_dircache = dircache;
   1164   1.1  jdolecek 		*vpp = NULLVP;
   1165   1.1  jdolecek 		vpp = dircache + 1;
   1166   1.1  jdolecek 	} else {
   1167   1.1  jdolecek 		vpp = dircache;
   1168   1.1  jdolecek 		do {
   1169   1.1  jdolecek 			if (*vpp++ == VTOUNION(vp)->un_uppervp)
   1170   1.1  jdolecek 				break;
   1171   1.1  jdolecek 		} while (*vpp != NULLVP);
   1172   1.1  jdolecek 	}
   1173   1.1  jdolecek 
   1174   1.1  jdolecek 	if (*vpp == NULLVP)
   1175   1.1  jdolecek 		goto out;
   1176   1.1  jdolecek 
   1177   1.1  jdolecek 	vn_lock(*vpp, LK_EXCLUSIVE | LK_RETRY);
   1178  1.35     pooka 	vref(*vpp);
   1179   1.5   thorpej 	error = union_allocvp(&nvp, vp->v_mount, NULLVP, NULLVP, 0, *vpp, NULLVP, 0);
   1180   1.1  jdolecek 	if (!error) {
   1181   1.1  jdolecek 		VTOUNION(vp)->un_dircache = 0;
   1182   1.1  jdolecek 		VTOUNION(nvp)->un_dircache = dircache;
   1183   1.1  jdolecek 	}
   1184   1.1  jdolecek 
   1185   1.1  jdolecek out:
   1186  1.37   hannken 	VOP_UNLOCK(vp);
   1187   1.1  jdolecek 	return (nvp);
   1188   1.1  jdolecek }
   1189   1.1  jdolecek 
   1190   1.1  jdolecek void
   1191  1.32      matt union_diruncache(struct union_node *un)
   1192   1.1  jdolecek {
   1193   1.1  jdolecek 	struct vnode **vpp;
   1194   1.1  jdolecek 
   1195   1.1  jdolecek 	if (un->un_dircache != 0) {
   1196   1.1  jdolecek 		for (vpp = un->un_dircache; *vpp != NULLVP; vpp++)
   1197   1.1  jdolecek 			vrele(*vpp);
   1198   1.1  jdolecek 		free(un->un_dircache, M_TEMP);
   1199   1.1  jdolecek 		un->un_dircache = 0;
   1200   1.1  jdolecek 	}
   1201   1.2  jdolecek }
   1202   1.2  jdolecek 
   1203   1.2  jdolecek /*
   1204  1.44   hannken  * Check whether node can rmdir (check empty).
   1205  1.44   hannken  */
   1206  1.44   hannken int
   1207  1.44   hannken union_check_rmdir(struct union_node *un, kauth_cred_t cred)
   1208  1.44   hannken {
   1209  1.44   hannken 	int dirlen, eofflag, error;
   1210  1.44   hannken 	char *dirbuf;
   1211  1.44   hannken 	struct vattr va;
   1212  1.44   hannken 	struct vnode *tvp;
   1213  1.44   hannken 	struct dirent *dp, *edp;
   1214  1.44   hannken 	struct componentname cn;
   1215  1.44   hannken 	struct iovec aiov;
   1216  1.44   hannken 	struct uio auio;
   1217  1.44   hannken 
   1218  1.44   hannken 	KASSERT(un->un_uppervp != NULL);
   1219  1.44   hannken 
   1220  1.44   hannken 	/* Check upper for being opaque. */
   1221  1.44   hannken 	KASSERT(VOP_ISLOCKED(un->un_uppervp));
   1222  1.44   hannken 	error = VOP_GETATTR(un->un_uppervp, &va, cred);
   1223  1.44   hannken 	if (error || (va.va_flags & OPAQUE))
   1224  1.44   hannken 		return error;
   1225  1.44   hannken 
   1226  1.44   hannken 	if (un->un_lowervp == NULL)
   1227  1.44   hannken 		return 0;
   1228  1.44   hannken 
   1229  1.44   hannken 	/* Check lower for being empty. */
   1230  1.45   hannken 	vn_lock(un->un_lowervp, LK_SHARED | LK_RETRY);
   1231  1.44   hannken 	error = VOP_GETATTR(un->un_lowervp, &va, cred);
   1232  1.44   hannken 	if (error) {
   1233  1.44   hannken 		VOP_UNLOCK(un->un_lowervp);
   1234  1.44   hannken 		return error;
   1235  1.44   hannken 	}
   1236  1.44   hannken 	dirlen = va.va_blocksize;
   1237  1.44   hannken 	dirbuf = kmem_alloc(dirlen, KM_SLEEP);
   1238  1.44   hannken 	if (dirbuf == NULL) {
   1239  1.44   hannken 		VOP_UNLOCK(un->un_lowervp);
   1240  1.44   hannken 		return ENOMEM;
   1241  1.44   hannken 	}
   1242  1.44   hannken 	/* error = 0; */
   1243  1.44   hannken 	eofflag = 0;
   1244  1.44   hannken 	auio.uio_offset = 0;
   1245  1.44   hannken 	do {
   1246  1.44   hannken 		aiov.iov_len = dirlen;
   1247  1.44   hannken 		aiov.iov_base = dirbuf;
   1248  1.44   hannken 		auio.uio_iov = &aiov;
   1249  1.44   hannken 		auio.uio_iovcnt = 1;
   1250  1.44   hannken 		auio.uio_resid = aiov.iov_len;
   1251  1.44   hannken 		auio.uio_rw = UIO_READ;
   1252  1.44   hannken 		UIO_SETUP_SYSSPACE(&auio);
   1253  1.44   hannken 		error = VOP_READDIR(un->un_lowervp, &auio, cred, &eofflag,
   1254  1.44   hannken 		    NULL, NULL);
   1255  1.44   hannken 		if (error)
   1256  1.44   hannken 			break;
   1257  1.44   hannken 		edp = (struct dirent *)&dirbuf[dirlen - auio.uio_resid];
   1258  1.44   hannken 		for (dp = (struct dirent *)dirbuf;
   1259  1.44   hannken 		    error == 0 && dp < edp;
   1260  1.44   hannken 		    dp = (struct dirent *)((char *)dp + dp->d_reclen)) {
   1261  1.44   hannken 			if (dp->d_reclen == 0) {
   1262  1.44   hannken 				error = ENOTEMPTY;
   1263  1.44   hannken 				break;
   1264  1.44   hannken 			}
   1265  1.44   hannken 			if (dp->d_type == DT_WHT ||
   1266  1.44   hannken 			    (dp->d_namlen == 1 && dp->d_name[0] == '.') ||
   1267  1.44   hannken 			    (dp->d_namlen == 2 && !memcmp(dp->d_name, "..", 2)))
   1268  1.44   hannken 				continue;
   1269  1.44   hannken 			/* Check for presence in the upper layer. */
   1270  1.44   hannken 			cn.cn_nameiop = LOOKUP;
   1271  1.44   hannken 			cn.cn_flags = ISLASTCN | RDONLY;
   1272  1.44   hannken 			cn.cn_cred = cred;
   1273  1.44   hannken 			cn.cn_nameptr = dp->d_name;
   1274  1.44   hannken 			cn.cn_namelen = dp->d_namlen;
   1275  1.44   hannken 			cn.cn_hash = 0;
   1276  1.44   hannken 			cn.cn_consume = 0;
   1277  1.44   hannken 			error = VOP_LOOKUP(un->un_uppervp, &tvp, &cn);
   1278  1.44   hannken 			if (error == ENOENT && (cn.cn_flags & ISWHITEOUT)) {
   1279  1.44   hannken 				error = 0;
   1280  1.44   hannken 				continue;
   1281  1.44   hannken 			}
   1282  1.44   hannken 			if (error == 0)
   1283  1.44   hannken 				vput(tvp);
   1284  1.44   hannken 			error = ENOTEMPTY;
   1285  1.44   hannken 		}
   1286  1.44   hannken 	} while (error == 0 && !eofflag);
   1287  1.44   hannken 	kmem_free(dirbuf, dirlen);
   1288  1.44   hannken 	VOP_UNLOCK(un->un_lowervp);
   1289  1.44   hannken 
   1290  1.44   hannken 	return error;
   1291  1.44   hannken }
   1292  1.44   hannken 
   1293  1.44   hannken /*
   1294   1.2  jdolecek  * This hook is called from vn_readdir() to switch to lower directory
   1295   1.2  jdolecek  * entry after the upper directory is read.
   1296   1.2  jdolecek  */
   1297   1.2  jdolecek int
   1298  1.15  christos union_readdirhook(struct vnode **vpp, struct file *fp, struct lwp *l)
   1299   1.2  jdolecek {
   1300   1.2  jdolecek 	struct vnode *vp = *vpp, *lvp;
   1301   1.2  jdolecek 	struct vattr va;
   1302   1.2  jdolecek 	int error;
   1303   1.2  jdolecek 
   1304   1.2  jdolecek 	if (vp->v_op != union_vnodeop_p)
   1305   1.2  jdolecek 		return (0);
   1306   1.2  jdolecek 
   1307  1.15  christos 	if ((lvp = union_dircache(vp, l)) == NULLVP)
   1308   1.2  jdolecek 		return (0);
   1309   1.2  jdolecek 
   1310   1.2  jdolecek 	/*
   1311   1.2  jdolecek 	 * If the directory is opaque,
   1312   1.2  jdolecek 	 * then don't show lower entries
   1313   1.2  jdolecek 	 */
   1314  1.29     pooka 	error = VOP_GETATTR(vp, &va, fp->f_cred);
   1315   1.2  jdolecek 	if (error || (va.va_flags & OPAQUE)) {
   1316   1.2  jdolecek 		vput(lvp);
   1317   1.2  jdolecek 		return (error);
   1318   1.2  jdolecek 	}
   1319  1.12     perry 
   1320  1.29     pooka 	error = VOP_OPEN(lvp, FREAD, fp->f_cred);
   1321   1.2  jdolecek 	if (error) {
   1322   1.2  jdolecek 		vput(lvp);
   1323   1.2  jdolecek 		return (error);
   1324   1.2  jdolecek 	}
   1325  1.37   hannken 	VOP_UNLOCK(lvp);
   1326  1.10       jrf 	fp->f_data = lvp;
   1327   1.2  jdolecek 	fp->f_offset = 0;
   1328  1.33        ad 	error = vn_close(vp, FREAD, fp->f_cred);
   1329   1.2  jdolecek 	if (error)
   1330   1.2  jdolecek 		return (error);
   1331   1.2  jdolecek 	*vpp = lvp;
   1332   1.2  jdolecek 	return (0);
   1333   1.1  jdolecek }
   1334