Home | History | Annotate | Line # | Download | only in union
union_subr.c revision 1.33.12.1
      1  1.33.12.1     skrll /*	$NetBSD: union_subr.c,v 1.33.12.1 2009/01/19 13:19:37 skrll Exp $	*/
      2        1.1  jdolecek 
      3        1.1  jdolecek /*
      4        1.1  jdolecek  * Copyright (c) 1994
      5        1.1  jdolecek  *	The Regents of the University of California.  All rights reserved.
      6        1.1  jdolecek  *
      7        1.1  jdolecek  * This code is derived from software contributed to Berkeley by
      8        1.1  jdolecek  * Jan-Simon Pendry.
      9        1.1  jdolecek  *
     10        1.1  jdolecek  * Redistribution and use in source and binary forms, with or without
     11        1.1  jdolecek  * modification, are permitted provided that the following conditions
     12        1.1  jdolecek  * are met:
     13        1.1  jdolecek  * 1. Redistributions of source code must retain the above copyright
     14        1.1  jdolecek  *    notice, this list of conditions and the following disclaimer.
     15        1.1  jdolecek  * 2. Redistributions in binary form must reproduce the above copyright
     16        1.1  jdolecek  *    notice, this list of conditions and the following disclaimer in the
     17        1.1  jdolecek  *    documentation and/or other materials provided with the distribution.
     18        1.7       agc  * 3. Neither the name of the University nor the names of its contributors
     19        1.7       agc  *    may be used to endorse or promote products derived from this software
     20        1.7       agc  *    without specific prior written permission.
     21        1.7       agc  *
     22        1.7       agc  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     23        1.7       agc  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     24        1.7       agc  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     25        1.7       agc  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     26        1.7       agc  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     27        1.7       agc  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     28        1.7       agc  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     29        1.7       agc  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     30        1.7       agc  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     31        1.7       agc  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     32        1.7       agc  * SUCH DAMAGE.
     33        1.7       agc  *
     34        1.7       agc  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     35        1.7       agc  */
     36        1.7       agc 
     37        1.7       agc /*
     38        1.7       agc  * Copyright (c) 1994 Jan-Simon Pendry
     39        1.7       agc  *
     40        1.7       agc  * This code is derived from software contributed to Berkeley by
     41        1.7       agc  * Jan-Simon Pendry.
     42        1.7       agc  *
     43        1.7       agc  * Redistribution and use in source and binary forms, with or without
     44        1.7       agc  * modification, are permitted provided that the following conditions
     45        1.7       agc  * are met:
     46        1.7       agc  * 1. Redistributions of source code must retain the above copyright
     47        1.7       agc  *    notice, this list of conditions and the following disclaimer.
     48        1.7       agc  * 2. Redistributions in binary form must reproduce the above copyright
     49        1.7       agc  *    notice, this list of conditions and the following disclaimer in the
     50        1.7       agc  *    documentation and/or other materials provided with the distribution.
     51        1.1  jdolecek  * 3. All advertising materials mentioning features or use of this software
     52        1.1  jdolecek  *    must display the following acknowledgement:
     53        1.1  jdolecek  *	This product includes software developed by the University of
     54        1.1  jdolecek  *	California, Berkeley and its contributors.
     55        1.1  jdolecek  * 4. Neither the name of the University nor the names of its contributors
     56        1.1  jdolecek  *    may be used to endorse or promote products derived from this software
     57        1.1  jdolecek  *    without specific prior written permission.
     58        1.1  jdolecek  *
     59        1.1  jdolecek  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     60        1.1  jdolecek  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     61        1.1  jdolecek  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     62        1.1  jdolecek  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     63        1.1  jdolecek  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     64        1.1  jdolecek  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     65        1.1  jdolecek  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     66        1.1  jdolecek  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     67        1.1  jdolecek  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     68        1.1  jdolecek  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     69        1.1  jdolecek  * SUCH DAMAGE.
     70        1.1  jdolecek  *
     71        1.1  jdolecek  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     72        1.1  jdolecek  */
     73        1.1  jdolecek 
     74        1.1  jdolecek #include <sys/cdefs.h>
     75  1.33.12.1     skrll __KERNEL_RCSID(0, "$NetBSD: union_subr.c,v 1.33.12.1 2009/01/19 13:19:37 skrll Exp $");
     76        1.1  jdolecek 
     77        1.1  jdolecek #include <sys/param.h>
     78        1.1  jdolecek #include <sys/systm.h>
     79        1.1  jdolecek #include <sys/proc.h>
     80        1.1  jdolecek #include <sys/time.h>
     81        1.1  jdolecek #include <sys/kernel.h>
     82        1.1  jdolecek #include <sys/vnode.h>
     83        1.1  jdolecek #include <sys/namei.h>
     84        1.1  jdolecek #include <sys/malloc.h>
     85        1.1  jdolecek #include <sys/file.h>
     86        1.1  jdolecek #include <sys/filedesc.h>
     87        1.1  jdolecek #include <sys/queue.h>
     88        1.1  jdolecek #include <sys/mount.h>
     89        1.1  jdolecek #include <sys/stat.h>
     90       1.18      elad #include <sys/kauth.h>
     91        1.1  jdolecek 
     92        1.1  jdolecek #include <uvm/uvm_extern.h>
     93        1.1  jdolecek 
     94        1.1  jdolecek #include <fs/union/union.h>
     95        1.1  jdolecek 
     96        1.1  jdolecek /* must be power of two, otherwise change UNION_HASH() */
     97        1.1  jdolecek #define NHASH 32
     98        1.1  jdolecek 
     99        1.1  jdolecek /* unsigned int ... */
    100        1.1  jdolecek #define UNION_HASH(u, l) \
    101        1.1  jdolecek 	(((((unsigned long) (u)) + ((unsigned long) l)) >> 8) & (NHASH-1))
    102        1.1  jdolecek 
    103        1.1  jdolecek static LIST_HEAD(unhead, union_node) unhead[NHASH];
    104        1.1  jdolecek static int unvplock[NHASH];
    105        1.1  jdolecek 
    106       1.14   xtraeme static int union_list_lock(int);
    107       1.14   xtraeme static void union_list_unlock(int);
    108       1.14   xtraeme void union_updatevp(struct union_node *, struct vnode *, struct vnode *);
    109       1.14   xtraeme static int union_relookup(struct union_mount *, struct vnode *,
    110        1.1  jdolecek 			       struct vnode **, struct componentname *,
    111       1.14   xtraeme 			       struct componentname *, const char *, int);
    112       1.18      elad int union_vn_close(struct vnode *, int, kauth_cred_t, struct lwp *);
    113       1.14   xtraeme static void union_dircache_r(struct vnode *, struct vnode ***, int *);
    114       1.15  christos struct vnode *union_dircache(struct vnode *, struct lwp *);
    115        1.1  jdolecek 
    116        1.1  jdolecek void
    117       1.32      matt union_init(void)
    118        1.1  jdolecek {
    119        1.1  jdolecek 	int i;
    120        1.1  jdolecek 
    121        1.1  jdolecek 	for (i = 0; i < NHASH; i++)
    122        1.1  jdolecek 		LIST_INIT(&unhead[i]);
    123        1.9       jrf 	memset(unvplock, 0, sizeof(unvplock));
    124        1.1  jdolecek }
    125        1.1  jdolecek 
    126        1.1  jdolecek /*
    127        1.1  jdolecek  * Free global unionfs resources.
    128        1.1  jdolecek  */
    129        1.1  jdolecek void
    130       1.32      matt union_done(void)
    131        1.1  jdolecek {
    132       1.12     perry 
    133        1.2  jdolecek 	/* Make sure to unset the readdir hook. */
    134        1.2  jdolecek 	vn_union_readdir_hook = NULL;
    135        1.1  jdolecek }
    136        1.1  jdolecek 
    137        1.1  jdolecek static int
    138       1.32      matt union_list_lock(int ix)
    139        1.1  jdolecek {
    140        1.1  jdolecek 
    141        1.1  jdolecek 	if (unvplock[ix] & UN_LOCKED) {
    142        1.1  jdolecek 		unvplock[ix] |= UN_WANTED;
    143        1.1  jdolecek 		(void) tsleep(&unvplock[ix], PINOD, "unionlk", 0);
    144        1.1  jdolecek 		return (1);
    145        1.1  jdolecek 	}
    146        1.1  jdolecek 
    147        1.1  jdolecek 	unvplock[ix] |= UN_LOCKED;
    148        1.1  jdolecek 
    149        1.1  jdolecek 	return (0);
    150        1.1  jdolecek }
    151        1.1  jdolecek 
    152        1.1  jdolecek static void
    153       1.32      matt union_list_unlock(int ix)
    154        1.1  jdolecek {
    155        1.1  jdolecek 
    156        1.1  jdolecek 	unvplock[ix] &= ~UN_LOCKED;
    157        1.1  jdolecek 
    158        1.1  jdolecek 	if (unvplock[ix] & UN_WANTED) {
    159        1.1  jdolecek 		unvplock[ix] &= ~UN_WANTED;
    160        1.9       jrf 		wakeup(&unvplock[ix]);
    161        1.1  jdolecek 	}
    162        1.1  jdolecek }
    163        1.1  jdolecek 
    164        1.1  jdolecek void
    165       1.32      matt union_updatevp(struct union_node *un, struct vnode *uppervp,
    166       1.32      matt 	struct vnode *lowervp)
    167        1.1  jdolecek {
    168        1.1  jdolecek 	int ohash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    169        1.1  jdolecek 	int nhash = UNION_HASH(uppervp, lowervp);
    170        1.1  jdolecek 	int docache = (lowervp != NULLVP || uppervp != NULLVP);
    171        1.1  jdolecek 	int lhash, uhash;
    172        1.1  jdolecek 
    173        1.1  jdolecek 	/*
    174        1.1  jdolecek 	 * Ensure locking is ordered from lower to higher
    175        1.1  jdolecek 	 * to avoid deadlocks.
    176        1.1  jdolecek 	 */
    177        1.1  jdolecek 	if (nhash < ohash) {
    178        1.1  jdolecek 		lhash = nhash;
    179        1.1  jdolecek 		uhash = ohash;
    180        1.1  jdolecek 	} else {
    181        1.1  jdolecek 		lhash = ohash;
    182        1.1  jdolecek 		uhash = nhash;
    183        1.1  jdolecek 	}
    184        1.1  jdolecek 
    185        1.1  jdolecek 	if (lhash != uhash)
    186        1.1  jdolecek 		while (union_list_lock(lhash))
    187        1.1  jdolecek 			continue;
    188        1.1  jdolecek 
    189        1.1  jdolecek 	while (union_list_lock(uhash))
    190        1.1  jdolecek 		continue;
    191        1.1  jdolecek 
    192        1.1  jdolecek 	if (ohash != nhash || !docache) {
    193        1.1  jdolecek 		if (un->un_flags & UN_CACHED) {
    194        1.1  jdolecek 			un->un_flags &= ~UN_CACHED;
    195        1.1  jdolecek 			LIST_REMOVE(un, un_cache);
    196        1.1  jdolecek 		}
    197        1.1  jdolecek 	}
    198        1.1  jdolecek 
    199        1.1  jdolecek 	if (ohash != nhash)
    200        1.1  jdolecek 		union_list_unlock(ohash);
    201        1.1  jdolecek 
    202        1.1  jdolecek 	if (un->un_lowervp != lowervp) {
    203        1.1  jdolecek 		if (un->un_lowervp) {
    204        1.1  jdolecek 			vrele(un->un_lowervp);
    205        1.1  jdolecek 			if (un->un_path) {
    206        1.1  jdolecek 				free(un->un_path, M_TEMP);
    207        1.1  jdolecek 				un->un_path = 0;
    208        1.1  jdolecek 			}
    209        1.1  jdolecek 			if (un->un_dirvp) {
    210        1.1  jdolecek 				vrele(un->un_dirvp);
    211        1.1  jdolecek 				un->un_dirvp = NULLVP;
    212        1.1  jdolecek 			}
    213        1.1  jdolecek 		}
    214        1.1  jdolecek 		un->un_lowervp = lowervp;
    215        1.1  jdolecek 		un->un_lowersz = VNOVAL;
    216        1.1  jdolecek 	}
    217        1.1  jdolecek 
    218        1.1  jdolecek 	if (un->un_uppervp != uppervp) {
    219        1.1  jdolecek 		if (un->un_uppervp)
    220        1.1  jdolecek 			vrele(un->un_uppervp);
    221        1.1  jdolecek 
    222        1.1  jdolecek 		un->un_uppervp = uppervp;
    223        1.1  jdolecek 		un->un_uppersz = VNOVAL;
    224        1.1  jdolecek 	}
    225        1.1  jdolecek 
    226        1.1  jdolecek 	if (docache && (ohash != nhash)) {
    227        1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[nhash], un, un_cache);
    228        1.1  jdolecek 		un->un_flags |= UN_CACHED;
    229        1.1  jdolecek 	}
    230        1.1  jdolecek 
    231        1.1  jdolecek 	union_list_unlock(nhash);
    232        1.1  jdolecek }
    233        1.1  jdolecek 
    234        1.1  jdolecek void
    235       1.32      matt union_newlower(struct union_node *un, struct vnode *lowervp)
    236        1.1  jdolecek {
    237        1.1  jdolecek 
    238        1.1  jdolecek 	union_updatevp(un, un->un_uppervp, lowervp);
    239        1.1  jdolecek }
    240        1.1  jdolecek 
    241        1.1  jdolecek void
    242       1.32      matt union_newupper(struct union_node *un, struct vnode *uppervp)
    243        1.1  jdolecek {
    244        1.1  jdolecek 
    245        1.1  jdolecek 	union_updatevp(un, uppervp, un->un_lowervp);
    246        1.1  jdolecek }
    247        1.1  jdolecek 
    248        1.1  jdolecek /*
    249        1.1  jdolecek  * Keep track of size changes in the underlying vnodes.
    250        1.1  jdolecek  * If the size changes, then callback to the vm layer
    251        1.1  jdolecek  * giving priority to the upper layer size.
    252        1.1  jdolecek  */
    253        1.1  jdolecek void
    254       1.32      matt union_newsize(struct vnode *vp, off_t uppersz, off_t lowersz)
    255        1.1  jdolecek {
    256        1.1  jdolecek 	struct union_node *un;
    257        1.1  jdolecek 	off_t sz;
    258        1.1  jdolecek 
    259        1.1  jdolecek 	/* only interested in regular files */
    260       1.26     pooka 	if (vp->v_type != VREG) {
    261       1.26     pooka 		uvm_vnp_setsize(vp, 0);
    262        1.1  jdolecek 		return;
    263       1.26     pooka 	}
    264        1.1  jdolecek 
    265        1.1  jdolecek 	un = VTOUNION(vp);
    266        1.1  jdolecek 	sz = VNOVAL;
    267        1.1  jdolecek 
    268        1.1  jdolecek 	if ((uppersz != VNOVAL) && (un->un_uppersz != uppersz)) {
    269        1.1  jdolecek 		un->un_uppersz = uppersz;
    270        1.1  jdolecek 		if (sz == VNOVAL)
    271        1.1  jdolecek 			sz = un->un_uppersz;
    272        1.1  jdolecek 	}
    273        1.1  jdolecek 
    274        1.1  jdolecek 	if ((lowersz != VNOVAL) && (un->un_lowersz != lowersz)) {
    275        1.1  jdolecek 		un->un_lowersz = lowersz;
    276        1.1  jdolecek 		if (sz == VNOVAL)
    277        1.1  jdolecek 			sz = un->un_lowersz;
    278        1.1  jdolecek 	}
    279        1.1  jdolecek 
    280        1.1  jdolecek 	if (sz != VNOVAL) {
    281        1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    282        1.1  jdolecek 		printf("union: %s size now %qd\n",
    283        1.1  jdolecek 		    uppersz != VNOVAL ? "upper" : "lower", sz);
    284        1.1  jdolecek #endif
    285        1.1  jdolecek 		uvm_vnp_setsize(vp, sz);
    286        1.1  jdolecek 	}
    287        1.1  jdolecek }
    288        1.1  jdolecek 
    289        1.1  jdolecek /*
    290        1.1  jdolecek  * allocate a union_node/vnode pair.  the vnode is
    291        1.1  jdolecek  * referenced and locked.  the new vnode is returned
    292        1.1  jdolecek  * via (vpp).  (mp) is the mountpoint of the union filesystem,
    293        1.1  jdolecek  * (dvp) is the parent directory where the upper layer object
    294        1.1  jdolecek  * should exist (but doesn't) and (cnp) is the componentname
    295        1.1  jdolecek  * information which is partially copied to allow the upper
    296        1.1  jdolecek  * layer object to be created at a later time.  (uppervp)
    297        1.1  jdolecek  * and (lowervp) reference the upper and lower layer objects
    298        1.1  jdolecek  * being mapped.  either, but not both, can be nil.
    299        1.1  jdolecek  * if supplied, (uppervp) is locked.
    300        1.1  jdolecek  * the reference is either maintained in the new union_node
    301        1.1  jdolecek  * object which is allocated, or they are vrele'd.
    302        1.1  jdolecek  *
    303        1.1  jdolecek  * all union_nodes are maintained on a singly-linked
    304        1.1  jdolecek  * list.  new nodes are only allocated when they cannot
    305        1.1  jdolecek  * be found on this list.  entries on the list are
    306        1.1  jdolecek  * removed when the vfs reclaim entry is called.
    307        1.1  jdolecek  *
    308        1.1  jdolecek  * a single lock is kept for the entire list.  this is
    309        1.1  jdolecek  * needed because the getnewvnode() function can block
    310        1.1  jdolecek  * waiting for a vnode to become free, in which case there
    311        1.1  jdolecek  * may be more than one process trying to get the same
    312        1.1  jdolecek  * vnode.  this lock is only taken if we are going to
    313        1.1  jdolecek  * call getnewvnode, since the kernel itself is single-threaded.
    314        1.1  jdolecek  *
    315        1.1  jdolecek  * if an entry is found on the list, then call vget() to
    316        1.1  jdolecek  * take a reference.  this is done because there may be
    317        1.1  jdolecek  * zero references to it and so it needs to removed from
    318        1.1  jdolecek  * the vnode free list.
    319        1.1  jdolecek  */
    320        1.1  jdolecek int
    321       1.32      matt union_allocvp(
    322       1.32      matt 	struct vnode **vpp,
    323       1.32      matt 	struct mount *mp,
    324       1.32      matt 	struct vnode *undvp,		/* parent union vnode */
    325       1.32      matt 	struct vnode *dvp,		/* may be null */
    326       1.32      matt 	struct componentname *cnp,	/* may be null */
    327       1.32      matt 	struct vnode *uppervp,		/* may be null */
    328       1.32      matt 	struct vnode *lowervp,		/* may be null */
    329       1.32      matt 	int docache)
    330        1.1  jdolecek {
    331        1.1  jdolecek 	int error;
    332       1.26     pooka 	struct vattr va;
    333        1.1  jdolecek 	struct union_node *un = NULL;
    334        1.1  jdolecek 	struct vnode *xlowervp = NULLVP;
    335        1.1  jdolecek 	struct union_mount *um = MOUNTTOUNIONMOUNT(mp);
    336       1.26     pooka 	voff_t uppersz, lowersz;
    337        1.1  jdolecek 	int hash = 0;
    338       1.28        ad 	int vflag, iflag;
    339        1.1  jdolecek 	int try;
    340        1.1  jdolecek 
    341        1.1  jdolecek 	if (uppervp == NULLVP && lowervp == NULLVP)
    342        1.1  jdolecek 		panic("union: unidentifiable allocation");
    343        1.1  jdolecek 
    344        1.1  jdolecek 	if (uppervp && lowervp && (uppervp->v_type != lowervp->v_type)) {
    345        1.1  jdolecek 		xlowervp = lowervp;
    346        1.1  jdolecek 		lowervp = NULLVP;
    347        1.1  jdolecek 	}
    348        1.1  jdolecek 
    349        1.1  jdolecek 	/* detect the root vnode (and aliases) */
    350       1.28        ad 	iflag = VI_LAYER;
    351       1.28        ad 	vflag = 0;
    352        1.1  jdolecek 	if ((uppervp == um->um_uppervp) &&
    353        1.1  jdolecek 	    ((lowervp == NULLVP) || lowervp == um->um_lowervp)) {
    354        1.1  jdolecek 		if (lowervp == NULLVP) {
    355        1.1  jdolecek 			lowervp = um->um_lowervp;
    356        1.1  jdolecek 			if (lowervp != NULLVP)
    357        1.1  jdolecek 				VREF(lowervp);
    358        1.1  jdolecek 		}
    359       1.28        ad 		iflag = 0;
    360       1.28        ad 		vflag = VV_ROOT;
    361        1.1  jdolecek 	}
    362        1.1  jdolecek 
    363        1.1  jdolecek loop:
    364        1.1  jdolecek 	if (!docache) {
    365        1.1  jdolecek 		un = 0;
    366        1.1  jdolecek 	} else for (try = 0; try < 3; try++) {
    367        1.1  jdolecek 		switch (try) {
    368        1.1  jdolecek 		case 0:
    369        1.1  jdolecek 			if (lowervp == NULLVP)
    370        1.1  jdolecek 				continue;
    371        1.1  jdolecek 			hash = UNION_HASH(uppervp, lowervp);
    372        1.1  jdolecek 			break;
    373        1.1  jdolecek 
    374        1.1  jdolecek 		case 1:
    375        1.1  jdolecek 			if (uppervp == NULLVP)
    376        1.1  jdolecek 				continue;
    377        1.1  jdolecek 			hash = UNION_HASH(uppervp, NULLVP);
    378        1.1  jdolecek 			break;
    379        1.1  jdolecek 
    380        1.1  jdolecek 		case 2:
    381        1.1  jdolecek 			if (lowervp == NULLVP)
    382        1.1  jdolecek 				continue;
    383        1.1  jdolecek 			hash = UNION_HASH(NULLVP, lowervp);
    384        1.1  jdolecek 			break;
    385        1.1  jdolecek 		}
    386        1.1  jdolecek 
    387        1.1  jdolecek 		while (union_list_lock(hash))
    388        1.1  jdolecek 			continue;
    389        1.1  jdolecek 
    390        1.1  jdolecek 		for (un = unhead[hash].lh_first; un != 0;
    391        1.1  jdolecek 					un = un->un_cache.le_next) {
    392        1.1  jdolecek 			if ((un->un_lowervp == lowervp ||
    393        1.1  jdolecek 			     un->un_lowervp == NULLVP) &&
    394        1.1  jdolecek 			    (un->un_uppervp == uppervp ||
    395        1.1  jdolecek 			     un->un_uppervp == NULLVP) &&
    396        1.1  jdolecek 			    (UNIONTOV(un)->v_mount == mp)) {
    397        1.5   thorpej 				if (vget(UNIONTOV(un), 0)) {
    398        1.1  jdolecek 					union_list_unlock(hash);
    399        1.1  jdolecek 					goto loop;
    400        1.1  jdolecek 				}
    401        1.1  jdolecek 				break;
    402        1.1  jdolecek 			}
    403        1.1  jdolecek 		}
    404        1.1  jdolecek 
    405        1.1  jdolecek 		union_list_unlock(hash);
    406        1.1  jdolecek 
    407        1.1  jdolecek 		if (un)
    408        1.1  jdolecek 			break;
    409        1.1  jdolecek 	}
    410        1.1  jdolecek 
    411        1.1  jdolecek 	if (un) {
    412        1.1  jdolecek 		/*
    413        1.1  jdolecek 		 * Obtain a lock on the union_node.
    414        1.1  jdolecek 		 * uppervp is locked, though un->un_uppervp
    415        1.1  jdolecek 		 * may not be.  this doesn't break the locking
    416        1.1  jdolecek 		 * hierarchy since in the case that un->un_uppervp
    417        1.1  jdolecek 		 * is not yet locked it will be vrele'd and replaced
    418        1.1  jdolecek 		 * with uppervp.
    419        1.1  jdolecek 		 */
    420        1.1  jdolecek 
    421        1.1  jdolecek 		if ((dvp != NULLVP) && (uppervp == dvp)) {
    422        1.1  jdolecek 			/*
    423        1.1  jdolecek 			 * Access ``.'', so (un) will already
    424        1.1  jdolecek 			 * be locked.  Since this process has
    425        1.1  jdolecek 			 * the lock on (uppervp) no other
    426        1.1  jdolecek 			 * process can hold the lock on (un).
    427        1.1  jdolecek 			 */
    428        1.1  jdolecek #ifdef DIAGNOSTIC
    429        1.1  jdolecek 			if ((un->un_flags & UN_LOCKED) == 0)
    430        1.1  jdolecek 				panic("union: . not locked");
    431        1.1  jdolecek 			else if (curproc && un->un_pid != curproc->p_pid &&
    432        1.1  jdolecek 				    un->un_pid > -1 && curproc->p_pid > -1)
    433        1.1  jdolecek 				panic("union: allocvp not lock owner");
    434        1.1  jdolecek #endif
    435        1.1  jdolecek 		} else {
    436        1.1  jdolecek 			if (un->un_flags & UN_LOCKED) {
    437        1.1  jdolecek 				vrele(UNIONTOV(un));
    438        1.1  jdolecek 				un->un_flags |= UN_WANTED;
    439        1.1  jdolecek 				(void) tsleep(&un->un_flags, PINOD,
    440        1.1  jdolecek 				    "unionalloc", 0);
    441        1.1  jdolecek 				goto loop;
    442        1.1  jdolecek 			}
    443        1.1  jdolecek 			un->un_flags |= UN_LOCKED;
    444        1.1  jdolecek 
    445        1.1  jdolecek #ifdef DIAGNOSTIC
    446        1.1  jdolecek 			if (curproc)
    447        1.1  jdolecek 				un->un_pid = curproc->p_pid;
    448        1.1  jdolecek 			else
    449        1.1  jdolecek 				un->un_pid = -1;
    450        1.1  jdolecek #endif
    451        1.1  jdolecek 		}
    452        1.1  jdolecek 
    453        1.1  jdolecek 		/*
    454        1.1  jdolecek 		 * At this point, the union_node is locked,
    455        1.1  jdolecek 		 * un->un_uppervp may not be locked, and uppervp
    456        1.1  jdolecek 		 * is locked or nil.
    457        1.1  jdolecek 		 */
    458        1.1  jdolecek 
    459        1.1  jdolecek 		/*
    460        1.1  jdolecek 		 * Save information about the upper layer.
    461        1.1  jdolecek 		 */
    462        1.1  jdolecek 		if (uppervp != un->un_uppervp) {
    463        1.1  jdolecek 			union_newupper(un, uppervp);
    464        1.1  jdolecek 		} else if (uppervp) {
    465        1.1  jdolecek 			vrele(uppervp);
    466        1.1  jdolecek 		}
    467        1.1  jdolecek 
    468        1.1  jdolecek 		if (un->un_uppervp) {
    469        1.1  jdolecek 			un->un_flags |= UN_ULOCK;
    470        1.1  jdolecek 			un->un_flags &= ~UN_KLOCK;
    471        1.1  jdolecek 		}
    472        1.1  jdolecek 
    473        1.1  jdolecek 		/*
    474        1.1  jdolecek 		 * Save information about the lower layer.
    475        1.1  jdolecek 		 * This needs to keep track of pathname
    476        1.1  jdolecek 		 * and directory information which union_vn_create
    477        1.1  jdolecek 		 * might need.
    478        1.1  jdolecek 		 */
    479        1.1  jdolecek 		if (lowervp != un->un_lowervp) {
    480        1.1  jdolecek 			union_newlower(un, lowervp);
    481        1.1  jdolecek 			if (cnp && (lowervp != NULLVP)) {
    482        1.1  jdolecek 				un->un_hash = cnp->cn_hash;
    483        1.1  jdolecek 				un->un_path = malloc(cnp->cn_namelen+1,
    484        1.1  jdolecek 						M_TEMP, M_WAITOK);
    485        1.1  jdolecek 				memcpy(un->un_path, cnp->cn_nameptr,
    486        1.1  jdolecek 						cnp->cn_namelen);
    487        1.1  jdolecek 				un->un_path[cnp->cn_namelen] = '\0';
    488        1.1  jdolecek 				VREF(dvp);
    489        1.1  jdolecek 				un->un_dirvp = dvp;
    490        1.1  jdolecek 			}
    491        1.1  jdolecek 		} else if (lowervp) {
    492        1.1  jdolecek 			vrele(lowervp);
    493        1.1  jdolecek 		}
    494        1.1  jdolecek 		*vpp = UNIONTOV(un);
    495        1.1  jdolecek 		return (0);
    496        1.1  jdolecek 	}
    497        1.1  jdolecek 
    498       1.27     pooka 	uppersz = lowersz = VNOVAL;
    499       1.27     pooka 	if (uppervp != NULLVP)
    500       1.29     pooka 		if (VOP_GETATTR(uppervp, &va, FSCRED) == 0)
    501       1.27     pooka 			uppersz = va.va_size;
    502       1.27     pooka 	if (lowervp != NULLVP)
    503       1.29     pooka 		if (VOP_GETATTR(lowervp, &va, FSCRED) == 0)
    504       1.27     pooka 			lowersz = va.va_size;
    505       1.27     pooka 
    506        1.1  jdolecek 	if (docache) {
    507        1.1  jdolecek 		/*
    508        1.1  jdolecek 		 * otherwise lock the vp list while we call getnewvnode
    509        1.1  jdolecek 		 * since that can block.
    510       1.12     perry 		 */
    511        1.1  jdolecek 		hash = UNION_HASH(uppervp, lowervp);
    512        1.1  jdolecek 
    513        1.1  jdolecek 		if (union_list_lock(hash))
    514        1.1  jdolecek 			goto loop;
    515        1.1  jdolecek 	}
    516        1.1  jdolecek 
    517        1.1  jdolecek 	error = getnewvnode(VT_UNION, mp, union_vnodeop_p, vpp);
    518        1.1  jdolecek 	if (error) {
    519        1.1  jdolecek 		if (uppervp) {
    520        1.1  jdolecek 			if (dvp == uppervp)
    521        1.1  jdolecek 				vrele(uppervp);
    522        1.1  jdolecek 			else
    523        1.1  jdolecek 				vput(uppervp);
    524        1.1  jdolecek 		}
    525        1.1  jdolecek 		if (lowervp)
    526        1.1  jdolecek 			vrele(lowervp);
    527        1.1  jdolecek 
    528        1.1  jdolecek 		goto out;
    529        1.1  jdolecek 	}
    530        1.1  jdolecek 
    531  1.33.12.1     skrll 	(*vpp)->v_data = malloc(sizeof(struct union_node), M_TEMP, M_WAITOK);
    532        1.1  jdolecek 
    533       1.28        ad 	(*vpp)->v_vflag |= vflag;
    534       1.28        ad 	(*vpp)->v_iflag |= iflag;
    535        1.1  jdolecek 	(*vpp)->v_vnlock = NULL;	/* Make upper layers call VOP_LOCK */
    536        1.1  jdolecek 	if (uppervp)
    537        1.1  jdolecek 		(*vpp)->v_type = uppervp->v_type;
    538        1.1  jdolecek 	else
    539        1.1  jdolecek 		(*vpp)->v_type = lowervp->v_type;
    540        1.1  jdolecek 	un = VTOUNION(*vpp);
    541        1.1  jdolecek 	un->un_vnode = *vpp;
    542        1.1  jdolecek 	un->un_uppervp = uppervp;
    543        1.1  jdolecek 	un->un_lowervp = lowervp;
    544        1.1  jdolecek 	un->un_pvp = undvp;
    545        1.1  jdolecek 	if (undvp != NULLVP)
    546        1.1  jdolecek 		VREF(undvp);
    547        1.1  jdolecek 	un->un_dircache = 0;
    548        1.1  jdolecek 	un->un_openl = 0;
    549        1.1  jdolecek 	un->un_flags = UN_LOCKED;
    550       1.26     pooka 
    551       1.26     pooka 	un->un_uppersz = VNOVAL;
    552       1.26     pooka 	un->un_lowersz = VNOVAL;
    553       1.26     pooka 	union_newsize(*vpp, uppersz, lowersz);
    554       1.26     pooka 
    555        1.1  jdolecek 	if (un->un_uppervp)
    556        1.1  jdolecek 		un->un_flags |= UN_ULOCK;
    557        1.1  jdolecek #ifdef DIAGNOSTIC
    558        1.1  jdolecek 	if (curproc)
    559        1.1  jdolecek 		un->un_pid = curproc->p_pid;
    560        1.1  jdolecek 	else
    561        1.1  jdolecek 		un->un_pid = -1;
    562        1.1  jdolecek #endif
    563       1.17  christos 	if (dvp && cnp && (lowervp != NULLVP)) {
    564        1.1  jdolecek 		un->un_hash = cnp->cn_hash;
    565        1.1  jdolecek 		un->un_path = malloc(cnp->cn_namelen+1, M_TEMP, M_WAITOK);
    566        1.1  jdolecek 		memcpy(un->un_path, cnp->cn_nameptr, cnp->cn_namelen);
    567        1.1  jdolecek 		un->un_path[cnp->cn_namelen] = '\0';
    568        1.1  jdolecek 		VREF(dvp);
    569        1.1  jdolecek 		un->un_dirvp = dvp;
    570        1.1  jdolecek 	} else {
    571        1.1  jdolecek 		un->un_hash = 0;
    572        1.1  jdolecek 		un->un_path = 0;
    573        1.1  jdolecek 		un->un_dirvp = 0;
    574        1.1  jdolecek 	}
    575        1.1  jdolecek 
    576        1.1  jdolecek 	if (docache) {
    577        1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[hash], un, un_cache);
    578        1.1  jdolecek 		un->un_flags |= UN_CACHED;
    579        1.1  jdolecek 	}
    580        1.1  jdolecek 
    581        1.1  jdolecek 	if (xlowervp)
    582        1.1  jdolecek 		vrele(xlowervp);
    583        1.1  jdolecek 
    584        1.1  jdolecek out:
    585        1.1  jdolecek 	if (docache)
    586        1.1  jdolecek 		union_list_unlock(hash);
    587        1.1  jdolecek 
    588        1.1  jdolecek 	return (error);
    589        1.1  jdolecek }
    590        1.1  jdolecek 
    591        1.1  jdolecek int
    592       1.32      matt union_freevp(struct vnode *vp)
    593        1.1  jdolecek {
    594        1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
    595        1.1  jdolecek 
    596        1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
    597        1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
    598        1.1  jdolecek 		LIST_REMOVE(un, un_cache);
    599        1.1  jdolecek 	}
    600        1.1  jdolecek 
    601        1.1  jdolecek 	if (un->un_pvp != NULLVP)
    602        1.1  jdolecek 		vrele(un->un_pvp);
    603        1.1  jdolecek 	if (un->un_uppervp != NULLVP)
    604        1.1  jdolecek 		vrele(un->un_uppervp);
    605        1.1  jdolecek 	if (un->un_lowervp != NULLVP)
    606        1.1  jdolecek 		vrele(un->un_lowervp);
    607        1.1  jdolecek 	if (un->un_dirvp != NULLVP)
    608        1.1  jdolecek 		vrele(un->un_dirvp);
    609        1.1  jdolecek 	if (un->un_path)
    610        1.1  jdolecek 		free(un->un_path, M_TEMP);
    611        1.1  jdolecek 
    612  1.33.12.1     skrll 	free(vp->v_data, M_TEMP);
    613  1.33.12.1     skrll 	vp->v_data = NULL;
    614        1.1  jdolecek 
    615        1.1  jdolecek 	return (0);
    616        1.1  jdolecek }
    617        1.1  jdolecek 
    618        1.1  jdolecek /*
    619        1.1  jdolecek  * copyfile.  copy the vnode (fvp) to the vnode (tvp)
    620        1.1  jdolecek  * using a sequence of reads and writes.  both (fvp)
    621        1.1  jdolecek  * and (tvp) are locked on entry and exit.
    622        1.1  jdolecek  */
    623        1.1  jdolecek int
    624       1.32      matt union_copyfile(struct vnode *fvp, struct vnode *tvp, kauth_cred_t cred,
    625       1.32      matt 	struct lwp *l)
    626        1.1  jdolecek {
    627       1.13  christos 	char *tbuf;
    628        1.1  jdolecek 	struct uio uio;
    629        1.1  jdolecek 	struct iovec iov;
    630        1.1  jdolecek 	int error = 0;
    631        1.1  jdolecek 
    632        1.1  jdolecek 	/*
    633        1.1  jdolecek 	 * strategy:
    634        1.1  jdolecek 	 * allocate a buffer of size MAXBSIZE.
    635        1.1  jdolecek 	 * loop doing reads and writes, keeping track
    636        1.1  jdolecek 	 * of the current uio offset.
    637        1.1  jdolecek 	 * give up at the first sign of trouble.
    638        1.1  jdolecek 	 */
    639        1.1  jdolecek 
    640        1.1  jdolecek 	uio.uio_offset = 0;
    641       1.16      yamt 	UIO_SETUP_SYSSPACE(&uio);
    642        1.1  jdolecek 
    643        1.1  jdolecek 	VOP_UNLOCK(fvp, 0);			/* XXX */
    644        1.1  jdolecek 	vn_lock(fvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    645        1.1  jdolecek 	VOP_UNLOCK(tvp, 0);			/* XXX */
    646        1.1  jdolecek 	vn_lock(tvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    647        1.1  jdolecek 
    648       1.13  christos 	tbuf = malloc(MAXBSIZE, M_TEMP, M_WAITOK);
    649        1.1  jdolecek 
    650        1.1  jdolecek 	/* ugly loop follows... */
    651        1.1  jdolecek 	do {
    652        1.1  jdolecek 		off_t offset = uio.uio_offset;
    653        1.1  jdolecek 
    654        1.1  jdolecek 		uio.uio_iov = &iov;
    655        1.1  jdolecek 		uio.uio_iovcnt = 1;
    656       1.13  christos 		iov.iov_base = tbuf;
    657        1.1  jdolecek 		iov.iov_len = MAXBSIZE;
    658        1.1  jdolecek 		uio.uio_resid = iov.iov_len;
    659        1.1  jdolecek 		uio.uio_rw = UIO_READ;
    660        1.1  jdolecek 		error = VOP_READ(fvp, &uio, 0, cred);
    661        1.1  jdolecek 
    662        1.1  jdolecek 		if (error == 0) {
    663        1.1  jdolecek 			uio.uio_iov = &iov;
    664        1.1  jdolecek 			uio.uio_iovcnt = 1;
    665       1.13  christos 			iov.iov_base = tbuf;
    666        1.1  jdolecek 			iov.iov_len = MAXBSIZE - uio.uio_resid;
    667        1.1  jdolecek 			uio.uio_offset = offset;
    668        1.1  jdolecek 			uio.uio_rw = UIO_WRITE;
    669        1.1  jdolecek 			uio.uio_resid = iov.iov_len;
    670        1.1  jdolecek 
    671        1.1  jdolecek 			if (uio.uio_resid == 0)
    672        1.1  jdolecek 				break;
    673        1.1  jdolecek 
    674        1.1  jdolecek 			do {
    675        1.1  jdolecek 				error = VOP_WRITE(tvp, &uio, 0, cred);
    676        1.1  jdolecek 			} while ((uio.uio_resid > 0) && (error == 0));
    677        1.1  jdolecek 		}
    678        1.1  jdolecek 
    679        1.1  jdolecek 	} while (error == 0);
    680        1.1  jdolecek 
    681       1.13  christos 	free(tbuf, M_TEMP);
    682        1.1  jdolecek 	return (error);
    683        1.1  jdolecek }
    684        1.1  jdolecek 
    685        1.1  jdolecek /*
    686        1.1  jdolecek  * (un) is assumed to be locked on entry and remains
    687        1.1  jdolecek  * locked on exit.
    688        1.1  jdolecek  */
    689        1.1  jdolecek int
    690       1.32      matt union_copyup(struct union_node *un, int docopy, kauth_cred_t cred,
    691       1.32      matt 	struct lwp *l)
    692        1.1  jdolecek {
    693        1.1  jdolecek 	int error;
    694        1.1  jdolecek 	struct vnode *lvp, *uvp;
    695        1.1  jdolecek 	struct vattr lvattr, uvattr;
    696        1.1  jdolecek 
    697       1.15  christos 	error = union_vn_create(&uvp, un, l);
    698       1.25   hannken 	if (error)
    699        1.1  jdolecek 		return (error);
    700        1.1  jdolecek 
    701        1.1  jdolecek 	/* at this point, uppervp is locked */
    702        1.1  jdolecek 	union_newupper(un, uvp);
    703        1.1  jdolecek 	un->un_flags |= UN_ULOCK;
    704        1.1  jdolecek 
    705        1.1  jdolecek 	lvp = un->un_lowervp;
    706        1.1  jdolecek 
    707        1.1  jdolecek 	if (docopy) {
    708        1.1  jdolecek 		/*
    709        1.1  jdolecek 		 * XX - should not ignore errors
    710        1.1  jdolecek 		 * from VOP_CLOSE
    711        1.1  jdolecek 		 */
    712        1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    713        1.1  jdolecek 
    714       1.29     pooka         	error = VOP_GETATTR(lvp, &lvattr, cred);
    715        1.1  jdolecek 		if (error == 0)
    716       1.29     pooka 			error = VOP_OPEN(lvp, FREAD, cred);
    717        1.1  jdolecek 		if (error == 0) {
    718       1.15  christos 			error = union_copyfile(lvp, uvp, cred, l);
    719       1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    720        1.1  jdolecek 		}
    721        1.1  jdolecek 		if (error == 0) {
    722        1.1  jdolecek 			/* Copy permissions up too */
    723        1.1  jdolecek 			VATTR_NULL(&uvattr);
    724        1.1  jdolecek 			uvattr.va_mode = lvattr.va_mode;
    725        1.1  jdolecek 			uvattr.va_flags = lvattr.va_flags;
    726       1.29     pooka         		error = VOP_SETATTR(uvp, &uvattr, cred);
    727        1.1  jdolecek 		}
    728        1.1  jdolecek 		VOP_UNLOCK(lvp, 0);
    729        1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    730        1.1  jdolecek 		if (error == 0)
    731        1.1  jdolecek 			uprintf("union: copied up %s\n", un->un_path);
    732        1.1  jdolecek #endif
    733        1.1  jdolecek 
    734        1.1  jdolecek 	}
    735       1.15  christos 	union_vn_close(uvp, FWRITE, cred, l);
    736        1.1  jdolecek 
    737        1.1  jdolecek 	/*
    738        1.1  jdolecek 	 * Subsequent IOs will go to the top layer, so
    739        1.1  jdolecek 	 * call close on the lower vnode and open on the
    740        1.1  jdolecek 	 * upper vnode to ensure that the filesystem keeps
    741        1.1  jdolecek 	 * its references counts right.  This doesn't do
    742        1.1  jdolecek 	 * the right thing with (cred) and (FREAD) though.
    743        1.1  jdolecek 	 * Ignoring error returns is not right, either.
    744        1.1  jdolecek 	 */
    745        1.1  jdolecek 	if (error == 0) {
    746        1.1  jdolecek 		int i;
    747        1.1  jdolecek 
    748        1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    749        1.1  jdolecek 		for (i = 0; i < un->un_openl; i++) {
    750       1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    751       1.29     pooka 			(void) VOP_OPEN(uvp, FREAD, cred);
    752        1.1  jdolecek 		}
    753        1.1  jdolecek 		un->un_openl = 0;
    754        1.1  jdolecek 		VOP_UNLOCK(lvp, 0);
    755        1.1  jdolecek 	}
    756        1.1  jdolecek 
    757        1.1  jdolecek 	return (error);
    758        1.1  jdolecek 
    759        1.1  jdolecek }
    760        1.1  jdolecek 
    761        1.1  jdolecek static int
    762       1.32      matt union_relookup(
    763       1.32      matt 	struct union_mount *um,
    764       1.32      matt 	struct vnode *dvp,
    765       1.32      matt 	struct vnode **vpp,
    766       1.32      matt 	struct componentname *cnp,
    767       1.32      matt 	struct componentname *cn,
    768       1.32      matt 	const char *path,
    769       1.32      matt 	int pathlen)
    770        1.1  jdolecek {
    771        1.1  jdolecek 	int error;
    772        1.1  jdolecek 
    773        1.1  jdolecek 	/*
    774        1.1  jdolecek 	 * A new componentname structure must be faked up because
    775        1.1  jdolecek 	 * there is no way to know where the upper level cnp came
    776        1.1  jdolecek 	 * from or what it is being used for.  This must duplicate
    777        1.1  jdolecek 	 * some of the work done by NDINIT, some of the work done
    778        1.1  jdolecek 	 * by namei, some of the work done by lookup and some of
    779        1.1  jdolecek 	 * the work done by VOP_LOOKUP when given a CREATE flag.
    780        1.1  jdolecek 	 * Conclusion: Horrible.
    781        1.1  jdolecek 	 *
    782        1.1  jdolecek 	 * The pathname buffer will be PNBUF_PUT'd by VOP_MKDIR.
    783        1.1  jdolecek 	 */
    784        1.1  jdolecek 	cn->cn_namelen = pathlen;
    785        1.1  jdolecek 	if ((cn->cn_namelen + 1) > MAXPATHLEN)
    786        1.1  jdolecek 		return (ENAMETOOLONG);
    787        1.1  jdolecek 	cn->cn_pnbuf = PNBUF_GET();
    788        1.1  jdolecek 	memcpy(cn->cn_pnbuf, path, cn->cn_namelen);
    789        1.1  jdolecek 	cn->cn_pnbuf[cn->cn_namelen] = '\0';
    790        1.1  jdolecek 
    791        1.1  jdolecek 	cn->cn_nameiop = CREATE;
    792       1.24       chs 	cn->cn_flags = (LOCKPARENT|HASBUF|SAVENAME|ISLASTCN);
    793        1.1  jdolecek 	if (um->um_op == UNMNT_ABOVE)
    794        1.1  jdolecek 		cn->cn_cred = cnp->cn_cred;
    795        1.1  jdolecek 	else
    796        1.1  jdolecek 		cn->cn_cred = um->um_cred;
    797        1.1  jdolecek 	cn->cn_nameptr = cn->cn_pnbuf;
    798        1.1  jdolecek 	cn->cn_hash = cnp->cn_hash;
    799        1.1  jdolecek 	cn->cn_consume = cnp->cn_consume;
    800        1.1  jdolecek 
    801        1.1  jdolecek 	error = relookup(dvp, vpp, cn);
    802       1.22       chs 	if (error) {
    803        1.1  jdolecek 		PNBUF_PUT(cn->cn_pnbuf);
    804        1.1  jdolecek 		cn->cn_pnbuf = 0;
    805        1.1  jdolecek 	}
    806        1.1  jdolecek 
    807        1.1  jdolecek 	return (error);
    808        1.1  jdolecek }
    809        1.1  jdolecek 
    810        1.1  jdolecek /*
    811        1.1  jdolecek  * Create a shadow directory in the upper layer.
    812        1.1  jdolecek  * The new vnode is returned locked.
    813        1.1  jdolecek  *
    814        1.1  jdolecek  * (um) points to the union mount structure for access to the
    815        1.1  jdolecek  * the mounting process's credentials.
    816        1.1  jdolecek  * (dvp) is the directory in which to create the shadow directory.
    817        1.1  jdolecek  * it is unlocked on entry and exit.
    818        1.1  jdolecek  * (cnp) is the componentname to be created.
    819        1.1  jdolecek  * (vpp) is the returned newly created shadow directory, which
    820        1.1  jdolecek  * is returned locked.
    821        1.1  jdolecek  *
    822        1.1  jdolecek  * N.B. We still attempt to create shadow directories even if the union
    823        1.1  jdolecek  * is mounted read-only, which is a little nonintuitive.
    824        1.1  jdolecek  */
    825        1.1  jdolecek int
    826       1.32      matt union_mkshadow(struct union_mount *um, struct vnode *dvp,
    827       1.32      matt 	struct componentname *cnp, struct vnode **vpp)
    828        1.1  jdolecek {
    829        1.1  jdolecek 	int error;
    830        1.1  jdolecek 	struct vattr va;
    831        1.1  jdolecek 	struct componentname cn;
    832        1.1  jdolecek 
    833       1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    834        1.1  jdolecek 	error = union_relookup(um, dvp, vpp, cnp, &cn,
    835        1.1  jdolecek 			cnp->cn_nameptr, cnp->cn_namelen);
    836        1.8   hannken 	if (error) {
    837       1.22       chs 		VOP_UNLOCK(dvp, 0);
    838        1.1  jdolecek 		return (error);
    839        1.8   hannken 	}
    840        1.1  jdolecek 
    841        1.1  jdolecek 	if (*vpp) {
    842        1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    843       1.24       chs 		if (dvp != *vpp)
    844       1.24       chs 			VOP_UNLOCK(dvp, 0);
    845       1.22       chs 		vput(*vpp);
    846        1.1  jdolecek 		*vpp = NULLVP;
    847        1.1  jdolecek 		return (EEXIST);
    848        1.1  jdolecek 	}
    849        1.1  jdolecek 
    850        1.1  jdolecek 	/*
    851        1.1  jdolecek 	 * policy: when creating the shadow directory in the
    852        1.1  jdolecek 	 * upper layer, create it owned by the user who did
    853        1.1  jdolecek 	 * the mount, group from parent directory, and mode
    854        1.1  jdolecek 	 * 777 modified by umask (ie mostly identical to the
    855        1.1  jdolecek 	 * mkdir syscall).  (jsp, kb)
    856        1.1  jdolecek 	 */
    857        1.1  jdolecek 
    858        1.1  jdolecek 	VATTR_NULL(&va);
    859        1.1  jdolecek 	va.va_type = VDIR;
    860        1.1  jdolecek 	va.va_mode = um->um_cmode;
    861        1.1  jdolecek 
    862       1.24       chs 	vref(dvp);
    863        1.1  jdolecek 	error = VOP_MKDIR(dvp, vpp, &cn, &va);
    864        1.1  jdolecek 	return (error);
    865        1.1  jdolecek }
    866        1.1  jdolecek 
    867        1.1  jdolecek /*
    868        1.1  jdolecek  * Create a whiteout entry in the upper layer.
    869        1.1  jdolecek  *
    870        1.1  jdolecek  * (um) points to the union mount structure for access to the
    871        1.1  jdolecek  * the mounting process's credentials.
    872        1.1  jdolecek  * (dvp) is the directory in which to create the whiteout.
    873        1.1  jdolecek  * it is locked on entry and exit.
    874        1.1  jdolecek  * (cnp) is the componentname to be created.
    875        1.1  jdolecek  */
    876        1.1  jdolecek int
    877       1.32      matt union_mkwhiteout(struct union_mount *um, struct vnode *dvp,
    878       1.32      matt 	struct componentname *cnp, char *path)
    879        1.1  jdolecek {
    880        1.1  jdolecek 	int error;
    881        1.1  jdolecek 	struct vnode *wvp;
    882        1.1  jdolecek 	struct componentname cn;
    883        1.1  jdolecek 
    884        1.1  jdolecek 	VOP_UNLOCK(dvp, 0);
    885       1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    886        1.1  jdolecek 	error = union_relookup(um, dvp, &wvp, cnp, &cn, path, strlen(path));
    887       1.25   hannken 	if (error)
    888        1.1  jdolecek 		return (error);
    889        1.1  jdolecek 
    890        1.1  jdolecek 	if (wvp) {
    891        1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    892       1.24       chs 		if (dvp != wvp)
    893       1.24       chs 			VOP_UNLOCK(dvp, 0);
    894       1.22       chs 		vput(wvp);
    895        1.1  jdolecek 		return (EEXIST);
    896        1.1  jdolecek 	}
    897        1.1  jdolecek 
    898        1.1  jdolecek 	error = VOP_WHITEOUT(dvp, &cn, CREATE);
    899        1.1  jdolecek 	if (error)
    900        1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    901        1.1  jdolecek 
    902        1.1  jdolecek 	return (error);
    903        1.1  jdolecek }
    904        1.1  jdolecek 
    905        1.1  jdolecek /*
    906        1.1  jdolecek  * union_vn_create: creates and opens a new shadow file
    907        1.1  jdolecek  * on the upper union layer.  this function is similar
    908        1.1  jdolecek  * in spirit to calling vn_open but it avoids calling namei().
    909        1.1  jdolecek  * the problem with calling namei is that a) it locks too many
    910        1.1  jdolecek  * things, and b) it doesn't start at the "right" directory,
    911        1.1  jdolecek  * whereas relookup is told where to start.
    912        1.1  jdolecek  */
    913        1.1  jdolecek int
    914       1.32      matt union_vn_create(struct vnode **vpp, struct union_node *un, struct lwp *l)
    915        1.1  jdolecek {
    916        1.1  jdolecek 	struct vnode *vp;
    917       1.19        ad 	kauth_cred_t cred = l->l_cred;
    918        1.1  jdolecek 	struct vattr vat;
    919        1.1  jdolecek 	struct vattr *vap = &vat;
    920        1.1  jdolecek 	int fmode = FFLAGS(O_WRONLY|O_CREAT|O_TRUNC|O_EXCL);
    921        1.1  jdolecek 	int error;
    922       1.15  christos 	int cmode = UN_FILEMODE & ~l->l_proc->p_cwdi->cwdi_cmask;
    923        1.1  jdolecek 	struct componentname cn;
    924        1.1  jdolecek 
    925        1.1  jdolecek 	*vpp = NULLVP;
    926        1.1  jdolecek 
    927        1.1  jdolecek 	/*
    928        1.1  jdolecek 	 * Build a new componentname structure (for the same
    929        1.1  jdolecek 	 * reasons outlines in union_mkshadow).
    930        1.1  jdolecek 	 * The difference here is that the file is owned by
    931        1.1  jdolecek 	 * the current user, rather than by the person who
    932        1.1  jdolecek 	 * did the mount, since the current user needs to be
    933        1.1  jdolecek 	 * able to write the file (that's why it is being
    934        1.1  jdolecek 	 * copied in the first place).
    935        1.1  jdolecek 	 */
    936        1.1  jdolecek 	cn.cn_namelen = strlen(un->un_path);
    937        1.1  jdolecek 	if ((cn.cn_namelen + 1) > MAXPATHLEN)
    938        1.1  jdolecek 		return (ENAMETOOLONG);
    939        1.1  jdolecek 	cn.cn_pnbuf = PNBUF_GET();
    940        1.1  jdolecek 	memcpy(cn.cn_pnbuf, un->un_path, cn.cn_namelen+1);
    941        1.1  jdolecek 	cn.cn_nameiop = CREATE;
    942       1.24       chs 	cn.cn_flags = (LOCKPARENT|HASBUF|SAVENAME|ISLASTCN);
    943       1.19        ad 	cn.cn_cred = l->l_cred;
    944        1.1  jdolecek 	cn.cn_nameptr = cn.cn_pnbuf;
    945        1.1  jdolecek 	cn.cn_hash = un->un_hash;
    946        1.1  jdolecek 	cn.cn_consume = 0;
    947        1.1  jdolecek 
    948       1.24       chs 	vn_lock(un->un_dirvp, LK_EXCLUSIVE | LK_RETRY);
    949       1.22       chs 	error = relookup(un->un_dirvp, &vp, &cn);
    950       1.22       chs 	if (error) {
    951       1.24       chs 		VOP_UNLOCK(un->un_dirvp, 0);
    952        1.1  jdolecek 		return (error);
    953       1.22       chs 	}
    954        1.1  jdolecek 
    955        1.1  jdolecek 	if (vp) {
    956        1.1  jdolecek 		VOP_ABORTOP(un->un_dirvp, &cn);
    957       1.24       chs 		if (un->un_dirvp != vp)
    958       1.24       chs 			VOP_UNLOCK(un->un_dirvp, 0);
    959       1.22       chs 		vput(vp);
    960        1.1  jdolecek 		return (EEXIST);
    961        1.1  jdolecek 	}
    962        1.1  jdolecek 
    963        1.1  jdolecek 	/*
    964        1.1  jdolecek 	 * Good - there was no race to create the file
    965        1.1  jdolecek 	 * so go ahead and create it.  The permissions
    966        1.1  jdolecek 	 * on the file will be 0666 modified by the
    967        1.1  jdolecek 	 * current user's umask.  Access to the file, while
    968        1.1  jdolecek 	 * it is unioned, will require access to the top *and*
    969        1.1  jdolecek 	 * bottom files.  Access when not unioned will simply
    970        1.1  jdolecek 	 * require access to the top-level file.
    971        1.1  jdolecek 	 * TODO: confirm choice of access permissions.
    972        1.1  jdolecek 	 */
    973        1.1  jdolecek 	VATTR_NULL(vap);
    974        1.1  jdolecek 	vap->va_type = VREG;
    975        1.1  jdolecek 	vap->va_mode = cmode;
    976       1.24       chs 	vref(un->un_dirvp);
    977        1.1  jdolecek 	if ((error = VOP_CREATE(un->un_dirvp, &vp, &cn, vap)) != 0)
    978        1.1  jdolecek 		return (error);
    979        1.1  jdolecek 
    980       1.29     pooka 	if ((error = VOP_OPEN(vp, fmode, cred)) != 0) {
    981        1.1  jdolecek 		vput(vp);
    982        1.1  jdolecek 		return (error);
    983        1.1  jdolecek 	}
    984        1.1  jdolecek 
    985        1.1  jdolecek 	vp->v_writecount++;
    986        1.1  jdolecek 	*vpp = vp;
    987        1.1  jdolecek 	return (0);
    988        1.1  jdolecek }
    989        1.1  jdolecek 
    990        1.1  jdolecek int
    991       1.32      matt union_vn_close(struct vnode *vp, int fmode, kauth_cred_t cred, struct lwp *l)
    992        1.1  jdolecek {
    993        1.1  jdolecek 
    994        1.1  jdolecek 	if (fmode & FWRITE)
    995        1.1  jdolecek 		--vp->v_writecount;
    996       1.29     pooka 	return (VOP_CLOSE(vp, fmode, cred));
    997        1.1  jdolecek }
    998        1.1  jdolecek 
    999        1.1  jdolecek void
   1000       1.32      matt union_removed_upper(struct union_node *un)
   1001        1.1  jdolecek {
   1002        1.1  jdolecek #if 1
   1003        1.1  jdolecek 	/*
   1004        1.1  jdolecek 	 * We do not set the uppervp to NULLVP here, because lowervp
   1005        1.1  jdolecek 	 * may also be NULLVP, so this routine would end up creating
   1006        1.1  jdolecek 	 * a bogus union node with no upper or lower VP (that causes
   1007        1.1  jdolecek 	 * pain in many places that assume at least one VP exists).
   1008        1.1  jdolecek 	 * Since we've removed this node from the cache hash chains,
   1009        1.1  jdolecek 	 * it won't be found again.  When all current holders
   1010        1.1  jdolecek 	 * release it, union_inactive() will vgone() it.
   1011        1.1  jdolecek 	 */
   1012        1.1  jdolecek 	union_diruncache(un);
   1013        1.1  jdolecek #else
   1014        1.1  jdolecek 	union_newupper(un, NULLVP);
   1015        1.1  jdolecek #endif
   1016        1.1  jdolecek 
   1017        1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
   1018        1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
   1019        1.1  jdolecek 		LIST_REMOVE(un, un_cache);
   1020        1.1  jdolecek 	}
   1021        1.1  jdolecek 
   1022        1.1  jdolecek 	if (un->un_flags & UN_ULOCK) {
   1023        1.1  jdolecek 		un->un_flags &= ~UN_ULOCK;
   1024        1.1  jdolecek 		VOP_UNLOCK(un->un_uppervp, 0);
   1025        1.1  jdolecek 	}
   1026        1.1  jdolecek }
   1027        1.1  jdolecek 
   1028        1.1  jdolecek #if 0
   1029        1.1  jdolecek struct vnode *
   1030       1.32      matt union_lowervp(struct vnode *vp)
   1031        1.1  jdolecek {
   1032        1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
   1033        1.1  jdolecek 
   1034        1.1  jdolecek 	if ((un->un_lowervp != NULLVP) &&
   1035        1.1  jdolecek 	    (vp->v_type == un->un_lowervp->v_type)) {
   1036        1.1  jdolecek 		if (vget(un->un_lowervp, 0) == 0)
   1037        1.1  jdolecek 			return (un->un_lowervp);
   1038        1.1  jdolecek 	}
   1039        1.1  jdolecek 
   1040        1.1  jdolecek 	return (NULLVP);
   1041        1.1  jdolecek }
   1042        1.1  jdolecek #endif
   1043        1.1  jdolecek 
   1044        1.1  jdolecek /*
   1045        1.1  jdolecek  * determine whether a whiteout is needed
   1046        1.1  jdolecek  * during a remove/rmdir operation.
   1047        1.1  jdolecek  */
   1048        1.1  jdolecek int
   1049       1.32      matt union_dowhiteout(struct union_node *un, kauth_cred_t cred)
   1050        1.1  jdolecek {
   1051        1.1  jdolecek 	struct vattr va;
   1052        1.1  jdolecek 
   1053        1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1054        1.1  jdolecek 		return (1);
   1055        1.1  jdolecek 
   1056       1.29     pooka 	if (VOP_GETATTR(un->un_uppervp, &va, cred) == 0 &&
   1057        1.1  jdolecek 	    (va.va_flags & OPAQUE))
   1058        1.1  jdolecek 		return (1);
   1059        1.1  jdolecek 
   1060        1.1  jdolecek 	return (0);
   1061        1.1  jdolecek }
   1062        1.1  jdolecek 
   1063        1.1  jdolecek static void
   1064       1.32      matt union_dircache_r(struct vnode *vp, struct vnode ***vppp, int *cntp)
   1065        1.1  jdolecek {
   1066        1.1  jdolecek 	struct union_node *un;
   1067        1.1  jdolecek 
   1068        1.1  jdolecek 	if (vp->v_op != union_vnodeop_p) {
   1069        1.1  jdolecek 		if (vppp) {
   1070        1.1  jdolecek 			VREF(vp);
   1071        1.1  jdolecek 			*(*vppp)++ = vp;
   1072        1.1  jdolecek 			if (--(*cntp) == 0)
   1073        1.1  jdolecek 				panic("union: dircache table too small");
   1074        1.1  jdolecek 		} else {
   1075        1.1  jdolecek 			(*cntp)++;
   1076        1.1  jdolecek 		}
   1077        1.1  jdolecek 
   1078        1.1  jdolecek 		return;
   1079        1.1  jdolecek 	}
   1080        1.1  jdolecek 
   1081        1.1  jdolecek 	un = VTOUNION(vp);
   1082        1.1  jdolecek 	if (un->un_uppervp != NULLVP)
   1083        1.1  jdolecek 		union_dircache_r(un->un_uppervp, vppp, cntp);
   1084        1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1085        1.1  jdolecek 		union_dircache_r(un->un_lowervp, vppp, cntp);
   1086        1.1  jdolecek }
   1087        1.1  jdolecek 
   1088        1.1  jdolecek struct vnode *
   1089       1.21  christos union_dircache(struct vnode *vp, struct lwp *l)
   1090        1.1  jdolecek {
   1091        1.1  jdolecek 	int cnt;
   1092        1.1  jdolecek 	struct vnode *nvp = NULLVP;
   1093        1.1  jdolecek 	struct vnode **vpp;
   1094        1.1  jdolecek 	struct vnode **dircache;
   1095        1.1  jdolecek 	int error;
   1096        1.1  jdolecek 
   1097        1.1  jdolecek 	vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
   1098        1.1  jdolecek 	dircache = VTOUNION(vp)->un_dircache;
   1099        1.1  jdolecek 
   1100        1.1  jdolecek 	nvp = NULLVP;
   1101        1.1  jdolecek 
   1102        1.1  jdolecek 	if (dircache == 0) {
   1103        1.1  jdolecek 		cnt = 0;
   1104        1.1  jdolecek 		union_dircache_r(vp, 0, &cnt);
   1105        1.1  jdolecek 		cnt++;
   1106        1.1  jdolecek 		dircache = (struct vnode **)
   1107        1.1  jdolecek 				malloc(cnt * sizeof(struct vnode *),
   1108        1.1  jdolecek 					M_TEMP, M_WAITOK);
   1109        1.1  jdolecek 		vpp = dircache;
   1110        1.1  jdolecek 		union_dircache_r(vp, &vpp, &cnt);
   1111        1.1  jdolecek 		VTOUNION(vp)->un_dircache = dircache;
   1112        1.1  jdolecek 		*vpp = NULLVP;
   1113        1.1  jdolecek 		vpp = dircache + 1;
   1114        1.1  jdolecek 	} else {
   1115        1.1  jdolecek 		vpp = dircache;
   1116        1.1  jdolecek 		do {
   1117        1.1  jdolecek 			if (*vpp++ == VTOUNION(vp)->un_uppervp)
   1118        1.1  jdolecek 				break;
   1119        1.1  jdolecek 		} while (*vpp != NULLVP);
   1120        1.1  jdolecek 	}
   1121        1.1  jdolecek 
   1122        1.1  jdolecek 	if (*vpp == NULLVP)
   1123        1.1  jdolecek 		goto out;
   1124        1.1  jdolecek 
   1125        1.1  jdolecek 	vn_lock(*vpp, LK_EXCLUSIVE | LK_RETRY);
   1126        1.1  jdolecek 	VREF(*vpp);
   1127        1.5   thorpej 	error = union_allocvp(&nvp, vp->v_mount, NULLVP, NULLVP, 0, *vpp, NULLVP, 0);
   1128        1.1  jdolecek 	if (!error) {
   1129        1.1  jdolecek 		VTOUNION(vp)->un_dircache = 0;
   1130        1.1  jdolecek 		VTOUNION(nvp)->un_dircache = dircache;
   1131        1.1  jdolecek 	}
   1132        1.1  jdolecek 
   1133        1.1  jdolecek out:
   1134        1.1  jdolecek 	VOP_UNLOCK(vp, 0);
   1135        1.1  jdolecek 	return (nvp);
   1136        1.1  jdolecek }
   1137        1.1  jdolecek 
   1138        1.1  jdolecek void
   1139       1.32      matt union_diruncache(struct union_node *un)
   1140        1.1  jdolecek {
   1141        1.1  jdolecek 	struct vnode **vpp;
   1142        1.1  jdolecek 
   1143        1.1  jdolecek 	if (un->un_dircache != 0) {
   1144        1.1  jdolecek 		for (vpp = un->un_dircache; *vpp != NULLVP; vpp++)
   1145        1.1  jdolecek 			vrele(*vpp);
   1146        1.1  jdolecek 		free(un->un_dircache, M_TEMP);
   1147        1.1  jdolecek 		un->un_dircache = 0;
   1148        1.1  jdolecek 	}
   1149        1.2  jdolecek }
   1150        1.2  jdolecek 
   1151        1.2  jdolecek /*
   1152        1.2  jdolecek  * This hook is called from vn_readdir() to switch to lower directory
   1153        1.2  jdolecek  * entry after the upper directory is read.
   1154        1.2  jdolecek  */
   1155        1.2  jdolecek int
   1156       1.15  christos union_readdirhook(struct vnode **vpp, struct file *fp, struct lwp *l)
   1157        1.2  jdolecek {
   1158        1.2  jdolecek 	struct vnode *vp = *vpp, *lvp;
   1159        1.2  jdolecek 	struct vattr va;
   1160        1.2  jdolecek 	int error;
   1161        1.2  jdolecek 
   1162        1.2  jdolecek 	if (vp->v_op != union_vnodeop_p)
   1163        1.2  jdolecek 		return (0);
   1164        1.2  jdolecek 
   1165       1.15  christos 	if ((lvp = union_dircache(vp, l)) == NULLVP)
   1166        1.2  jdolecek 		return (0);
   1167        1.2  jdolecek 
   1168        1.2  jdolecek 	/*
   1169        1.2  jdolecek 	 * If the directory is opaque,
   1170        1.2  jdolecek 	 * then don't show lower entries
   1171        1.2  jdolecek 	 */
   1172       1.29     pooka 	error = VOP_GETATTR(vp, &va, fp->f_cred);
   1173        1.2  jdolecek 	if (error || (va.va_flags & OPAQUE)) {
   1174        1.2  jdolecek 		vput(lvp);
   1175        1.2  jdolecek 		return (error);
   1176        1.2  jdolecek 	}
   1177       1.12     perry 
   1178       1.29     pooka 	error = VOP_OPEN(lvp, FREAD, fp->f_cred);
   1179        1.2  jdolecek 	if (error) {
   1180        1.2  jdolecek 		vput(lvp);
   1181        1.2  jdolecek 		return (error);
   1182        1.2  jdolecek 	}
   1183        1.2  jdolecek 	VOP_UNLOCK(lvp, 0);
   1184       1.10       jrf 	fp->f_data = lvp;
   1185        1.2  jdolecek 	fp->f_offset = 0;
   1186       1.33        ad 	error = vn_close(vp, FREAD, fp->f_cred);
   1187        1.2  jdolecek 	if (error)
   1188        1.2  jdolecek 		return (error);
   1189        1.2  jdolecek 	*vpp = lvp;
   1190        1.2  jdolecek 	return (0);
   1191        1.1  jdolecek }
   1192