Home | History | Annotate | Line # | Download | only in union
union_subr.c revision 1.35
      1  1.35     pooka /*	$NetBSD: union_subr.c,v 1.35 2010/01/08 11:35:09 pooka Exp $	*/
      2   1.1  jdolecek 
      3   1.1  jdolecek /*
      4   1.1  jdolecek  * Copyright (c) 1994
      5   1.1  jdolecek  *	The Regents of the University of California.  All rights reserved.
      6   1.1  jdolecek  *
      7   1.1  jdolecek  * This code is derived from software contributed to Berkeley by
      8   1.1  jdolecek  * Jan-Simon Pendry.
      9   1.1  jdolecek  *
     10   1.1  jdolecek  * Redistribution and use in source and binary forms, with or without
     11   1.1  jdolecek  * modification, are permitted provided that the following conditions
     12   1.1  jdolecek  * are met:
     13   1.1  jdolecek  * 1. Redistributions of source code must retain the above copyright
     14   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer.
     15   1.1  jdolecek  * 2. Redistributions in binary form must reproduce the above copyright
     16   1.1  jdolecek  *    notice, this list of conditions and the following disclaimer in the
     17   1.1  jdolecek  *    documentation and/or other materials provided with the distribution.
     18   1.7       agc  * 3. Neither the name of the University nor the names of its contributors
     19   1.7       agc  *    may be used to endorse or promote products derived from this software
     20   1.7       agc  *    without specific prior written permission.
     21   1.7       agc  *
     22   1.7       agc  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     23   1.7       agc  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     24   1.7       agc  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     25   1.7       agc  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     26   1.7       agc  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     27   1.7       agc  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     28   1.7       agc  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     29   1.7       agc  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     30   1.7       agc  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     31   1.7       agc  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     32   1.7       agc  * SUCH DAMAGE.
     33   1.7       agc  *
     34   1.7       agc  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     35   1.7       agc  */
     36   1.7       agc 
     37   1.7       agc /*
     38   1.7       agc  * Copyright (c) 1994 Jan-Simon Pendry
     39   1.7       agc  *
     40   1.7       agc  * This code is derived from software contributed to Berkeley by
     41   1.7       agc  * Jan-Simon Pendry.
     42   1.7       agc  *
     43   1.7       agc  * Redistribution and use in source and binary forms, with or without
     44   1.7       agc  * modification, are permitted provided that the following conditions
     45   1.7       agc  * are met:
     46   1.7       agc  * 1. Redistributions of source code must retain the above copyright
     47   1.7       agc  *    notice, this list of conditions and the following disclaimer.
     48   1.7       agc  * 2. Redistributions in binary form must reproduce the above copyright
     49   1.7       agc  *    notice, this list of conditions and the following disclaimer in the
     50   1.7       agc  *    documentation and/or other materials provided with the distribution.
     51   1.1  jdolecek  * 3. All advertising materials mentioning features or use of this software
     52   1.1  jdolecek  *    must display the following acknowledgement:
     53   1.1  jdolecek  *	This product includes software developed by the University of
     54   1.1  jdolecek  *	California, Berkeley and its contributors.
     55   1.1  jdolecek  * 4. Neither the name of the University nor the names of its contributors
     56   1.1  jdolecek  *    may be used to endorse or promote products derived from this software
     57   1.1  jdolecek  *    without specific prior written permission.
     58   1.1  jdolecek  *
     59   1.1  jdolecek  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
     60   1.1  jdolecek  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
     61   1.1  jdolecek  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
     62   1.1  jdolecek  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
     63   1.1  jdolecek  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
     64   1.1  jdolecek  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
     65   1.1  jdolecek  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
     66   1.1  jdolecek  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
     67   1.1  jdolecek  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
     68   1.1  jdolecek  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
     69   1.1  jdolecek  * SUCH DAMAGE.
     70   1.1  jdolecek  *
     71   1.1  jdolecek  *	@(#)union_subr.c	8.20 (Berkeley) 5/20/95
     72   1.1  jdolecek  */
     73   1.1  jdolecek 
     74   1.1  jdolecek #include <sys/cdefs.h>
     75  1.35     pooka __KERNEL_RCSID(0, "$NetBSD: union_subr.c,v 1.35 2010/01/08 11:35:09 pooka Exp $");
     76   1.1  jdolecek 
     77   1.1  jdolecek #include <sys/param.h>
     78   1.1  jdolecek #include <sys/systm.h>
     79   1.1  jdolecek #include <sys/proc.h>
     80   1.1  jdolecek #include <sys/time.h>
     81   1.1  jdolecek #include <sys/kernel.h>
     82   1.1  jdolecek #include <sys/vnode.h>
     83   1.1  jdolecek #include <sys/namei.h>
     84   1.1  jdolecek #include <sys/malloc.h>
     85   1.1  jdolecek #include <sys/file.h>
     86   1.1  jdolecek #include <sys/filedesc.h>
     87   1.1  jdolecek #include <sys/queue.h>
     88   1.1  jdolecek #include <sys/mount.h>
     89   1.1  jdolecek #include <sys/stat.h>
     90  1.18      elad #include <sys/kauth.h>
     91   1.1  jdolecek 
     92   1.1  jdolecek #include <uvm/uvm_extern.h>
     93   1.1  jdolecek 
     94   1.1  jdolecek #include <fs/union/union.h>
     95   1.1  jdolecek 
     96   1.1  jdolecek /* must be power of two, otherwise change UNION_HASH() */
     97   1.1  jdolecek #define NHASH 32
     98   1.1  jdolecek 
     99   1.1  jdolecek /* unsigned int ... */
    100   1.1  jdolecek #define UNION_HASH(u, l) \
    101   1.1  jdolecek 	(((((unsigned long) (u)) + ((unsigned long) l)) >> 8) & (NHASH-1))
    102   1.1  jdolecek 
    103   1.1  jdolecek static LIST_HEAD(unhead, union_node) unhead[NHASH];
    104   1.1  jdolecek static int unvplock[NHASH];
    105   1.1  jdolecek 
    106  1.14   xtraeme static int union_list_lock(int);
    107  1.14   xtraeme static void union_list_unlock(int);
    108  1.14   xtraeme void union_updatevp(struct union_node *, struct vnode *, struct vnode *);
    109  1.14   xtraeme static int union_relookup(struct union_mount *, struct vnode *,
    110   1.1  jdolecek 			       struct vnode **, struct componentname *,
    111  1.14   xtraeme 			       struct componentname *, const char *, int);
    112  1.18      elad int union_vn_close(struct vnode *, int, kauth_cred_t, struct lwp *);
    113  1.14   xtraeme static void union_dircache_r(struct vnode *, struct vnode ***, int *);
    114  1.15  christos struct vnode *union_dircache(struct vnode *, struct lwp *);
    115   1.1  jdolecek 
    116   1.1  jdolecek void
    117  1.32      matt union_init(void)
    118   1.1  jdolecek {
    119   1.1  jdolecek 	int i;
    120   1.1  jdolecek 
    121   1.1  jdolecek 	for (i = 0; i < NHASH; i++)
    122   1.1  jdolecek 		LIST_INIT(&unhead[i]);
    123   1.9       jrf 	memset(unvplock, 0, sizeof(unvplock));
    124   1.1  jdolecek }
    125   1.1  jdolecek 
    126   1.1  jdolecek /*
    127   1.1  jdolecek  * Free global unionfs resources.
    128   1.1  jdolecek  */
    129   1.1  jdolecek void
    130  1.32      matt union_done(void)
    131   1.1  jdolecek {
    132  1.12     perry 
    133   1.2  jdolecek 	/* Make sure to unset the readdir hook. */
    134   1.2  jdolecek 	vn_union_readdir_hook = NULL;
    135   1.1  jdolecek }
    136   1.1  jdolecek 
    137   1.1  jdolecek static int
    138  1.32      matt union_list_lock(int ix)
    139   1.1  jdolecek {
    140   1.1  jdolecek 
    141   1.1  jdolecek 	if (unvplock[ix] & UN_LOCKED) {
    142   1.1  jdolecek 		unvplock[ix] |= UN_WANTED;
    143   1.1  jdolecek 		(void) tsleep(&unvplock[ix], PINOD, "unionlk", 0);
    144   1.1  jdolecek 		return (1);
    145   1.1  jdolecek 	}
    146   1.1  jdolecek 
    147   1.1  jdolecek 	unvplock[ix] |= UN_LOCKED;
    148   1.1  jdolecek 
    149   1.1  jdolecek 	return (0);
    150   1.1  jdolecek }
    151   1.1  jdolecek 
    152   1.1  jdolecek static void
    153  1.32      matt union_list_unlock(int ix)
    154   1.1  jdolecek {
    155   1.1  jdolecek 
    156   1.1  jdolecek 	unvplock[ix] &= ~UN_LOCKED;
    157   1.1  jdolecek 
    158   1.1  jdolecek 	if (unvplock[ix] & UN_WANTED) {
    159   1.1  jdolecek 		unvplock[ix] &= ~UN_WANTED;
    160   1.9       jrf 		wakeup(&unvplock[ix]);
    161   1.1  jdolecek 	}
    162   1.1  jdolecek }
    163   1.1  jdolecek 
    164   1.1  jdolecek void
    165  1.32      matt union_updatevp(struct union_node *un, struct vnode *uppervp,
    166  1.32      matt 	struct vnode *lowervp)
    167   1.1  jdolecek {
    168   1.1  jdolecek 	int ohash = UNION_HASH(un->un_uppervp, un->un_lowervp);
    169   1.1  jdolecek 	int nhash = UNION_HASH(uppervp, lowervp);
    170   1.1  jdolecek 	int docache = (lowervp != NULLVP || uppervp != NULLVP);
    171   1.1  jdolecek 	int lhash, uhash;
    172   1.1  jdolecek 
    173   1.1  jdolecek 	/*
    174   1.1  jdolecek 	 * Ensure locking is ordered from lower to higher
    175   1.1  jdolecek 	 * to avoid deadlocks.
    176   1.1  jdolecek 	 */
    177   1.1  jdolecek 	if (nhash < ohash) {
    178   1.1  jdolecek 		lhash = nhash;
    179   1.1  jdolecek 		uhash = ohash;
    180   1.1  jdolecek 	} else {
    181   1.1  jdolecek 		lhash = ohash;
    182   1.1  jdolecek 		uhash = nhash;
    183   1.1  jdolecek 	}
    184   1.1  jdolecek 
    185   1.1  jdolecek 	if (lhash != uhash)
    186   1.1  jdolecek 		while (union_list_lock(lhash))
    187   1.1  jdolecek 			continue;
    188   1.1  jdolecek 
    189   1.1  jdolecek 	while (union_list_lock(uhash))
    190   1.1  jdolecek 		continue;
    191   1.1  jdolecek 
    192   1.1  jdolecek 	if (ohash != nhash || !docache) {
    193   1.1  jdolecek 		if (un->un_flags & UN_CACHED) {
    194   1.1  jdolecek 			un->un_flags &= ~UN_CACHED;
    195   1.1  jdolecek 			LIST_REMOVE(un, un_cache);
    196   1.1  jdolecek 		}
    197   1.1  jdolecek 	}
    198   1.1  jdolecek 
    199   1.1  jdolecek 	if (ohash != nhash)
    200   1.1  jdolecek 		union_list_unlock(ohash);
    201   1.1  jdolecek 
    202   1.1  jdolecek 	if (un->un_lowervp != lowervp) {
    203   1.1  jdolecek 		if (un->un_lowervp) {
    204   1.1  jdolecek 			vrele(un->un_lowervp);
    205   1.1  jdolecek 			if (un->un_path) {
    206   1.1  jdolecek 				free(un->un_path, M_TEMP);
    207   1.1  jdolecek 				un->un_path = 0;
    208   1.1  jdolecek 			}
    209   1.1  jdolecek 			if (un->un_dirvp) {
    210   1.1  jdolecek 				vrele(un->un_dirvp);
    211   1.1  jdolecek 				un->un_dirvp = NULLVP;
    212   1.1  jdolecek 			}
    213   1.1  jdolecek 		}
    214   1.1  jdolecek 		un->un_lowervp = lowervp;
    215   1.1  jdolecek 		un->un_lowersz = VNOVAL;
    216   1.1  jdolecek 	}
    217   1.1  jdolecek 
    218   1.1  jdolecek 	if (un->un_uppervp != uppervp) {
    219   1.1  jdolecek 		if (un->un_uppervp)
    220   1.1  jdolecek 			vrele(un->un_uppervp);
    221   1.1  jdolecek 
    222   1.1  jdolecek 		un->un_uppervp = uppervp;
    223   1.1  jdolecek 		un->un_uppersz = VNOVAL;
    224   1.1  jdolecek 	}
    225   1.1  jdolecek 
    226   1.1  jdolecek 	if (docache && (ohash != nhash)) {
    227   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[nhash], un, un_cache);
    228   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    229   1.1  jdolecek 	}
    230   1.1  jdolecek 
    231   1.1  jdolecek 	union_list_unlock(nhash);
    232   1.1  jdolecek }
    233   1.1  jdolecek 
    234   1.1  jdolecek void
    235  1.32      matt union_newlower(struct union_node *un, struct vnode *lowervp)
    236   1.1  jdolecek {
    237   1.1  jdolecek 
    238   1.1  jdolecek 	union_updatevp(un, un->un_uppervp, lowervp);
    239   1.1  jdolecek }
    240   1.1  jdolecek 
    241   1.1  jdolecek void
    242  1.32      matt union_newupper(struct union_node *un, struct vnode *uppervp)
    243   1.1  jdolecek {
    244   1.1  jdolecek 
    245   1.1  jdolecek 	union_updatevp(un, uppervp, un->un_lowervp);
    246   1.1  jdolecek }
    247   1.1  jdolecek 
    248   1.1  jdolecek /*
    249   1.1  jdolecek  * Keep track of size changes in the underlying vnodes.
    250   1.1  jdolecek  * If the size changes, then callback to the vm layer
    251   1.1  jdolecek  * giving priority to the upper layer size.
    252   1.1  jdolecek  */
    253   1.1  jdolecek void
    254  1.32      matt union_newsize(struct vnode *vp, off_t uppersz, off_t lowersz)
    255   1.1  jdolecek {
    256   1.1  jdolecek 	struct union_node *un;
    257   1.1  jdolecek 	off_t sz;
    258   1.1  jdolecek 
    259   1.1  jdolecek 	/* only interested in regular files */
    260  1.26     pooka 	if (vp->v_type != VREG) {
    261  1.26     pooka 		uvm_vnp_setsize(vp, 0);
    262   1.1  jdolecek 		return;
    263  1.26     pooka 	}
    264   1.1  jdolecek 
    265   1.1  jdolecek 	un = VTOUNION(vp);
    266   1.1  jdolecek 	sz = VNOVAL;
    267   1.1  jdolecek 
    268   1.1  jdolecek 	if ((uppersz != VNOVAL) && (un->un_uppersz != uppersz)) {
    269   1.1  jdolecek 		un->un_uppersz = uppersz;
    270   1.1  jdolecek 		if (sz == VNOVAL)
    271   1.1  jdolecek 			sz = un->un_uppersz;
    272   1.1  jdolecek 	}
    273   1.1  jdolecek 
    274   1.1  jdolecek 	if ((lowersz != VNOVAL) && (un->un_lowersz != lowersz)) {
    275   1.1  jdolecek 		un->un_lowersz = lowersz;
    276   1.1  jdolecek 		if (sz == VNOVAL)
    277   1.1  jdolecek 			sz = un->un_lowersz;
    278   1.1  jdolecek 	}
    279   1.1  jdolecek 
    280   1.1  jdolecek 	if (sz != VNOVAL) {
    281   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    282   1.1  jdolecek 		printf("union: %s size now %qd\n",
    283   1.1  jdolecek 		    uppersz != VNOVAL ? "upper" : "lower", sz);
    284   1.1  jdolecek #endif
    285   1.1  jdolecek 		uvm_vnp_setsize(vp, sz);
    286   1.1  jdolecek 	}
    287   1.1  jdolecek }
    288   1.1  jdolecek 
    289   1.1  jdolecek /*
    290   1.1  jdolecek  * allocate a union_node/vnode pair.  the vnode is
    291   1.1  jdolecek  * referenced and locked.  the new vnode is returned
    292   1.1  jdolecek  * via (vpp).  (mp) is the mountpoint of the union filesystem,
    293   1.1  jdolecek  * (dvp) is the parent directory where the upper layer object
    294   1.1  jdolecek  * should exist (but doesn't) and (cnp) is the componentname
    295   1.1  jdolecek  * information which is partially copied to allow the upper
    296   1.1  jdolecek  * layer object to be created at a later time.  (uppervp)
    297   1.1  jdolecek  * and (lowervp) reference the upper and lower layer objects
    298   1.1  jdolecek  * being mapped.  either, but not both, can be nil.
    299   1.1  jdolecek  * if supplied, (uppervp) is locked.
    300   1.1  jdolecek  * the reference is either maintained in the new union_node
    301   1.1  jdolecek  * object which is allocated, or they are vrele'd.
    302   1.1  jdolecek  *
    303   1.1  jdolecek  * all union_nodes are maintained on a singly-linked
    304   1.1  jdolecek  * list.  new nodes are only allocated when they cannot
    305   1.1  jdolecek  * be found on this list.  entries on the list are
    306   1.1  jdolecek  * removed when the vfs reclaim entry is called.
    307   1.1  jdolecek  *
    308   1.1  jdolecek  * a single lock is kept for the entire list.  this is
    309   1.1  jdolecek  * needed because the getnewvnode() function can block
    310   1.1  jdolecek  * waiting for a vnode to become free, in which case there
    311   1.1  jdolecek  * may be more than one process trying to get the same
    312   1.1  jdolecek  * vnode.  this lock is only taken if we are going to
    313   1.1  jdolecek  * call getnewvnode, since the kernel itself is single-threaded.
    314   1.1  jdolecek  *
    315   1.1  jdolecek  * if an entry is found on the list, then call vget() to
    316   1.1  jdolecek  * take a reference.  this is done because there may be
    317   1.1  jdolecek  * zero references to it and so it needs to removed from
    318   1.1  jdolecek  * the vnode free list.
    319   1.1  jdolecek  */
    320   1.1  jdolecek int
    321  1.32      matt union_allocvp(
    322  1.32      matt 	struct vnode **vpp,
    323  1.32      matt 	struct mount *mp,
    324  1.32      matt 	struct vnode *undvp,		/* parent union vnode */
    325  1.32      matt 	struct vnode *dvp,		/* may be null */
    326  1.32      matt 	struct componentname *cnp,	/* may be null */
    327  1.32      matt 	struct vnode *uppervp,		/* may be null */
    328  1.32      matt 	struct vnode *lowervp,		/* may be null */
    329  1.32      matt 	int docache)
    330   1.1  jdolecek {
    331   1.1  jdolecek 	int error;
    332  1.26     pooka 	struct vattr va;
    333   1.1  jdolecek 	struct union_node *un = NULL;
    334   1.1  jdolecek 	struct vnode *xlowervp = NULLVP;
    335   1.1  jdolecek 	struct union_mount *um = MOUNTTOUNIONMOUNT(mp);
    336  1.26     pooka 	voff_t uppersz, lowersz;
    337   1.1  jdolecek 	int hash = 0;
    338  1.28        ad 	int vflag, iflag;
    339   1.1  jdolecek 	int try;
    340   1.1  jdolecek 
    341   1.1  jdolecek 	if (uppervp == NULLVP && lowervp == NULLVP)
    342   1.1  jdolecek 		panic("union: unidentifiable allocation");
    343   1.1  jdolecek 
    344   1.1  jdolecek 	if (uppervp && lowervp && (uppervp->v_type != lowervp->v_type)) {
    345   1.1  jdolecek 		xlowervp = lowervp;
    346   1.1  jdolecek 		lowervp = NULLVP;
    347   1.1  jdolecek 	}
    348   1.1  jdolecek 
    349   1.1  jdolecek 	/* detect the root vnode (and aliases) */
    350  1.28        ad 	iflag = VI_LAYER;
    351  1.28        ad 	vflag = 0;
    352   1.1  jdolecek 	if ((uppervp == um->um_uppervp) &&
    353   1.1  jdolecek 	    ((lowervp == NULLVP) || lowervp == um->um_lowervp)) {
    354   1.1  jdolecek 		if (lowervp == NULLVP) {
    355   1.1  jdolecek 			lowervp = um->um_lowervp;
    356   1.1  jdolecek 			if (lowervp != NULLVP)
    357  1.35     pooka 				vref(lowervp);
    358   1.1  jdolecek 		}
    359  1.28        ad 		iflag = 0;
    360  1.28        ad 		vflag = VV_ROOT;
    361   1.1  jdolecek 	}
    362   1.1  jdolecek 
    363   1.1  jdolecek loop:
    364   1.1  jdolecek 	if (!docache) {
    365   1.1  jdolecek 		un = 0;
    366   1.1  jdolecek 	} else for (try = 0; try < 3; try++) {
    367   1.1  jdolecek 		switch (try) {
    368   1.1  jdolecek 		case 0:
    369   1.1  jdolecek 			if (lowervp == NULLVP)
    370   1.1  jdolecek 				continue;
    371   1.1  jdolecek 			hash = UNION_HASH(uppervp, lowervp);
    372   1.1  jdolecek 			break;
    373   1.1  jdolecek 
    374   1.1  jdolecek 		case 1:
    375   1.1  jdolecek 			if (uppervp == NULLVP)
    376   1.1  jdolecek 				continue;
    377   1.1  jdolecek 			hash = UNION_HASH(uppervp, NULLVP);
    378   1.1  jdolecek 			break;
    379   1.1  jdolecek 
    380   1.1  jdolecek 		case 2:
    381   1.1  jdolecek 			if (lowervp == NULLVP)
    382   1.1  jdolecek 				continue;
    383   1.1  jdolecek 			hash = UNION_HASH(NULLVP, lowervp);
    384   1.1  jdolecek 			break;
    385   1.1  jdolecek 		}
    386   1.1  jdolecek 
    387   1.1  jdolecek 		while (union_list_lock(hash))
    388   1.1  jdolecek 			continue;
    389   1.1  jdolecek 
    390   1.1  jdolecek 		for (un = unhead[hash].lh_first; un != 0;
    391   1.1  jdolecek 					un = un->un_cache.le_next) {
    392   1.1  jdolecek 			if ((un->un_lowervp == lowervp ||
    393   1.1  jdolecek 			     un->un_lowervp == NULLVP) &&
    394   1.1  jdolecek 			    (un->un_uppervp == uppervp ||
    395   1.1  jdolecek 			     un->un_uppervp == NULLVP) &&
    396   1.1  jdolecek 			    (UNIONTOV(un)->v_mount == mp)) {
    397   1.5   thorpej 				if (vget(UNIONTOV(un), 0)) {
    398   1.1  jdolecek 					union_list_unlock(hash);
    399   1.1  jdolecek 					goto loop;
    400   1.1  jdolecek 				}
    401   1.1  jdolecek 				break;
    402   1.1  jdolecek 			}
    403   1.1  jdolecek 		}
    404   1.1  jdolecek 
    405   1.1  jdolecek 		union_list_unlock(hash);
    406   1.1  jdolecek 
    407   1.1  jdolecek 		if (un)
    408   1.1  jdolecek 			break;
    409   1.1  jdolecek 	}
    410   1.1  jdolecek 
    411   1.1  jdolecek 	if (un) {
    412   1.1  jdolecek 		/*
    413   1.1  jdolecek 		 * Obtain a lock on the union_node.
    414   1.1  jdolecek 		 * uppervp is locked, though un->un_uppervp
    415   1.1  jdolecek 		 * may not be.  this doesn't break the locking
    416   1.1  jdolecek 		 * hierarchy since in the case that un->un_uppervp
    417   1.1  jdolecek 		 * is not yet locked it will be vrele'd and replaced
    418   1.1  jdolecek 		 * with uppervp.
    419   1.1  jdolecek 		 */
    420   1.1  jdolecek 
    421   1.1  jdolecek 		if ((dvp != NULLVP) && (uppervp == dvp)) {
    422   1.1  jdolecek 			/*
    423   1.1  jdolecek 			 * Access ``.'', so (un) will already
    424   1.1  jdolecek 			 * be locked.  Since this process has
    425   1.1  jdolecek 			 * the lock on (uppervp) no other
    426   1.1  jdolecek 			 * process can hold the lock on (un).
    427   1.1  jdolecek 			 */
    428   1.1  jdolecek #ifdef DIAGNOSTIC
    429   1.1  jdolecek 			if ((un->un_flags & UN_LOCKED) == 0)
    430   1.1  jdolecek 				panic("union: . not locked");
    431   1.1  jdolecek 			else if (curproc && un->un_pid != curproc->p_pid &&
    432   1.1  jdolecek 				    un->un_pid > -1 && curproc->p_pid > -1)
    433   1.1  jdolecek 				panic("union: allocvp not lock owner");
    434   1.1  jdolecek #endif
    435   1.1  jdolecek 		} else {
    436   1.1  jdolecek 			if (un->un_flags & UN_LOCKED) {
    437   1.1  jdolecek 				vrele(UNIONTOV(un));
    438   1.1  jdolecek 				un->un_flags |= UN_WANTED;
    439   1.1  jdolecek 				(void) tsleep(&un->un_flags, PINOD,
    440   1.1  jdolecek 				    "unionalloc", 0);
    441   1.1  jdolecek 				goto loop;
    442   1.1  jdolecek 			}
    443   1.1  jdolecek 			un->un_flags |= UN_LOCKED;
    444   1.1  jdolecek 
    445   1.1  jdolecek #ifdef DIAGNOSTIC
    446   1.1  jdolecek 			if (curproc)
    447   1.1  jdolecek 				un->un_pid = curproc->p_pid;
    448   1.1  jdolecek 			else
    449   1.1  jdolecek 				un->un_pid = -1;
    450   1.1  jdolecek #endif
    451   1.1  jdolecek 		}
    452   1.1  jdolecek 
    453   1.1  jdolecek 		/*
    454   1.1  jdolecek 		 * At this point, the union_node is locked,
    455   1.1  jdolecek 		 * un->un_uppervp may not be locked, and uppervp
    456   1.1  jdolecek 		 * is locked or nil.
    457   1.1  jdolecek 		 */
    458   1.1  jdolecek 
    459   1.1  jdolecek 		/*
    460   1.1  jdolecek 		 * Save information about the upper layer.
    461   1.1  jdolecek 		 */
    462   1.1  jdolecek 		if (uppervp != un->un_uppervp) {
    463   1.1  jdolecek 			union_newupper(un, uppervp);
    464   1.1  jdolecek 		} else if (uppervp) {
    465   1.1  jdolecek 			vrele(uppervp);
    466   1.1  jdolecek 		}
    467   1.1  jdolecek 
    468   1.1  jdolecek 		if (un->un_uppervp) {
    469   1.1  jdolecek 			un->un_flags |= UN_ULOCK;
    470   1.1  jdolecek 			un->un_flags &= ~UN_KLOCK;
    471   1.1  jdolecek 		}
    472   1.1  jdolecek 
    473   1.1  jdolecek 		/*
    474   1.1  jdolecek 		 * Save information about the lower layer.
    475   1.1  jdolecek 		 * This needs to keep track of pathname
    476   1.1  jdolecek 		 * and directory information which union_vn_create
    477   1.1  jdolecek 		 * might need.
    478   1.1  jdolecek 		 */
    479   1.1  jdolecek 		if (lowervp != un->un_lowervp) {
    480   1.1  jdolecek 			union_newlower(un, lowervp);
    481   1.1  jdolecek 			if (cnp && (lowervp != NULLVP)) {
    482   1.1  jdolecek 				un->un_hash = cnp->cn_hash;
    483   1.1  jdolecek 				un->un_path = malloc(cnp->cn_namelen+1,
    484   1.1  jdolecek 						M_TEMP, M_WAITOK);
    485   1.1  jdolecek 				memcpy(un->un_path, cnp->cn_nameptr,
    486   1.1  jdolecek 						cnp->cn_namelen);
    487   1.1  jdolecek 				un->un_path[cnp->cn_namelen] = '\0';
    488  1.35     pooka 				vref(dvp);
    489   1.1  jdolecek 				un->un_dirvp = dvp;
    490   1.1  jdolecek 			}
    491   1.1  jdolecek 		} else if (lowervp) {
    492   1.1  jdolecek 			vrele(lowervp);
    493   1.1  jdolecek 		}
    494   1.1  jdolecek 		*vpp = UNIONTOV(un);
    495   1.1  jdolecek 		return (0);
    496   1.1  jdolecek 	}
    497   1.1  jdolecek 
    498  1.27     pooka 	uppersz = lowersz = VNOVAL;
    499  1.27     pooka 	if (uppervp != NULLVP)
    500  1.29     pooka 		if (VOP_GETATTR(uppervp, &va, FSCRED) == 0)
    501  1.27     pooka 			uppersz = va.va_size;
    502  1.27     pooka 	if (lowervp != NULLVP)
    503  1.29     pooka 		if (VOP_GETATTR(lowervp, &va, FSCRED) == 0)
    504  1.27     pooka 			lowersz = va.va_size;
    505  1.27     pooka 
    506   1.1  jdolecek 	if (docache) {
    507   1.1  jdolecek 		/*
    508   1.1  jdolecek 		 * otherwise lock the vp list while we call getnewvnode
    509   1.1  jdolecek 		 * since that can block.
    510  1.12     perry 		 */
    511   1.1  jdolecek 		hash = UNION_HASH(uppervp, lowervp);
    512   1.1  jdolecek 
    513   1.1  jdolecek 		if (union_list_lock(hash))
    514   1.1  jdolecek 			goto loop;
    515   1.1  jdolecek 	}
    516   1.1  jdolecek 
    517   1.1  jdolecek 	error = getnewvnode(VT_UNION, mp, union_vnodeop_p, vpp);
    518   1.1  jdolecek 	if (error) {
    519   1.1  jdolecek 		if (uppervp) {
    520   1.1  jdolecek 			if (dvp == uppervp)
    521   1.1  jdolecek 				vrele(uppervp);
    522   1.1  jdolecek 			else
    523   1.1  jdolecek 				vput(uppervp);
    524   1.1  jdolecek 		}
    525   1.1  jdolecek 		if (lowervp)
    526   1.1  jdolecek 			vrele(lowervp);
    527   1.1  jdolecek 
    528   1.1  jdolecek 		goto out;
    529   1.1  jdolecek 	}
    530   1.1  jdolecek 
    531  1.34    cegger 	(*vpp)->v_data = malloc(sizeof(struct union_node), M_TEMP, M_WAITOK);
    532   1.1  jdolecek 
    533  1.28        ad 	(*vpp)->v_vflag |= vflag;
    534  1.28        ad 	(*vpp)->v_iflag |= iflag;
    535   1.1  jdolecek 	(*vpp)->v_vnlock = NULL;	/* Make upper layers call VOP_LOCK */
    536   1.1  jdolecek 	if (uppervp)
    537   1.1  jdolecek 		(*vpp)->v_type = uppervp->v_type;
    538   1.1  jdolecek 	else
    539   1.1  jdolecek 		(*vpp)->v_type = lowervp->v_type;
    540   1.1  jdolecek 	un = VTOUNION(*vpp);
    541   1.1  jdolecek 	un->un_vnode = *vpp;
    542   1.1  jdolecek 	un->un_uppervp = uppervp;
    543   1.1  jdolecek 	un->un_lowervp = lowervp;
    544   1.1  jdolecek 	un->un_pvp = undvp;
    545   1.1  jdolecek 	if (undvp != NULLVP)
    546  1.35     pooka 		vref(undvp);
    547   1.1  jdolecek 	un->un_dircache = 0;
    548   1.1  jdolecek 	un->un_openl = 0;
    549   1.1  jdolecek 	un->un_flags = UN_LOCKED;
    550  1.26     pooka 
    551  1.26     pooka 	un->un_uppersz = VNOVAL;
    552  1.26     pooka 	un->un_lowersz = VNOVAL;
    553  1.26     pooka 	union_newsize(*vpp, uppersz, lowersz);
    554  1.26     pooka 
    555   1.1  jdolecek 	if (un->un_uppervp)
    556   1.1  jdolecek 		un->un_flags |= UN_ULOCK;
    557   1.1  jdolecek #ifdef DIAGNOSTIC
    558   1.1  jdolecek 	if (curproc)
    559   1.1  jdolecek 		un->un_pid = curproc->p_pid;
    560   1.1  jdolecek 	else
    561   1.1  jdolecek 		un->un_pid = -1;
    562   1.1  jdolecek #endif
    563  1.17  christos 	if (dvp && cnp && (lowervp != NULLVP)) {
    564   1.1  jdolecek 		un->un_hash = cnp->cn_hash;
    565   1.1  jdolecek 		un->un_path = malloc(cnp->cn_namelen+1, M_TEMP, M_WAITOK);
    566   1.1  jdolecek 		memcpy(un->un_path, cnp->cn_nameptr, cnp->cn_namelen);
    567   1.1  jdolecek 		un->un_path[cnp->cn_namelen] = '\0';
    568  1.35     pooka 		vref(dvp);
    569   1.1  jdolecek 		un->un_dirvp = dvp;
    570   1.1  jdolecek 	} else {
    571   1.1  jdolecek 		un->un_hash = 0;
    572   1.1  jdolecek 		un->un_path = 0;
    573   1.1  jdolecek 		un->un_dirvp = 0;
    574   1.1  jdolecek 	}
    575   1.1  jdolecek 
    576   1.1  jdolecek 	if (docache) {
    577   1.1  jdolecek 		LIST_INSERT_HEAD(&unhead[hash], un, un_cache);
    578   1.1  jdolecek 		un->un_flags |= UN_CACHED;
    579   1.1  jdolecek 	}
    580   1.1  jdolecek 
    581   1.1  jdolecek 	if (xlowervp)
    582   1.1  jdolecek 		vrele(xlowervp);
    583   1.1  jdolecek 
    584   1.1  jdolecek out:
    585   1.1  jdolecek 	if (docache)
    586   1.1  jdolecek 		union_list_unlock(hash);
    587   1.1  jdolecek 
    588   1.1  jdolecek 	return (error);
    589   1.1  jdolecek }
    590   1.1  jdolecek 
    591   1.1  jdolecek int
    592  1.32      matt union_freevp(struct vnode *vp)
    593   1.1  jdolecek {
    594   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
    595   1.1  jdolecek 
    596   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
    597   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
    598   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
    599   1.1  jdolecek 	}
    600   1.1  jdolecek 
    601   1.1  jdolecek 	if (un->un_pvp != NULLVP)
    602   1.1  jdolecek 		vrele(un->un_pvp);
    603   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
    604   1.1  jdolecek 		vrele(un->un_uppervp);
    605   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
    606   1.1  jdolecek 		vrele(un->un_lowervp);
    607   1.1  jdolecek 	if (un->un_dirvp != NULLVP)
    608   1.1  jdolecek 		vrele(un->un_dirvp);
    609   1.1  jdolecek 	if (un->un_path)
    610   1.1  jdolecek 		free(un->un_path, M_TEMP);
    611   1.1  jdolecek 
    612  1.34    cegger 	free(vp->v_data, M_TEMP);
    613  1.34    cegger 	vp->v_data = NULL;
    614   1.1  jdolecek 
    615   1.1  jdolecek 	return (0);
    616   1.1  jdolecek }
    617   1.1  jdolecek 
    618   1.1  jdolecek /*
    619   1.1  jdolecek  * copyfile.  copy the vnode (fvp) to the vnode (tvp)
    620   1.1  jdolecek  * using a sequence of reads and writes.  both (fvp)
    621   1.1  jdolecek  * and (tvp) are locked on entry and exit.
    622   1.1  jdolecek  */
    623   1.1  jdolecek int
    624  1.32      matt union_copyfile(struct vnode *fvp, struct vnode *tvp, kauth_cred_t cred,
    625  1.32      matt 	struct lwp *l)
    626   1.1  jdolecek {
    627  1.13  christos 	char *tbuf;
    628   1.1  jdolecek 	struct uio uio;
    629   1.1  jdolecek 	struct iovec iov;
    630   1.1  jdolecek 	int error = 0;
    631   1.1  jdolecek 
    632   1.1  jdolecek 	/*
    633   1.1  jdolecek 	 * strategy:
    634   1.1  jdolecek 	 * allocate a buffer of size MAXBSIZE.
    635   1.1  jdolecek 	 * loop doing reads and writes, keeping track
    636   1.1  jdolecek 	 * of the current uio offset.
    637   1.1  jdolecek 	 * give up at the first sign of trouble.
    638   1.1  jdolecek 	 */
    639   1.1  jdolecek 
    640   1.1  jdolecek 	uio.uio_offset = 0;
    641  1.16      yamt 	UIO_SETUP_SYSSPACE(&uio);
    642   1.1  jdolecek 
    643   1.1  jdolecek 	VOP_UNLOCK(fvp, 0);			/* XXX */
    644   1.1  jdolecek 	vn_lock(fvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    645   1.1  jdolecek 	VOP_UNLOCK(tvp, 0);			/* XXX */
    646   1.1  jdolecek 	vn_lock(tvp, LK_EXCLUSIVE | LK_RETRY);	/* XXX */
    647   1.1  jdolecek 
    648  1.13  christos 	tbuf = malloc(MAXBSIZE, M_TEMP, M_WAITOK);
    649   1.1  jdolecek 
    650   1.1  jdolecek 	/* ugly loop follows... */
    651   1.1  jdolecek 	do {
    652   1.1  jdolecek 		off_t offset = uio.uio_offset;
    653   1.1  jdolecek 
    654   1.1  jdolecek 		uio.uio_iov = &iov;
    655   1.1  jdolecek 		uio.uio_iovcnt = 1;
    656  1.13  christos 		iov.iov_base = tbuf;
    657   1.1  jdolecek 		iov.iov_len = MAXBSIZE;
    658   1.1  jdolecek 		uio.uio_resid = iov.iov_len;
    659   1.1  jdolecek 		uio.uio_rw = UIO_READ;
    660   1.1  jdolecek 		error = VOP_READ(fvp, &uio, 0, cred);
    661   1.1  jdolecek 
    662   1.1  jdolecek 		if (error == 0) {
    663   1.1  jdolecek 			uio.uio_iov = &iov;
    664   1.1  jdolecek 			uio.uio_iovcnt = 1;
    665  1.13  christos 			iov.iov_base = tbuf;
    666   1.1  jdolecek 			iov.iov_len = MAXBSIZE - uio.uio_resid;
    667   1.1  jdolecek 			uio.uio_offset = offset;
    668   1.1  jdolecek 			uio.uio_rw = UIO_WRITE;
    669   1.1  jdolecek 			uio.uio_resid = iov.iov_len;
    670   1.1  jdolecek 
    671   1.1  jdolecek 			if (uio.uio_resid == 0)
    672   1.1  jdolecek 				break;
    673   1.1  jdolecek 
    674   1.1  jdolecek 			do {
    675   1.1  jdolecek 				error = VOP_WRITE(tvp, &uio, 0, cred);
    676   1.1  jdolecek 			} while ((uio.uio_resid > 0) && (error == 0));
    677   1.1  jdolecek 		}
    678   1.1  jdolecek 
    679   1.1  jdolecek 	} while (error == 0);
    680   1.1  jdolecek 
    681  1.13  christos 	free(tbuf, M_TEMP);
    682   1.1  jdolecek 	return (error);
    683   1.1  jdolecek }
    684   1.1  jdolecek 
    685   1.1  jdolecek /*
    686   1.1  jdolecek  * (un) is assumed to be locked on entry and remains
    687   1.1  jdolecek  * locked on exit.
    688   1.1  jdolecek  */
    689   1.1  jdolecek int
    690  1.32      matt union_copyup(struct union_node *un, int docopy, kauth_cred_t cred,
    691  1.32      matt 	struct lwp *l)
    692   1.1  jdolecek {
    693   1.1  jdolecek 	int error;
    694   1.1  jdolecek 	struct vnode *lvp, *uvp;
    695   1.1  jdolecek 	struct vattr lvattr, uvattr;
    696   1.1  jdolecek 
    697  1.15  christos 	error = union_vn_create(&uvp, un, l);
    698  1.25   hannken 	if (error)
    699   1.1  jdolecek 		return (error);
    700   1.1  jdolecek 
    701   1.1  jdolecek 	/* at this point, uppervp is locked */
    702   1.1  jdolecek 	union_newupper(un, uvp);
    703   1.1  jdolecek 	un->un_flags |= UN_ULOCK;
    704   1.1  jdolecek 
    705   1.1  jdolecek 	lvp = un->un_lowervp;
    706   1.1  jdolecek 
    707   1.1  jdolecek 	if (docopy) {
    708   1.1  jdolecek 		/*
    709   1.1  jdolecek 		 * XX - should not ignore errors
    710   1.1  jdolecek 		 * from VOP_CLOSE
    711   1.1  jdolecek 		 */
    712   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    713   1.1  jdolecek 
    714  1.29     pooka         	error = VOP_GETATTR(lvp, &lvattr, cred);
    715   1.1  jdolecek 		if (error == 0)
    716  1.29     pooka 			error = VOP_OPEN(lvp, FREAD, cred);
    717   1.1  jdolecek 		if (error == 0) {
    718  1.15  christos 			error = union_copyfile(lvp, uvp, cred, l);
    719  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    720   1.1  jdolecek 		}
    721   1.1  jdolecek 		if (error == 0) {
    722   1.1  jdolecek 			/* Copy permissions up too */
    723  1.35     pooka 			vattr_null(&uvattr);
    724   1.1  jdolecek 			uvattr.va_mode = lvattr.va_mode;
    725   1.1  jdolecek 			uvattr.va_flags = lvattr.va_flags;
    726  1.29     pooka         		error = VOP_SETATTR(uvp, &uvattr, cred);
    727   1.1  jdolecek 		}
    728   1.1  jdolecek 		VOP_UNLOCK(lvp, 0);
    729   1.1  jdolecek #ifdef UNION_DIAGNOSTIC
    730   1.1  jdolecek 		if (error == 0)
    731   1.1  jdolecek 			uprintf("union: copied up %s\n", un->un_path);
    732   1.1  jdolecek #endif
    733   1.1  jdolecek 
    734   1.1  jdolecek 	}
    735  1.15  christos 	union_vn_close(uvp, FWRITE, cred, l);
    736   1.1  jdolecek 
    737   1.1  jdolecek 	/*
    738   1.1  jdolecek 	 * Subsequent IOs will go to the top layer, so
    739   1.1  jdolecek 	 * call close on the lower vnode and open on the
    740   1.1  jdolecek 	 * upper vnode to ensure that the filesystem keeps
    741   1.1  jdolecek 	 * its references counts right.  This doesn't do
    742   1.1  jdolecek 	 * the right thing with (cred) and (FREAD) though.
    743   1.1  jdolecek 	 * Ignoring error returns is not right, either.
    744   1.1  jdolecek 	 */
    745   1.1  jdolecek 	if (error == 0) {
    746   1.1  jdolecek 		int i;
    747   1.1  jdolecek 
    748   1.1  jdolecek 		vn_lock(lvp, LK_EXCLUSIVE | LK_RETRY);
    749   1.1  jdolecek 		for (i = 0; i < un->un_openl; i++) {
    750  1.29     pooka 			(void) VOP_CLOSE(lvp, FREAD, cred);
    751  1.29     pooka 			(void) VOP_OPEN(uvp, FREAD, cred);
    752   1.1  jdolecek 		}
    753   1.1  jdolecek 		un->un_openl = 0;
    754   1.1  jdolecek 		VOP_UNLOCK(lvp, 0);
    755   1.1  jdolecek 	}
    756   1.1  jdolecek 
    757   1.1  jdolecek 	return (error);
    758   1.1  jdolecek 
    759   1.1  jdolecek }
    760   1.1  jdolecek 
    761   1.1  jdolecek static int
    762  1.32      matt union_relookup(
    763  1.32      matt 	struct union_mount *um,
    764  1.32      matt 	struct vnode *dvp,
    765  1.32      matt 	struct vnode **vpp,
    766  1.32      matt 	struct componentname *cnp,
    767  1.32      matt 	struct componentname *cn,
    768  1.32      matt 	const char *path,
    769  1.32      matt 	int pathlen)
    770   1.1  jdolecek {
    771   1.1  jdolecek 	int error;
    772   1.1  jdolecek 
    773   1.1  jdolecek 	/*
    774   1.1  jdolecek 	 * A new componentname structure must be faked up because
    775   1.1  jdolecek 	 * there is no way to know where the upper level cnp came
    776   1.1  jdolecek 	 * from or what it is being used for.  This must duplicate
    777   1.1  jdolecek 	 * some of the work done by NDINIT, some of the work done
    778   1.1  jdolecek 	 * by namei, some of the work done by lookup and some of
    779   1.1  jdolecek 	 * the work done by VOP_LOOKUP when given a CREATE flag.
    780   1.1  jdolecek 	 * Conclusion: Horrible.
    781   1.1  jdolecek 	 *
    782   1.1  jdolecek 	 * The pathname buffer will be PNBUF_PUT'd by VOP_MKDIR.
    783   1.1  jdolecek 	 */
    784   1.1  jdolecek 	cn->cn_namelen = pathlen;
    785   1.1  jdolecek 	if ((cn->cn_namelen + 1) > MAXPATHLEN)
    786   1.1  jdolecek 		return (ENAMETOOLONG);
    787   1.1  jdolecek 	cn->cn_pnbuf = PNBUF_GET();
    788   1.1  jdolecek 	memcpy(cn->cn_pnbuf, path, cn->cn_namelen);
    789   1.1  jdolecek 	cn->cn_pnbuf[cn->cn_namelen] = '\0';
    790   1.1  jdolecek 
    791   1.1  jdolecek 	cn->cn_nameiop = CREATE;
    792  1.24       chs 	cn->cn_flags = (LOCKPARENT|HASBUF|SAVENAME|ISLASTCN);
    793   1.1  jdolecek 	if (um->um_op == UNMNT_ABOVE)
    794   1.1  jdolecek 		cn->cn_cred = cnp->cn_cred;
    795   1.1  jdolecek 	else
    796   1.1  jdolecek 		cn->cn_cred = um->um_cred;
    797   1.1  jdolecek 	cn->cn_nameptr = cn->cn_pnbuf;
    798   1.1  jdolecek 	cn->cn_hash = cnp->cn_hash;
    799   1.1  jdolecek 	cn->cn_consume = cnp->cn_consume;
    800   1.1  jdolecek 
    801   1.1  jdolecek 	error = relookup(dvp, vpp, cn);
    802  1.22       chs 	if (error) {
    803   1.1  jdolecek 		PNBUF_PUT(cn->cn_pnbuf);
    804   1.1  jdolecek 		cn->cn_pnbuf = 0;
    805   1.1  jdolecek 	}
    806   1.1  jdolecek 
    807   1.1  jdolecek 	return (error);
    808   1.1  jdolecek }
    809   1.1  jdolecek 
    810   1.1  jdolecek /*
    811   1.1  jdolecek  * Create a shadow directory in the upper layer.
    812   1.1  jdolecek  * The new vnode is returned locked.
    813   1.1  jdolecek  *
    814   1.1  jdolecek  * (um) points to the union mount structure for access to the
    815   1.1  jdolecek  * the mounting process's credentials.
    816   1.1  jdolecek  * (dvp) is the directory in which to create the shadow directory.
    817   1.1  jdolecek  * it is unlocked on entry and exit.
    818   1.1  jdolecek  * (cnp) is the componentname to be created.
    819   1.1  jdolecek  * (vpp) is the returned newly created shadow directory, which
    820   1.1  jdolecek  * is returned locked.
    821   1.1  jdolecek  *
    822   1.1  jdolecek  * N.B. We still attempt to create shadow directories even if the union
    823   1.1  jdolecek  * is mounted read-only, which is a little nonintuitive.
    824   1.1  jdolecek  */
    825   1.1  jdolecek int
    826  1.32      matt union_mkshadow(struct union_mount *um, struct vnode *dvp,
    827  1.32      matt 	struct componentname *cnp, struct vnode **vpp)
    828   1.1  jdolecek {
    829   1.1  jdolecek 	int error;
    830   1.1  jdolecek 	struct vattr va;
    831   1.1  jdolecek 	struct componentname cn;
    832   1.1  jdolecek 
    833  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    834   1.1  jdolecek 	error = union_relookup(um, dvp, vpp, cnp, &cn,
    835   1.1  jdolecek 			cnp->cn_nameptr, cnp->cn_namelen);
    836   1.8   hannken 	if (error) {
    837  1.22       chs 		VOP_UNLOCK(dvp, 0);
    838   1.1  jdolecek 		return (error);
    839   1.8   hannken 	}
    840   1.1  jdolecek 
    841   1.1  jdolecek 	if (*vpp) {
    842   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    843  1.24       chs 		if (dvp != *vpp)
    844  1.24       chs 			VOP_UNLOCK(dvp, 0);
    845  1.22       chs 		vput(*vpp);
    846   1.1  jdolecek 		*vpp = NULLVP;
    847   1.1  jdolecek 		return (EEXIST);
    848   1.1  jdolecek 	}
    849   1.1  jdolecek 
    850   1.1  jdolecek 	/*
    851   1.1  jdolecek 	 * policy: when creating the shadow directory in the
    852   1.1  jdolecek 	 * upper layer, create it owned by the user who did
    853   1.1  jdolecek 	 * the mount, group from parent directory, and mode
    854   1.1  jdolecek 	 * 777 modified by umask (ie mostly identical to the
    855   1.1  jdolecek 	 * mkdir syscall).  (jsp, kb)
    856   1.1  jdolecek 	 */
    857   1.1  jdolecek 
    858  1.35     pooka 	vattr_null(&va);
    859   1.1  jdolecek 	va.va_type = VDIR;
    860   1.1  jdolecek 	va.va_mode = um->um_cmode;
    861   1.1  jdolecek 
    862  1.24       chs 	vref(dvp);
    863   1.1  jdolecek 	error = VOP_MKDIR(dvp, vpp, &cn, &va);
    864   1.1  jdolecek 	return (error);
    865   1.1  jdolecek }
    866   1.1  jdolecek 
    867   1.1  jdolecek /*
    868   1.1  jdolecek  * Create a whiteout entry in the upper layer.
    869   1.1  jdolecek  *
    870   1.1  jdolecek  * (um) points to the union mount structure for access to the
    871   1.1  jdolecek  * the mounting process's credentials.
    872   1.1  jdolecek  * (dvp) is the directory in which to create the whiteout.
    873   1.1  jdolecek  * it is locked on entry and exit.
    874   1.1  jdolecek  * (cnp) is the componentname to be created.
    875   1.1  jdolecek  */
    876   1.1  jdolecek int
    877  1.32      matt union_mkwhiteout(struct union_mount *um, struct vnode *dvp,
    878  1.32      matt 	struct componentname *cnp, char *path)
    879   1.1  jdolecek {
    880   1.1  jdolecek 	int error;
    881   1.1  jdolecek 	struct vnode *wvp;
    882   1.1  jdolecek 	struct componentname cn;
    883   1.1  jdolecek 
    884   1.1  jdolecek 	VOP_UNLOCK(dvp, 0);
    885  1.22       chs 	vn_lock(dvp, LK_EXCLUSIVE | LK_RETRY);
    886   1.1  jdolecek 	error = union_relookup(um, dvp, &wvp, cnp, &cn, path, strlen(path));
    887  1.25   hannken 	if (error)
    888   1.1  jdolecek 		return (error);
    889   1.1  jdolecek 
    890   1.1  jdolecek 	if (wvp) {
    891   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    892  1.24       chs 		if (dvp != wvp)
    893  1.24       chs 			VOP_UNLOCK(dvp, 0);
    894  1.22       chs 		vput(wvp);
    895   1.1  jdolecek 		return (EEXIST);
    896   1.1  jdolecek 	}
    897   1.1  jdolecek 
    898   1.1  jdolecek 	error = VOP_WHITEOUT(dvp, &cn, CREATE);
    899   1.1  jdolecek 	if (error)
    900   1.1  jdolecek 		VOP_ABORTOP(dvp, &cn);
    901   1.1  jdolecek 
    902   1.1  jdolecek 	return (error);
    903   1.1  jdolecek }
    904   1.1  jdolecek 
    905   1.1  jdolecek /*
    906   1.1  jdolecek  * union_vn_create: creates and opens a new shadow file
    907   1.1  jdolecek  * on the upper union layer.  this function is similar
    908   1.1  jdolecek  * in spirit to calling vn_open but it avoids calling namei().
    909   1.1  jdolecek  * the problem with calling namei is that a) it locks too many
    910   1.1  jdolecek  * things, and b) it doesn't start at the "right" directory,
    911   1.1  jdolecek  * whereas relookup is told where to start.
    912   1.1  jdolecek  */
    913   1.1  jdolecek int
    914  1.32      matt union_vn_create(struct vnode **vpp, struct union_node *un, struct lwp *l)
    915   1.1  jdolecek {
    916   1.1  jdolecek 	struct vnode *vp;
    917  1.19        ad 	kauth_cred_t cred = l->l_cred;
    918   1.1  jdolecek 	struct vattr vat;
    919   1.1  jdolecek 	struct vattr *vap = &vat;
    920   1.1  jdolecek 	int fmode = FFLAGS(O_WRONLY|O_CREAT|O_TRUNC|O_EXCL);
    921   1.1  jdolecek 	int error;
    922  1.15  christos 	int cmode = UN_FILEMODE & ~l->l_proc->p_cwdi->cwdi_cmask;
    923   1.1  jdolecek 	struct componentname cn;
    924   1.1  jdolecek 
    925   1.1  jdolecek 	*vpp = NULLVP;
    926   1.1  jdolecek 
    927   1.1  jdolecek 	/*
    928   1.1  jdolecek 	 * Build a new componentname structure (for the same
    929   1.1  jdolecek 	 * reasons outlines in union_mkshadow).
    930   1.1  jdolecek 	 * The difference here is that the file is owned by
    931   1.1  jdolecek 	 * the current user, rather than by the person who
    932   1.1  jdolecek 	 * did the mount, since the current user needs to be
    933   1.1  jdolecek 	 * able to write the file (that's why it is being
    934   1.1  jdolecek 	 * copied in the first place).
    935   1.1  jdolecek 	 */
    936   1.1  jdolecek 	cn.cn_namelen = strlen(un->un_path);
    937   1.1  jdolecek 	if ((cn.cn_namelen + 1) > MAXPATHLEN)
    938   1.1  jdolecek 		return (ENAMETOOLONG);
    939   1.1  jdolecek 	cn.cn_pnbuf = PNBUF_GET();
    940   1.1  jdolecek 	memcpy(cn.cn_pnbuf, un->un_path, cn.cn_namelen+1);
    941   1.1  jdolecek 	cn.cn_nameiop = CREATE;
    942  1.24       chs 	cn.cn_flags = (LOCKPARENT|HASBUF|SAVENAME|ISLASTCN);
    943  1.19        ad 	cn.cn_cred = l->l_cred;
    944   1.1  jdolecek 	cn.cn_nameptr = cn.cn_pnbuf;
    945   1.1  jdolecek 	cn.cn_hash = un->un_hash;
    946   1.1  jdolecek 	cn.cn_consume = 0;
    947   1.1  jdolecek 
    948  1.24       chs 	vn_lock(un->un_dirvp, LK_EXCLUSIVE | LK_RETRY);
    949  1.22       chs 	error = relookup(un->un_dirvp, &vp, &cn);
    950  1.22       chs 	if (error) {
    951  1.24       chs 		VOP_UNLOCK(un->un_dirvp, 0);
    952   1.1  jdolecek 		return (error);
    953  1.22       chs 	}
    954   1.1  jdolecek 
    955   1.1  jdolecek 	if (vp) {
    956   1.1  jdolecek 		VOP_ABORTOP(un->un_dirvp, &cn);
    957  1.24       chs 		if (un->un_dirvp != vp)
    958  1.24       chs 			VOP_UNLOCK(un->un_dirvp, 0);
    959  1.22       chs 		vput(vp);
    960   1.1  jdolecek 		return (EEXIST);
    961   1.1  jdolecek 	}
    962   1.1  jdolecek 
    963   1.1  jdolecek 	/*
    964   1.1  jdolecek 	 * Good - there was no race to create the file
    965   1.1  jdolecek 	 * so go ahead and create it.  The permissions
    966   1.1  jdolecek 	 * on the file will be 0666 modified by the
    967   1.1  jdolecek 	 * current user's umask.  Access to the file, while
    968   1.1  jdolecek 	 * it is unioned, will require access to the top *and*
    969   1.1  jdolecek 	 * bottom files.  Access when not unioned will simply
    970   1.1  jdolecek 	 * require access to the top-level file.
    971   1.1  jdolecek 	 * TODO: confirm choice of access permissions.
    972   1.1  jdolecek 	 */
    973  1.35     pooka 	vattr_null(vap);
    974   1.1  jdolecek 	vap->va_type = VREG;
    975   1.1  jdolecek 	vap->va_mode = cmode;
    976  1.24       chs 	vref(un->un_dirvp);
    977   1.1  jdolecek 	if ((error = VOP_CREATE(un->un_dirvp, &vp, &cn, vap)) != 0)
    978   1.1  jdolecek 		return (error);
    979   1.1  jdolecek 
    980  1.29     pooka 	if ((error = VOP_OPEN(vp, fmode, cred)) != 0) {
    981   1.1  jdolecek 		vput(vp);
    982   1.1  jdolecek 		return (error);
    983   1.1  jdolecek 	}
    984   1.1  jdolecek 
    985   1.1  jdolecek 	vp->v_writecount++;
    986   1.1  jdolecek 	*vpp = vp;
    987   1.1  jdolecek 	return (0);
    988   1.1  jdolecek }
    989   1.1  jdolecek 
    990   1.1  jdolecek int
    991  1.32      matt union_vn_close(struct vnode *vp, int fmode, kauth_cred_t cred, struct lwp *l)
    992   1.1  jdolecek {
    993   1.1  jdolecek 
    994   1.1  jdolecek 	if (fmode & FWRITE)
    995   1.1  jdolecek 		--vp->v_writecount;
    996  1.29     pooka 	return (VOP_CLOSE(vp, fmode, cred));
    997   1.1  jdolecek }
    998   1.1  jdolecek 
    999   1.1  jdolecek void
   1000  1.32      matt union_removed_upper(struct union_node *un)
   1001   1.1  jdolecek {
   1002   1.1  jdolecek #if 1
   1003   1.1  jdolecek 	/*
   1004   1.1  jdolecek 	 * We do not set the uppervp to NULLVP here, because lowervp
   1005   1.1  jdolecek 	 * may also be NULLVP, so this routine would end up creating
   1006   1.1  jdolecek 	 * a bogus union node with no upper or lower VP (that causes
   1007   1.1  jdolecek 	 * pain in many places that assume at least one VP exists).
   1008   1.1  jdolecek 	 * Since we've removed this node from the cache hash chains,
   1009   1.1  jdolecek 	 * it won't be found again.  When all current holders
   1010   1.1  jdolecek 	 * release it, union_inactive() will vgone() it.
   1011   1.1  jdolecek 	 */
   1012   1.1  jdolecek 	union_diruncache(un);
   1013   1.1  jdolecek #else
   1014   1.1  jdolecek 	union_newupper(un, NULLVP);
   1015   1.1  jdolecek #endif
   1016   1.1  jdolecek 
   1017   1.1  jdolecek 	if (un->un_flags & UN_CACHED) {
   1018   1.1  jdolecek 		un->un_flags &= ~UN_CACHED;
   1019   1.1  jdolecek 		LIST_REMOVE(un, un_cache);
   1020   1.1  jdolecek 	}
   1021   1.1  jdolecek 
   1022   1.1  jdolecek 	if (un->un_flags & UN_ULOCK) {
   1023   1.1  jdolecek 		un->un_flags &= ~UN_ULOCK;
   1024   1.1  jdolecek 		VOP_UNLOCK(un->un_uppervp, 0);
   1025   1.1  jdolecek 	}
   1026   1.1  jdolecek }
   1027   1.1  jdolecek 
   1028   1.1  jdolecek #if 0
   1029   1.1  jdolecek struct vnode *
   1030  1.32      matt union_lowervp(struct vnode *vp)
   1031   1.1  jdolecek {
   1032   1.1  jdolecek 	struct union_node *un = VTOUNION(vp);
   1033   1.1  jdolecek 
   1034   1.1  jdolecek 	if ((un->un_lowervp != NULLVP) &&
   1035   1.1  jdolecek 	    (vp->v_type == un->un_lowervp->v_type)) {
   1036   1.1  jdolecek 		if (vget(un->un_lowervp, 0) == 0)
   1037   1.1  jdolecek 			return (un->un_lowervp);
   1038   1.1  jdolecek 	}
   1039   1.1  jdolecek 
   1040   1.1  jdolecek 	return (NULLVP);
   1041   1.1  jdolecek }
   1042   1.1  jdolecek #endif
   1043   1.1  jdolecek 
   1044   1.1  jdolecek /*
   1045   1.1  jdolecek  * determine whether a whiteout is needed
   1046   1.1  jdolecek  * during a remove/rmdir operation.
   1047   1.1  jdolecek  */
   1048   1.1  jdolecek int
   1049  1.32      matt union_dowhiteout(struct union_node *un, kauth_cred_t cred)
   1050   1.1  jdolecek {
   1051   1.1  jdolecek 	struct vattr va;
   1052   1.1  jdolecek 
   1053   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1054   1.1  jdolecek 		return (1);
   1055   1.1  jdolecek 
   1056  1.29     pooka 	if (VOP_GETATTR(un->un_uppervp, &va, cred) == 0 &&
   1057   1.1  jdolecek 	    (va.va_flags & OPAQUE))
   1058   1.1  jdolecek 		return (1);
   1059   1.1  jdolecek 
   1060   1.1  jdolecek 	return (0);
   1061   1.1  jdolecek }
   1062   1.1  jdolecek 
   1063   1.1  jdolecek static void
   1064  1.32      matt union_dircache_r(struct vnode *vp, struct vnode ***vppp, int *cntp)
   1065   1.1  jdolecek {
   1066   1.1  jdolecek 	struct union_node *un;
   1067   1.1  jdolecek 
   1068   1.1  jdolecek 	if (vp->v_op != union_vnodeop_p) {
   1069   1.1  jdolecek 		if (vppp) {
   1070  1.35     pooka 			vref(vp);
   1071   1.1  jdolecek 			*(*vppp)++ = vp;
   1072   1.1  jdolecek 			if (--(*cntp) == 0)
   1073   1.1  jdolecek 				panic("union: dircache table too small");
   1074   1.1  jdolecek 		} else {
   1075   1.1  jdolecek 			(*cntp)++;
   1076   1.1  jdolecek 		}
   1077   1.1  jdolecek 
   1078   1.1  jdolecek 		return;
   1079   1.1  jdolecek 	}
   1080   1.1  jdolecek 
   1081   1.1  jdolecek 	un = VTOUNION(vp);
   1082   1.1  jdolecek 	if (un->un_uppervp != NULLVP)
   1083   1.1  jdolecek 		union_dircache_r(un->un_uppervp, vppp, cntp);
   1084   1.1  jdolecek 	if (un->un_lowervp != NULLVP)
   1085   1.1  jdolecek 		union_dircache_r(un->un_lowervp, vppp, cntp);
   1086   1.1  jdolecek }
   1087   1.1  jdolecek 
   1088   1.1  jdolecek struct vnode *
   1089  1.21  christos union_dircache(struct vnode *vp, struct lwp *l)
   1090   1.1  jdolecek {
   1091   1.1  jdolecek 	int cnt;
   1092   1.1  jdolecek 	struct vnode *nvp = NULLVP;
   1093   1.1  jdolecek 	struct vnode **vpp;
   1094   1.1  jdolecek 	struct vnode **dircache;
   1095   1.1  jdolecek 	int error;
   1096   1.1  jdolecek 
   1097   1.1  jdolecek 	vn_lock(vp, LK_EXCLUSIVE | LK_RETRY);
   1098   1.1  jdolecek 	dircache = VTOUNION(vp)->un_dircache;
   1099   1.1  jdolecek 
   1100   1.1  jdolecek 	nvp = NULLVP;
   1101   1.1  jdolecek 
   1102   1.1  jdolecek 	if (dircache == 0) {
   1103   1.1  jdolecek 		cnt = 0;
   1104   1.1  jdolecek 		union_dircache_r(vp, 0, &cnt);
   1105   1.1  jdolecek 		cnt++;
   1106   1.1  jdolecek 		dircache = (struct vnode **)
   1107   1.1  jdolecek 				malloc(cnt * sizeof(struct vnode *),
   1108   1.1  jdolecek 					M_TEMP, M_WAITOK);
   1109   1.1  jdolecek 		vpp = dircache;
   1110   1.1  jdolecek 		union_dircache_r(vp, &vpp, &cnt);
   1111   1.1  jdolecek 		VTOUNION(vp)->un_dircache = dircache;
   1112   1.1  jdolecek 		*vpp = NULLVP;
   1113   1.1  jdolecek 		vpp = dircache + 1;
   1114   1.1  jdolecek 	} else {
   1115   1.1  jdolecek 		vpp = dircache;
   1116   1.1  jdolecek 		do {
   1117   1.1  jdolecek 			if (*vpp++ == VTOUNION(vp)->un_uppervp)
   1118   1.1  jdolecek 				break;
   1119   1.1  jdolecek 		} while (*vpp != NULLVP);
   1120   1.1  jdolecek 	}
   1121   1.1  jdolecek 
   1122   1.1  jdolecek 	if (*vpp == NULLVP)
   1123   1.1  jdolecek 		goto out;
   1124   1.1  jdolecek 
   1125   1.1  jdolecek 	vn_lock(*vpp, LK_EXCLUSIVE | LK_RETRY);
   1126  1.35     pooka 	vref(*vpp);
   1127   1.5   thorpej 	error = union_allocvp(&nvp, vp->v_mount, NULLVP, NULLVP, 0, *vpp, NULLVP, 0);
   1128   1.1  jdolecek 	if (!error) {
   1129   1.1  jdolecek 		VTOUNION(vp)->un_dircache = 0;
   1130   1.1  jdolecek 		VTOUNION(nvp)->un_dircache = dircache;
   1131   1.1  jdolecek 	}
   1132   1.1  jdolecek 
   1133   1.1  jdolecek out:
   1134   1.1  jdolecek 	VOP_UNLOCK(vp, 0);
   1135   1.1  jdolecek 	return (nvp);
   1136   1.1  jdolecek }
   1137   1.1  jdolecek 
   1138   1.1  jdolecek void
   1139  1.32      matt union_diruncache(struct union_node *un)
   1140   1.1  jdolecek {
   1141   1.1  jdolecek 	struct vnode **vpp;
   1142   1.1  jdolecek 
   1143   1.1  jdolecek 	if (un->un_dircache != 0) {
   1144   1.1  jdolecek 		for (vpp = un->un_dircache; *vpp != NULLVP; vpp++)
   1145   1.1  jdolecek 			vrele(*vpp);
   1146   1.1  jdolecek 		free(un->un_dircache, M_TEMP);
   1147   1.1  jdolecek 		un->un_dircache = 0;
   1148   1.1  jdolecek 	}
   1149   1.2  jdolecek }
   1150   1.2  jdolecek 
   1151   1.2  jdolecek /*
   1152   1.2  jdolecek  * This hook is called from vn_readdir() to switch to lower directory
   1153   1.2  jdolecek  * entry after the upper directory is read.
   1154   1.2  jdolecek  */
   1155   1.2  jdolecek int
   1156  1.15  christos union_readdirhook(struct vnode **vpp, struct file *fp, struct lwp *l)
   1157   1.2  jdolecek {
   1158   1.2  jdolecek 	struct vnode *vp = *vpp, *lvp;
   1159   1.2  jdolecek 	struct vattr va;
   1160   1.2  jdolecek 	int error;
   1161   1.2  jdolecek 
   1162   1.2  jdolecek 	if (vp->v_op != union_vnodeop_p)
   1163   1.2  jdolecek 		return (0);
   1164   1.2  jdolecek 
   1165  1.15  christos 	if ((lvp = union_dircache(vp, l)) == NULLVP)
   1166   1.2  jdolecek 		return (0);
   1167   1.2  jdolecek 
   1168   1.2  jdolecek 	/*
   1169   1.2  jdolecek 	 * If the directory is opaque,
   1170   1.2  jdolecek 	 * then don't show lower entries
   1171   1.2  jdolecek 	 */
   1172  1.29     pooka 	error = VOP_GETATTR(vp, &va, fp->f_cred);
   1173   1.2  jdolecek 	if (error || (va.va_flags & OPAQUE)) {
   1174   1.2  jdolecek 		vput(lvp);
   1175   1.2  jdolecek 		return (error);
   1176   1.2  jdolecek 	}
   1177  1.12     perry 
   1178  1.29     pooka 	error = VOP_OPEN(lvp, FREAD, fp->f_cred);
   1179   1.2  jdolecek 	if (error) {
   1180   1.2  jdolecek 		vput(lvp);
   1181   1.2  jdolecek 		return (error);
   1182   1.2  jdolecek 	}
   1183   1.2  jdolecek 	VOP_UNLOCK(lvp, 0);
   1184  1.10       jrf 	fp->f_data = lvp;
   1185   1.2  jdolecek 	fp->f_offset = 0;
   1186  1.33        ad 	error = vn_close(vp, FREAD, fp->f_cred);
   1187   1.2  jdolecek 	if (error)
   1188   1.2  jdolecek 		return (error);
   1189   1.2  jdolecek 	*vpp = lvp;
   1190   1.2  jdolecek 	return (0);
   1191   1.1  jdolecek }
   1192