Home | History | Annotate | Line # | Download | only in ddb
db_lex.c revision 1.2
      1  1.1  cgd /*
      2  1.1  cgd  * Mach Operating System
      3  1.1  cgd  * Copyright (c) 1991,1990 Carnegie Mellon University
      4  1.1  cgd  * All Rights Reserved.
      5  1.1  cgd  *
      6  1.1  cgd  * Permission to use, copy, modify and distribute this software and its
      7  1.1  cgd  * documentation is hereby granted, provided that both the copyright
      8  1.1  cgd  * notice and this permission notice appear in all copies of the
      9  1.1  cgd  * software, derivative works or modified versions, and any portions
     10  1.1  cgd  * thereof, and that both notices appear in supporting documentation.
     11  1.1  cgd  *
     12  1.1  cgd  * CARNEGIE MELLON ALLOWS FREE USE OF THIS SOFTWARE IN ITS
     13  1.1  cgd  * CONDITION.  CARNEGIE MELLON DISCLAIMS ANY LIABILITY OF ANY KIND FOR
     14  1.1  cgd  * ANY DAMAGES WHATSOEVER RESULTING FROM THE USE OF THIS SOFTWARE.
     15  1.1  cgd  *
     16  1.1  cgd  * Carnegie Mellon requests users of this software to return to
     17  1.1  cgd  *
     18  1.1  cgd  *  Software Distribution Coordinator  or  Software.Distribution (at) CS.CMU.EDU
     19  1.1  cgd  *  School of Computer Science
     20  1.1  cgd  *  Carnegie Mellon University
     21  1.1  cgd  *  Pittsburgh PA 15213-3890
     22  1.1  cgd  *
     23  1.1  cgd  * any improvements or extensions that they make and grant Carnegie the
     24  1.1  cgd  * rights to redistribute these changes.
     25  1.1  cgd  */
     26  1.1  cgd /*
     27  1.2  cgd  * $Id: db_lex.c,v 1.2 1993/05/20 03:39:16 cgd Exp $
     28  1.2  cgd  *
     29  1.1  cgd  * HISTORY
     30  1.1  cgd  * $Log: db_lex.c,v $
     31  1.2  cgd  * Revision 1.2  1993/05/20 03:39:16  cgd
     32  1.2  cgd  * add explicit rcs id
     33  1.2  cgd  *
     34  1.1  cgd  * Revision 1.1.1.1  1993/03/21  09:46:26  cgd
     35  1.1  cgd  * initial import of 386bsd-0.1 sources
     36  1.1  cgd  *
     37  1.1  cgd  * Revision 1.1  1992/03/25  21:45:13  pace
     38  1.1  cgd  * Initial revision
     39  1.1  cgd  *
     40  1.1  cgd  * Revision 2.3  91/02/05  17:06:36  mrt
     41  1.1  cgd  * 	Changed to new Mach copyright
     42  1.1  cgd  * 	[91/01/31  16:18:20  mrt]
     43  1.1  cgd  *
     44  1.1  cgd  * Revision 2.2  90/08/27  21:51:10  dbg
     45  1.1  cgd  * 	Add 'dotdot' token.
     46  1.1  cgd  * 	[90/08/22            dbg]
     47  1.1  cgd  *
     48  1.1  cgd  * 	Allow backslash to quote any character into an identifier.
     49  1.1  cgd  * 	Allow colon in identifier for symbol table qualification.
     50  1.1  cgd  * 	[90/08/16            dbg]
     51  1.1  cgd  * 	Reduce lint.
     52  1.1  cgd  * 	[90/08/07            dbg]
     53  1.1  cgd  * 	Created.
     54  1.1  cgd  * 	[90/07/25            dbg]
     55  1.1  cgd  *
     56  1.1  cgd  */
     57  1.1  cgd /*
     58  1.1  cgd  *	Author: David B. Golub, Carnegie Mellon University
     59  1.1  cgd  *	Date:	7/90
     60  1.1  cgd  */
     61  1.1  cgd /*
     62  1.1  cgd  * Lexical analyzer.
     63  1.1  cgd  */
     64  1.1  cgd #include <ddb/db_lex.h>
     65  1.1  cgd 
     66  1.1  cgd char	db_line[120];
     67  1.1  cgd char *	db_lp, *db_endlp;
     68  1.1  cgd 
     69  1.1  cgd int
     70  1.1  cgd db_read_line()
     71  1.1  cgd {
     72  1.1  cgd 	int	i;
     73  1.1  cgd 
     74  1.1  cgd 	i = db_readline(db_line, sizeof(db_line));
     75  1.1  cgd 	if (i == 0)
     76  1.1  cgd 	    return (0);	/* EOI */
     77  1.1  cgd 	db_lp = db_line;
     78  1.1  cgd 	db_endlp = db_lp + i;
     79  1.1  cgd 	return (i);
     80  1.1  cgd }
     81  1.1  cgd 
     82  1.1  cgd void
     83  1.1  cgd db_flush_line()
     84  1.1  cgd {
     85  1.1  cgd 	db_lp = db_line;
     86  1.1  cgd 	db_endlp = db_line;
     87  1.1  cgd }
     88  1.1  cgd 
     89  1.1  cgd int	db_look_char = 0;
     90  1.1  cgd 
     91  1.1  cgd int
     92  1.1  cgd db_read_char()
     93  1.1  cgd {
     94  1.1  cgd 	int	c;
     95  1.1  cgd 
     96  1.1  cgd 	if (db_look_char != 0) {
     97  1.1  cgd 	    c = db_look_char;
     98  1.1  cgd 	    db_look_char = 0;
     99  1.1  cgd 	}
    100  1.1  cgd 	else if (db_lp >= db_endlp)
    101  1.1  cgd 	    c = -1;
    102  1.1  cgd 	else
    103  1.1  cgd 	    c = *db_lp++;
    104  1.1  cgd 	return (c);
    105  1.1  cgd }
    106  1.1  cgd 
    107  1.1  cgd void
    108  1.1  cgd db_unread_char(c)
    109  1.1  cgd {
    110  1.1  cgd 	db_look_char = c;
    111  1.1  cgd }
    112  1.1  cgd 
    113  1.1  cgd int	db_look_token = 0;
    114  1.1  cgd 
    115  1.1  cgd void
    116  1.1  cgd db_unread_token(t)
    117  1.1  cgd 	int	t;
    118  1.1  cgd {
    119  1.1  cgd 	db_look_token = t;
    120  1.1  cgd }
    121  1.1  cgd 
    122  1.1  cgd int
    123  1.1  cgd db_read_token()
    124  1.1  cgd {
    125  1.1  cgd 	int	t;
    126  1.1  cgd 
    127  1.1  cgd 	if (db_look_token) {
    128  1.1  cgd 	    t = db_look_token;
    129  1.1  cgd 	    db_look_token = 0;
    130  1.1  cgd 	}
    131  1.1  cgd 	else
    132  1.1  cgd 	    t = db_lex();
    133  1.1  cgd 	return (t);
    134  1.1  cgd }
    135  1.1  cgd 
    136  1.1  cgd int	db_tok_number;
    137  1.1  cgd char	db_tok_string[TOK_STRING_SIZE];
    138  1.1  cgd 
    139  1.1  cgd int	db_radix = 16;
    140  1.1  cgd 
    141  1.1  cgd void
    142  1.1  cgd db_flush_lex()
    143  1.1  cgd {
    144  1.1  cgd 	db_flush_line();
    145  1.1  cgd 	db_look_char = 0;
    146  1.1  cgd 	db_look_token = 0;
    147  1.1  cgd }
    148  1.1  cgd 
    149  1.1  cgd int
    150  1.1  cgd db_lex()
    151  1.1  cgd {
    152  1.1  cgd 	int	c;
    153  1.1  cgd 
    154  1.1  cgd 	c = db_read_char();
    155  1.1  cgd 	while (c <= ' ' || c > '~') {
    156  1.1  cgd 	    if (c == '\n' || c == -1)
    157  1.1  cgd 		return (tEOL);
    158  1.1  cgd 	    c = db_read_char();
    159  1.1  cgd 	}
    160  1.1  cgd 
    161  1.1  cgd 	if (c >= '0' && c <= '9') {
    162  1.1  cgd 	    /* number */
    163  1.1  cgd 	    int	r, digit;
    164  1.1  cgd 
    165  1.1  cgd 	    if (c > '0')
    166  1.1  cgd 		r = db_radix;
    167  1.1  cgd 	    else {
    168  1.1  cgd 		c = db_read_char();
    169  1.1  cgd 		if (c == 'O' || c == 'o')
    170  1.1  cgd 		    r = 8;
    171  1.1  cgd 		else if (c == 'T' || c == 't')
    172  1.1  cgd 		    r = 10;
    173  1.1  cgd 		else if (c == 'X' || c == 'x')
    174  1.1  cgd 		    r = 16;
    175  1.1  cgd 		else {
    176  1.1  cgd 		    r = db_radix;
    177  1.1  cgd 		    db_unread_char(c);
    178  1.1  cgd 		}
    179  1.1  cgd 		c = db_read_char();
    180  1.1  cgd 	    }
    181  1.1  cgd 	    db_tok_number = 0;
    182  1.1  cgd 	    for (;;) {
    183  1.1  cgd 		if (c >= '0' && c <= ((r == 8) ? '7' : '9'))
    184  1.1  cgd 		    digit = c - '0';
    185  1.1  cgd 		else if (r == 16 && ((c >= 'A' && c <= 'F') ||
    186  1.1  cgd 				     (c >= 'a' && c <= 'f'))) {
    187  1.1  cgd 		    if (c >= 'a')
    188  1.1  cgd 			digit = c - 'a' + 10;
    189  1.1  cgd 		    else if (c >= 'A')
    190  1.1  cgd 			digit = c - 'A' + 10;
    191  1.1  cgd 		}
    192  1.1  cgd 		else
    193  1.1  cgd 		    break;
    194  1.1  cgd 		db_tok_number = db_tok_number * r + digit;
    195  1.1  cgd 		c = db_read_char();
    196  1.1  cgd 	    }
    197  1.1  cgd 	    if ((c >= '0' && c <= '9') ||
    198  1.1  cgd 		(c >= 'A' && c <= 'Z') ||
    199  1.1  cgd 		(c >= 'a' && c <= 'z') ||
    200  1.1  cgd 		(c == '_'))
    201  1.1  cgd 	    {
    202  1.1  cgd 		db_error("Bad character in number\n");
    203  1.1  cgd 		db_flush_lex();
    204  1.1  cgd 		return (tEOF);
    205  1.1  cgd 	    }
    206  1.1  cgd 	    db_unread_char(c);
    207  1.1  cgd 	    return (tNUMBER);
    208  1.1  cgd 	}
    209  1.1  cgd 	if ((c >= 'A' && c <= 'Z') ||
    210  1.1  cgd 	    (c >= 'a' && c <= 'z') ||
    211  1.1  cgd 	    c == '_' || c == '\\')
    212  1.1  cgd 	{
    213  1.1  cgd 	    /* string */
    214  1.1  cgd 	    char *cp;
    215  1.1  cgd 
    216  1.1  cgd 	    cp = db_tok_string;
    217  1.1  cgd 	    if (c == '\\') {
    218  1.1  cgd 		c = db_read_char();
    219  1.1  cgd 		if (c == '\n' || c == -1)
    220  1.1  cgd 		    db_error("Bad escape\n");
    221  1.1  cgd 	    }
    222  1.1  cgd 	    *cp++ = c;
    223  1.1  cgd 	    while (1) {
    224  1.1  cgd 		c = db_read_char();
    225  1.1  cgd 		if ((c >= 'A' && c <= 'Z') ||
    226  1.1  cgd 		    (c >= 'a' && c <= 'z') ||
    227  1.1  cgd 		    (c >= '0' && c <= '9') ||
    228  1.1  cgd 		    c == '_' || c == '\\' || c == ':')
    229  1.1  cgd 		{
    230  1.1  cgd 		    if (c == '\\') {
    231  1.1  cgd 			c = db_read_char();
    232  1.1  cgd 			if (c == '\n' || c == -1)
    233  1.1  cgd 			    db_error("Bad escape\n");
    234  1.1  cgd 		    }
    235  1.1  cgd 		    *cp++ = c;
    236  1.1  cgd 		    if (cp == db_tok_string+sizeof(db_tok_string)) {
    237  1.1  cgd 			db_error("String too long\n");
    238  1.1  cgd 			db_flush_lex();
    239  1.1  cgd 			return (tEOF);
    240  1.1  cgd 		    }
    241  1.1  cgd 		    continue;
    242  1.1  cgd 		}
    243  1.1  cgd 		else {
    244  1.1  cgd 		    *cp = '\0';
    245  1.1  cgd 		    break;
    246  1.1  cgd 		}
    247  1.1  cgd 	    }
    248  1.1  cgd 	    db_unread_char(c);
    249  1.1  cgd 	    return (tIDENT);
    250  1.1  cgd 	}
    251  1.1  cgd 
    252  1.1  cgd 	switch (c) {
    253  1.1  cgd 	    case '+':
    254  1.1  cgd 		return (tPLUS);
    255  1.1  cgd 	    case '-':
    256  1.1  cgd 		return (tMINUS);
    257  1.1  cgd 	    case '.':
    258  1.1  cgd 		c = db_read_char();
    259  1.1  cgd 		if (c == '.')
    260  1.1  cgd 		    return (tDOTDOT);
    261  1.1  cgd 		db_unread_char(c);
    262  1.1  cgd 		return (tDOT);
    263  1.1  cgd 	    case '*':
    264  1.1  cgd 		return (tSTAR);
    265  1.1  cgd 	    case '/':
    266  1.1  cgd 		return (tSLASH);
    267  1.1  cgd 	    case '=':
    268  1.1  cgd 		return (tEQ);
    269  1.1  cgd 	    case '%':
    270  1.1  cgd 		return (tPCT);
    271  1.1  cgd 	    case '#':
    272  1.1  cgd 		return (tHASH);
    273  1.1  cgd 	    case '(':
    274  1.1  cgd 		return (tLPAREN);
    275  1.1  cgd 	    case ')':
    276  1.1  cgd 		return (tRPAREN);
    277  1.1  cgd 	    case ',':
    278  1.1  cgd 		return (tCOMMA);
    279  1.1  cgd 	    case '"':
    280  1.1  cgd 		return (tDITTO);
    281  1.1  cgd 	    case '$':
    282  1.1  cgd 		return (tDOLLAR);
    283  1.1  cgd 	    case '!':
    284  1.1  cgd 		return (tEXCL);
    285  1.1  cgd 	    case '<':
    286  1.1  cgd 		c = db_read_char();
    287  1.1  cgd 		if (c == '<')
    288  1.1  cgd 		    return (tSHIFT_L);
    289  1.1  cgd 		db_unread_char(c);
    290  1.1  cgd 		break;
    291  1.1  cgd 	    case '>':
    292  1.1  cgd 		c = db_read_char();
    293  1.1  cgd 		if (c == '>')
    294  1.1  cgd 		    return (tSHIFT_R);
    295  1.1  cgd 		db_unread_char(c);
    296  1.1  cgd 		break;
    297  1.1  cgd 	    case -1:
    298  1.1  cgd 		return (tEOF);
    299  1.1  cgd 	}
    300  1.1  cgd 	db_printf("Bad character\n");
    301           	db_flush_lex();
    302           	return (tEOF);
    303           }
    304