sys/ddb/db_lex.c

1.1  cgd /*
1.1  cgd  * Mach Operating System
1.1  cgd  * Copyright (c) 1991,1990 Carnegie Mellon University
1.1  cgd  * All Rights Reserved.
1.1  cgd  *
1.1  cgd  * Permission to use, copy, modify and distribute this software and its
1.1  cgd  * documentation is hereby granted, provided that both the copyright
1.1  cgd  * notice and this permission notice appear in all copies of the
1.1  cgd  * software, derivative works or modified versions, and any portions
1.1  cgd  * thereof, and that both notices appear in supporting documentation.
1.1  cgd  *
1.1  cgd  * CARNEGIE MELLON ALLOWS FREE USE OF THIS SOFTWARE IN ITS
1.1  cgd  * CONDITION.  CARNEGIE MELLON DISCLAIMS ANY LIABILITY OF ANY KIND FOR
1.1  cgd  * ANY DAMAGES WHATSOEVER RESULTING FROM THE USE OF THIS SOFTWARE.
1.1  cgd  *
1.1  cgd  * Carnegie Mellon requests users of this software to return to
1.1  cgd  *
1.1  cgd  *  Software Distribution Coordinator  or  Software.Distribution (at) CS.CMU.EDU
1.1  cgd  *  School of Computer Science
1.1  cgd  *  Carnegie Mellon University
1.1  cgd  *  Pittsburgh PA 15213-3890
1.1  cgd  *
1.1  cgd  * any improvements or extensions that they make and grant Carnegie the
1.1  cgd  * rights to redistribute these changes.
1.1  cgd  */
1.1  cgd /*
1.2  cgd  * $Id: db_lex.c,v 1.2 1993/05/20 03:39:16 cgd Exp $
1.2  cgd  *
1.1  cgd  * HISTORY
1.1  cgd  * $Log: db_lex.c,v $
1.2  cgd  * Revision 1.2  1993/05/20 03:39:16  cgd
1.2  cgd  * add explicit rcs id
1.2  cgd  *
1.1  cgd  * Revision 1.1.1.1  1993/03/21  09:46:26  cgd
1.1  cgd  * initial import of 386bsd-0.1 sources
1.1  cgd  *
1.1  cgd  * Revision 1.1  1992/03/25  21:45:13  pace
1.1  cgd  * Initial revision
1.1  cgd  *
1.1  cgd  * Revision 2.3  91/02/05  17:06:36  mrt
1.1  cgd  * 	Changed to new Mach copyright
1.1  cgd  * 	[91/01/31  16:18:20  mrt]
1.1  cgd  *
1.1  cgd  * Revision 2.2  90/08/27  21:51:10  dbg
1.1  cgd  * 	Add 'dotdot' token.
1.1  cgd  * 	[90/08/22            dbg]
1.1  cgd  *
1.1  cgd  * 	Allow backslash to quote any character into an identifier.
1.1  cgd  * 	Allow colon in identifier for symbol table qualification.
1.1  cgd  * 	[90/08/16            dbg]
1.1  cgd  * 	Reduce lint.
1.1  cgd  * 	[90/08/07            dbg]
1.1  cgd  * 	Created.
1.1  cgd  * 	[90/07/25            dbg]
1.1  cgd  *
1.1  cgd  */
1.1  cgd /*
1.1  cgd  *	Author: David B. Golub, Carnegie Mellon University
1.1  cgd  *	Date:	7/90
1.1  cgd  */
1.1  cgd /*
1.1  cgd  * Lexical analyzer.
1.1  cgd  */
1.1  cgd #include <ddb/db_lex.h>
1.1  cgd
1.1  cgd char	db_line[120];
1.1  cgd char *	db_lp, *db_endlp;
1.1  cgd
1.1  cgd int
1.1  cgd db_read_line()
1.1  cgd {
1.1  cgd 	int	i;
1.1  cgd
1.1  cgd 	i = db_readline(db_line, sizeof(db_line));
1.1  cgd 	if (i == 0)
1.1  cgd 	    return (0);	/* EOI */
1.1  cgd 	db_lp = db_line;
1.1  cgd 	db_endlp = db_lp + i;
1.1  cgd 	return (i);
1.1  cgd }
1.1  cgd
1.1  cgd void
1.1  cgd db_flush_line()
1.1  cgd {
1.1  cgd 	db_lp = db_line;
1.1  cgd 	db_endlp = db_line;
1.1  cgd }
1.1  cgd
1.1  cgd int	db_look_char = 0;
1.1  cgd
1.1  cgd int
1.1  cgd db_read_char()
1.1  cgd {
1.1  cgd 	int	c;
1.1  cgd
1.1  cgd 	if (db_look_char != 0) {
1.1  cgd 	    c = db_look_char;
1.1  cgd 	    db_look_char = 0;
1.1  cgd 	}
1.1  cgd 	else if (db_lp >= db_endlp)
1.1  cgd 	    c = -1;
1.1  cgd 	else
1.1  cgd 	    c = *db_lp++;
1.1  cgd 	return (c);
1.1  cgd }
1.1  cgd
1.1  cgd void
1.1  cgd db_unread_char(c)
1.1  cgd {
1.1  cgd 	db_look_char = c;
1.1  cgd }
1.1  cgd
1.1  cgd int	db_look_token = 0;
1.1  cgd
1.1  cgd void
1.1  cgd db_unread_token(t)
1.1  cgd 	int	t;
1.1  cgd {
1.1  cgd 	db_look_token = t;
1.1  cgd }
1.1  cgd
1.1  cgd int
1.1  cgd db_read_token()
1.1  cgd {
1.1  cgd 	int	t;
1.1  cgd
1.1  cgd 	if (db_look_token) {
1.1  cgd 	    t = db_look_token;
1.1  cgd 	    db_look_token = 0;
1.1  cgd 	}
1.1  cgd 	else
1.1  cgd 	    t = db_lex();
1.1  cgd 	return (t);
1.1  cgd }
1.1  cgd
1.1  cgd int	db_tok_number;
1.1  cgd char	db_tok_string[TOK_STRING_SIZE];
1.1  cgd
1.1  cgd int	db_radix = 16;
1.1  cgd
1.1  cgd void
1.1  cgd db_flush_lex()
1.1  cgd {
1.1  cgd 	db_flush_line();
1.1  cgd 	db_look_char = 0;
1.1  cgd 	db_look_token = 0;
1.1  cgd }
1.1  cgd
1.1  cgd int
1.1  cgd db_lex()
1.1  cgd {
1.1  cgd 	int	c;
1.1  cgd
1.1  cgd 	c = db_read_char();
1.1  cgd 	while (c <= ' ' || c > '~') {
1.1  cgd 	    if (c == '\n' || c == -1)
1.1  cgd 		return (tEOL);
1.1  cgd 	    c = db_read_char();
1.1  cgd 	}
1.1  cgd
1.1  cgd 	if (c >= '0' && c <= '9') {
1.1  cgd 	    /* number */
1.1  cgd 	    int	r, digit;
1.1  cgd
1.1  cgd 	    if (c > '0')
1.1  cgd 		r = db_radix;
1.1  cgd 	    else {
1.1  cgd 		c = db_read_char();
1.1  cgd 		if (c == 'O' || c == 'o')
1.1  cgd 		    r = 8;
1.1  cgd 		else if (c == 'T' || c == 't')
1.1  cgd 		    r = 10;
1.1  cgd 		else if (c == 'X' || c == 'x')
1.1  cgd 		    r = 16;
1.1  cgd 		else {
1.1  cgd 		    r = db_radix;
1.1  cgd 		    db_unread_char(c);
1.1  cgd 		}
1.1  cgd 		c = db_read_char();
1.1  cgd 	    }
1.1  cgd 	    db_tok_number = 0;
1.1  cgd 	    for (;;) {
1.1  cgd 		if (c >= '0' && c <= ((r == 8) ? '7' : '9'))
1.1  cgd 		    digit = c - '0';
1.1  cgd 		else if (r == 16 && ((c >= 'A' && c <= 'F') ||
1.1  cgd 				     (c >= 'a' && c <= 'f'))) {
1.1  cgd 		    if (c >= 'a')
1.1  cgd 			digit = c - 'a' + 10;
1.1  cgd 		    else if (c >= 'A')
1.1  cgd 			digit = c - 'A' + 10;
1.1  cgd 		}
1.1  cgd 		else
1.1  cgd 		    break;
1.1  cgd 		db_tok_number = db_tok_number * r + digit;
1.1  cgd 		c = db_read_char();
1.1  cgd 	    }
1.1  cgd 	    if ((c >= '0' && c <= '9') ||
1.1  cgd 		(c >= 'A' && c <= 'Z') ||
1.1  cgd 		(c >= 'a' && c <= 'z') ||
1.1  cgd 		(c == '_'))
1.1  cgd 	    {
1.1  cgd 		db_error("Bad character in number\n");
1.1  cgd 		db_flush_lex();
1.1  cgd 		return (tEOF);
1.1  cgd 	    }
1.1  cgd 	    db_unread_char(c);
1.1  cgd 	    return (tNUMBER);
1.1  cgd 	}
1.1  cgd 	if ((c >= 'A' && c <= 'Z') ||
1.1  cgd 	    (c >= 'a' && c <= 'z') ||
1.1  cgd 	    c == '_' || c == '\\')
1.1  cgd 	{
1.1  cgd 	    /* string */
1.1  cgd 	    char *cp;
1.1  cgd
1.1  cgd 	    cp = db_tok_string;
1.1  cgd 	    if (c == '\\') {
1.1  cgd 		c = db_read_char();
1.1  cgd 		if (c == '\n' || c == -1)
1.1  cgd 		    db_error("Bad escape\n");
1.1  cgd 	    }
1.1  cgd 	    *cp++ = c;
1.1  cgd 	    while (1) {
1.1  cgd 		c = db_read_char();
1.1  cgd 		if ((c >= 'A' && c <= 'Z') ||
1.1  cgd 		    (c >= 'a' && c <= 'z') ||
1.1  cgd 		    (c >= '0' && c <= '9') ||
1.1  cgd 		    c == '_' || c == '\\' || c == ':')
1.1  cgd 		{
1.1  cgd 		    if (c == '\\') {
1.1  cgd 			c = db_read_char();
1.1  cgd 			if (c == '\n' || c == -1)
1.1  cgd 			    db_error("Bad escape\n");
1.1  cgd 		    }
1.1  cgd 		    *cp++ = c;
1.1  cgd 		    if (cp == db_tok_string+sizeof(db_tok_string)) {
1.1  cgd 			db_error("String too long\n");
1.1  cgd 			db_flush_lex();
1.1  cgd 			return (tEOF);
1.1  cgd 		    }
1.1  cgd 		    continue;
1.1  cgd 		}
1.1  cgd 		else {
1.1  cgd 		    *cp = '\0';
1.1  cgd 		    break;
1.1  cgd 		}
1.1  cgd 	    }
1.1  cgd 	    db_unread_char(c);
1.1  cgd 	    return (tIDENT);
1.1  cgd 	}
1.1  cgd
1.1  cgd 	switch (c) {
1.1  cgd 	    case '+':
1.1  cgd 		return (tPLUS);
1.1  cgd 	    case '-':
1.1  cgd 		return (tMINUS);
1.1  cgd 	    case '.':
1.1  cgd 		c = db_read_char();
1.1  cgd 		if (c == '.')
1.1  cgd 		    return (tDOTDOT);
1.1  cgd 		db_unread_char(c);
1.1  cgd 		return (tDOT);
1.1  cgd 	    case '*':
1.1  cgd 		return (tSTAR);
1.1  cgd 	    case '/':
1.1  cgd 		return (tSLASH);
1.1  cgd 	    case '=':
1.1  cgd 		return (tEQ);
1.1  cgd 	    case '%':
1.1  cgd 		return (tPCT);
1.1  cgd 	    case '#':
1.1  cgd 		return (tHASH);
1.1  cgd 	    case '(':
1.1  cgd 		return (tLPAREN);
1.1  cgd 	    case ')':
1.1  cgd 		return (tRPAREN);
1.1  cgd 	    case ',':
1.1  cgd 		return (tCOMMA);
1.1  cgd 	    case '"':
1.1  cgd 		return (tDITTO);
1.1  cgd 	    case '$':
1.1  cgd 		return (tDOLLAR);
1.1  cgd 	    case '!':
1.1  cgd 		return (tEXCL);
1.1  cgd 	    case '<':
1.1  cgd 		c = db_read_char();
1.1  cgd 		if (c == '<')
1.1  cgd 		    return (tSHIFT_L);
1.1  cgd 		db_unread_char(c);
1.1  cgd 		break;
1.1  cgd 	    case '>':
1.1  cgd 		c = db_read_char();
1.1  cgd 		if (c == '>')
1.1  cgd 		    return (tSHIFT_R);
1.1  cgd 		db_unread_char(c);
1.1  cgd 		break;
1.1  cgd 	    case -1:
1.1  cgd 		return (tEOF);
1.1  cgd 	}
1.1  cgd 	db_printf("Bad character\n");
         	db_flush_lex();
         	return (tEOF);
         }