Oops, I forgot to commit the ChangeLog
[fw/sdcc] / support / cpp2 / cpphash.h
1 /* Part of CPP library.
2    Copyright (C) 1997, 1998, 1999, 2000, 2001 Free Software Foundation, Inc.
3
4 This program is free software; you can redistribute it and/or modify it
5 under the terms of the GNU General Public License as published by the
6 Free Software Foundation; either version 2, or (at your option) any
7 later version.
8
9 This program is distributed in the hope that it will be useful,
10 but WITHOUT ANY WARRANTY; without even the implied warranty of
11 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12 GNU General Public License for more details.
13
14 You should have received a copy of the GNU General Public License
15 along with this program; if not, write to the Free Software
16 Foundation, 59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.  */
17
18 /* This header defines all the internal data structures and functions
19    that need to be visible across files.  It's called cpphash.h for
20    historical reasons.  */
21
22 #ifndef GCC_CPPHASH_H
23 #define GCC_CPPHASH_H
24
25 #include "hashtable.h"
26
27 struct directive;               /* Deliberately incomplete.  */
28
29 /* Test if a sign is valid within a preprocessing number.  */
30 #define VALID_SIGN(c, prevc) \
31   (((c) == '+' || (c) == '-') && \
32    ((prevc) == 'e' || (prevc) == 'E' \
33     || (((prevc) == 'p' || (prevc) == 'P') \
34         && CPP_OPTION (pfile, extended_numbers))))
35
36 #define CPP_OPTION(PFILE, OPTION) ((PFILE)->opts.OPTION)
37 #define CPP_BUFFER(PFILE) ((PFILE)->buffer)
38 #define CPP_BUF_LINE(BUF) ((BUF)->lineno)
39 #define CPP_BUF_COLUMN(BUF, CUR) ((CUR) - (BUF)->line_base + (BUF)->col_adjust)
40 #define CPP_BUF_COL(BUF) CPP_BUF_COLUMN(BUF, (BUF)->cur)
41
42 /* Maximum nesting of cpp_buffers.  We use a static limit, partly for
43    efficiency, and partly to limit runaway recursion.  */
44 #define CPP_STACK_MAX 200
45
46 /* Memory pools.  */
47 #define POOL_ALIGN(size, align) (((size) + ((align) - 1)) & ~((align) - 1))
48 #define POOL_FRONT(p) ((p)->cur->front)
49 #define POOL_LIMIT(p) ((p)->cur->limit)
50 #define POOL_BASE(p)  ((p)->cur->base)
51 #define POOL_SIZE(p)  ((p)->cur->limit - (p)->cur->base)
52 #define POOL_ROOM(p)  ((p)->cur->limit - (p)->cur->front)
53 #define POOL_USED(p)  ((p)->cur->front - (p)->cur->base)
54 #define POOL_COMMIT(p, len) do {\
55   ((p)->cur->front += POOL_ALIGN (len, (p)->align));\
56   if ((p)->cur->front > (p)->cur->limit) abort ();} while (0)
57
58 typedef struct cpp_chunk cpp_chunk;
59 struct cpp_chunk
60 {
61   cpp_chunk *next;
62   unsigned char *front;
63   unsigned char *limit;
64   unsigned char *base;
65 };
66
67 typedef struct cpp_pool cpp_pool;
68 struct cpp_pool
69 {
70   struct cpp_chunk *cur, *locked;
71   unsigned char *pos;           /* Current position.  */
72   unsigned int align;
73   unsigned int locks;
74 };
75
76 /* List of directories to look for include files in.  */
77 struct search_path
78 {
79   struct search_path *next;
80
81   /* NOTE: NAME may not be null terminated for the case of the current
82      file's directory!  */
83   const char *name;
84   unsigned int len;
85   /* We use these to tell if the directory mentioned here is a duplicate
86      of an earlier directory on the search path.  */
87   ino_t ino;
88   dev_t dev;
89   /* Non-zero if it is a system include directory.  */
90   int sysp;
91   /* Mapping of file names for this directory.  Only used on MS-DOS
92      and related platforms.  */
93   struct file_name_map *name_map;
94 };
95
96 /* Multiple-include optimisation.  */
97 enum mi_state {MI_FAILED = 0, MI_OUTSIDE};
98 enum mi_ind {MI_IND_NONE = 0, MI_IND_NOT};
99
100 /* #include types.  */
101 enum include_type {IT_INCLUDE, IT_INCLUDE_NEXT, IT_IMPORT, IT_CMDLINE};
102
103 typedef struct toklist toklist;
104 struct toklist
105 {
106   cpp_token *first;
107   cpp_token *limit;
108 };
109
110 typedef struct cpp_context cpp_context;
111 struct cpp_context
112 {
113   /* Doubly-linked list.  */
114   cpp_context *next, *prev;
115
116   /* Contexts other than the base context are contiguous tokens.
117      e.g. macro expansions, expanded argument tokens.  */
118   struct toklist list;
119
120   /* For a macro context, these are the macro and its arguments.  */
121   cpp_macro *macro;
122 };
123
124 struct lexer_state
125 {
126   /* Nonzero if first token on line is CPP_HASH.  */
127   unsigned char in_directive;
128
129   /* Nonzero if in a directive that takes angle-bracketed headers.  */
130   unsigned char angled_headers;
131
132   /* Nonzero to save comments.  Turned off if discard_comments, and in
133      all directives apart from #define.  */
134   unsigned char save_comments;
135
136   /* If nonzero the next token is at the beginning of the line.  */
137   unsigned char next_bol;
138
139   /* Nonzero if we're mid-comment.  */
140   unsigned char lexing_comment;
141
142   /* Nonzero if lexing __VA_ARGS__ is valid.  */
143   unsigned char va_args_ok;
144
145   /* Nonzero if lexing poisoned identifiers is valid.  */
146   unsigned char poisoned_ok;
147
148   /* Nonzero to prevent macro expansion.  */
149   unsigned char prevent_expansion;  
150
151   /* Nonzero when parsing arguments to a function-like macro.  */
152   unsigned char parsing_args;
153
154   /* Nonzero when in a # NUMBER directive.  */
155   unsigned char line_extension;
156 };
157
158 /* Special nodes - identifiers with predefined significance.  */
159 struct spec_nodes
160 {
161   cpp_hashnode *n_L;                    /* L"str" */
162   cpp_hashnode *n_defined;              /* defined operator */
163   cpp_hashnode *n_true;                 /* C++ keyword true */
164   cpp_hashnode *n_false;                /* C++ keyword false */
165   cpp_hashnode *n__Pragma;              /* _Pragma operator */
166   cpp_hashnode *n__STRICT_ANSI__;       /* STDC_0_IN_SYSTEM_HEADERS */
167   cpp_hashnode *n__CHAR_UNSIGNED__;     /* plain char is unsigned */
168   cpp_hashnode *n__VA_ARGS__;           /* C99 vararg macros */
169   /* SDCC _asm specific */
170   cpp_hashnode *n__asm;                 /* _asm ... _endasm ; */
171 };
172
173 struct cpp_buffer
174 {
175   const unsigned char *cur;      /* current position */
176   const unsigned char *rlimit; /* end of valid data */
177   const unsigned char *line_base; /* start of current line */
178   cppchar_t read_ahead;         /* read ahead character */
179   cppchar_t extra_char;         /* extra read-ahead for long tokens.  */
180
181   struct cpp_reader *pfile;     /* Owns this buffer.  */
182   struct cpp_buffer *prev;
183
184   const unsigned char *buf;      /* entire buffer */
185
186   /* Filename specified with #line command.  */
187   const char *nominal_fname;
188
189   /* Pointer into the include table.  Used for include_next and
190      to record control macros. */
191   struct include_file *inc;
192
193   /* Value of if_stack at start of this file.
194      Used to prohibit unmatched #endif (etc) in an include file.  */
195   struct if_stack *if_stack;
196
197   /* Token column position adjustment owing to tabs in whitespace.  */
198   unsigned int col_adjust;
199
200   /* Line number at line_base (above). */
201   unsigned int lineno;
202
203   /* Contains PREV_WHITE and/or AVOID_LPASTE.  */
204   unsigned char saved_flags;
205
206   /* Because of the way the lexer works, -Wtrigraphs can sometimes
207      warn twice for the same trigraph.  This helps prevent that.  */
208   const unsigned char *last_Wtrigraphs;
209
210   /* True if we have already warned about C++ comments in this file.
211      The warning happens only for C89 extended mode with -pedantic on,
212      or for -Wtraditional, and only once per file (otherwise it would
213      be far too noisy).  */
214   unsigned char warned_cplusplus_comments;
215
216   /* True if we don't process trigraphs and escaped newlines.  True
217      for preprocessed input, command line directives, and _Pragma
218      buffers.  */
219   unsigned char from_stage3;
220
221   /* Temporary storage for pfile->skipping whilst in a directive.  */
222   unsigned char was_skipping;
223
224   /* 1 = system header file, 2 = C system header file used for C++.  */
225   unsigned char sysp;
226
227   /* Nonzero means we have printed (while error reporting) a list of
228      containing files that matches the current status.  */
229   unsigned char include_stack_listed;
230
231   /* Nonzero means that the directory to start searching for ""
232      include files has been calculated and stored in "dir" below.  */
233   unsigned char search_cached;
234
235   /* Buffer type.  */
236   ENUM_BITFIELD (cpp_buffer_type) type : 8;
237
238   /* The directory of the this buffer's file.  Its NAME member is not
239      allocated, so we don't need to worry about freeing it.  */
240   struct search_path dir;
241 };
242
243 /* A cpp_reader encapsulates the "state" of a pre-processor run.
244    Applying cpp_get_token repeatedly yields a stream of pre-processor
245    tokens.  Usually, there is only one cpp_reader object active.  */
246
247 struct cpp_reader
248 {
249   /* Top of buffer stack.  */
250   cpp_buffer *buffer;
251
252   /* Lexer state.  */
253   struct lexer_state state;
254
255   /* The position of the last lexed token and last lexed directive.  */
256   cpp_lexer_pos lexer_pos;
257   cpp_lexer_pos directive_pos;
258
259   /* Memory pools.  */
260   cpp_pool ident_pool;          /* For all identifiers, and permanent
261                                    numbers and strings.  */
262   cpp_pool macro_pool;          /* For macro definitions.  Permanent.  */
263   cpp_pool argument_pool;       /* For macro arguments.  Temporary.   */
264
265   /* Context stack.  */
266   struct cpp_context base_context;
267   struct cpp_context *context;
268
269   /* If in_directive, the directive if known.  */
270   const struct directive *directive;
271
272   /* Multiple inlcude optimisation.  */
273   enum mi_state mi_state;
274   enum mi_ind mi_if_not_defined;
275   unsigned int mi_lexed;
276   const cpp_hashnode *mi_cmacro;
277   const cpp_hashnode *mi_ind_cmacro;
278
279   /* Token lookahead.  */
280   struct cpp_lookahead *la_read;        /* Read from this lookahead.  */
281   struct cpp_lookahead *la_write;       /* Write to this lookahead.  */
282   struct cpp_lookahead *la_unused;      /* Free store.  */
283   struct cpp_lookahead *la_saved;       /* Backup when entering directive.  */
284
285   /* Error counter for exit code.  */
286   unsigned int errors;
287
288   /* Line and column where a newline was first seen in a string
289      constant (multi-line strings).  */
290   cpp_lexer_pos mlstring_pos;
291
292   /* Buffer to hold macro definition string.  */
293   unsigned char *macro_buffer;
294   unsigned int macro_buffer_len;
295
296   /* Current depth in #include directives that use <...>.  */
297   unsigned int system_include_depth;
298
299   /* Current depth of buffer stack.  */
300   unsigned int buffer_stack_depth;
301
302   /* Current depth in #include directives.  */
303   unsigned int include_depth;
304
305   /* Tree of other included files.  See cppfiles.c.  */
306   struct splay_tree_s *all_include_files;
307
308   /* Current maximum length of directory names in the search path
309      for include files.  (Altered as we get more of them.)  */
310   unsigned int max_include_len;
311
312   /* Date and time tokens.  Calculated together if either is requested.  */
313   cpp_token date;
314   cpp_token time;
315
316   /* Opaque handle to the dependencies of mkdeps.c.  Used by -M etc.  */
317   struct deps *deps;
318
319   /* Obstack holding all macro hash nodes.  This never shrinks.
320      See cpphash.c */
321   struct obstack hash_ob;
322
323   /* Obstack holding buffer and conditional structures.  This is a
324      real stack.  See cpplib.c.  */
325   struct obstack buffer_ob;
326
327   /* Pragma table - dynamic, because a library user can add to the
328      list of recognized pragmas.  */
329   struct pragma_entry *pragmas;
330
331   /* Call backs.  */
332   struct cpp_callbacks cb;
333
334   /* Identifier hash table.  */ 
335   struct ht *hash_table;
336
337   /* User visible options.  */
338   struct cpp_options opts;
339
340   /* Special nodes - identifiers with predefined significance to the
341      preprocessor.  */
342   struct spec_nodes spec_nodes;
343
344   /* We're printed a warning recommending against using #import.  */
345   unsigned char import_warning;
346
347   /* True if we are skipping a failed conditional group.  */
348   unsigned char skipping;
349
350   /* Whether to print our version number.  Done this way so
351      we don't get it twice for -v -version.  */
352   unsigned char print_version;
353
354   /* Whether cpplib owns the hashtable.  */
355   unsigned char our_hashtable;
356 };
357
358 /* Character classes.  Based on the more primitive macros in safe-ctype.h.
359    If the definition of `numchar' looks odd to you, please look up the
360    definition of a pp-number in the C standard [section 6.4.8 of C99].
361
362    In the unlikely event that characters other than \r and \n enter
363    the set is_vspace, the macro handle_newline() in cpplex.c must be
364    updated.  */
365 #define _dollar_ok(x)   ((x) == '$' && CPP_OPTION (pfile, dollars_in_ident))
366
367 #define is_idchar(x)    (ISIDNUM(x) || _dollar_ok(x))
368 #define is_numchar(x)   ISIDNUM(x)
369 #define is_idstart(x)   (ISIDST(x) || _dollar_ok(x))
370 #define is_numstart(x)  ISDIGIT(x)
371 #define is_hspace(x)    ISBLANK(x)
372 #define is_vspace(x)    IS_VSPACE(x)
373 #define is_nvspace(x)   IS_NVSPACE(x)
374 #define is_space(x)     IS_SPACE_OR_NUL(x)
375
376 /* This table is constant if it can be initialized at compile time,
377    which is the case if cpp was compiled with GCC >=2.7, or another
378    compiler that supports C99.  */
379 #if HAVE_DESIGNATED_INITIALIZERS
380 extern const unsigned char _cpp_trigraph_map[UCHAR_MAX + 1];
381 #else
382 extern unsigned char _cpp_trigraph_map[UCHAR_MAX + 1];
383 #endif
384
385 /* Macros.  */
386
387 #define CPP_PRINT_DEPS(PFILE) CPP_OPTION (PFILE, print_deps)
388 #define CPP_IN_SYSTEM_HEADER(PFILE) \
389   (CPP_BUFFER (PFILE) && CPP_BUFFER (PFILE)->sysp)
390 #define CPP_PEDANTIC(PF) CPP_OPTION (PF, pedantic)
391 #define CPP_WTRADITIONAL(PF) CPP_OPTION (PF, warn_traditional)
392
393 /* In cpperror.c  */
394 enum error_type { WARNING = 0, WARNING_SYSHDR, PEDWARN, ERROR, FATAL, ICE };
395 extern int _cpp_begin_message PARAMS ((cpp_reader *, enum error_type,
396                                        const char *, const cpp_lexer_pos *));
397
398 /* In cppmacro.c */
399 extern void _cpp_free_definition        PARAMS ((cpp_hashnode *));
400 extern int _cpp_create_definition       PARAMS ((cpp_reader *, cpp_hashnode *));
401 extern void _cpp_pop_context            PARAMS ((cpp_reader *));
402 extern void _cpp_free_lookaheads        PARAMS ((cpp_reader *));
403 extern void _cpp_release_lookahead      PARAMS ((cpp_reader *));
404 extern void _cpp_push_token             PARAMS ((cpp_reader *, const cpp_token *,
405                                                  const cpp_lexer_pos *));
406
407 /* In cpphash.c */
408 extern void _cpp_init_hashtable         PARAMS ((cpp_reader *, hash_table *));
409 extern void _cpp_destroy_hashtable      PARAMS ((cpp_reader *));
410
411 /* In cppfiles.c */
412 extern void _cpp_fake_include           PARAMS ((cpp_reader *, const char *));
413 extern void _cpp_never_reread           PARAMS ((struct include_file *));
414 extern char *_cpp_simplify_pathname     PARAMS ((char *));
415 extern int _cpp_read_file               PARAMS ((cpp_reader *, const char *));
416 extern int _cpp_execute_include         PARAMS ((cpp_reader *,
417                                                  const cpp_token *,
418                                                  enum include_type));
419 extern int _cpp_compare_file_date       PARAMS ((cpp_reader *,
420                                                  const cpp_token *));
421 extern void _cpp_report_missing_guards  PARAMS ((cpp_reader *));
422 extern void _cpp_init_includes          PARAMS ((cpp_reader *));
423 extern void _cpp_cleanup_includes       PARAMS ((cpp_reader *));
424 extern void _cpp_pop_file_buffer        PARAMS ((cpp_reader *, cpp_buffer *));
425
426 /* In cppexp.c */
427 extern int _cpp_parse_expr              PARAMS ((cpp_reader *));
428
429 /* In cpplex.c */
430 extern void _cpp_lex_token              PARAMS ((cpp_reader *, cpp_token *));
431 extern int _cpp_equiv_tokens            PARAMS ((const cpp_token *,
432                                                  const cpp_token *));
433 extern void _cpp_init_pool              PARAMS ((cpp_pool *, unsigned int,
434                                                   unsigned int, unsigned int));
435 extern void _cpp_free_pool              PARAMS ((cpp_pool *));
436 extern unsigned char *_cpp_pool_reserve PARAMS ((cpp_pool *, unsigned int));
437 extern unsigned char *_cpp_pool_alloc   PARAMS ((cpp_pool *, unsigned int));
438 extern unsigned char *_cpp_next_chunk   PARAMS ((cpp_pool *, unsigned int,
439                                                  unsigned char **));
440 extern void _cpp_lock_pool              PARAMS ((cpp_pool *));
441 extern void _cpp_unlock_pool            PARAMS ((cpp_pool *));
442
443 /* In cpplib.c */
444 extern int _cpp_test_assertion PARAMS ((cpp_reader *, int *));
445 extern int _cpp_handle_directive PARAMS ((cpp_reader *, int));
446 extern void _cpp_define_builtin PARAMS ((cpp_reader *, const char *));
447 extern void _cpp_do__Pragma     PARAMS ((cpp_reader *));
448 extern void _cpp_init_directives PARAMS ((cpp_reader *));
449 extern void _cpp_init_internal_pragmas PARAMS ((cpp_reader *));
450 extern void _cpp_do_file_change PARAMS ((cpp_reader *, enum cpp_fc_reason,
451                                          const char *, unsigned int));
452
453 /* Utility routines and macros.  */
454 #define DSC(str) (const U_CHAR *)str, sizeof str - 1
455 #define xnew(T)         (T *) xmalloc (sizeof(T))
456 #define xcnew(T)        (T *) xcalloc (1, sizeof(T))
457 #define xnewvec(T, N)   (T *) xmalloc (sizeof(T) * (N))
458 #define xcnewvec(T, N)  (T *) xcalloc (N, sizeof(T))
459 #define xobnew(O, T)    (T *) obstack_alloc (O, sizeof(T))
460
461 /* These are inline functions instead of macros so we can get type
462    checking.  */
463 typedef unsigned char U_CHAR;
464 #define U (const U_CHAR *)  /* Intended use: U"string" */
465
466 static inline int ustrcmp       PARAMS ((const U_CHAR *, const U_CHAR *));
467 static inline int ustrncmp      PARAMS ((const U_CHAR *, const U_CHAR *,
468                                          size_t));
469 static inline size_t ustrlen    PARAMS ((const U_CHAR *));
470 static inline U_CHAR *uxstrdup  PARAMS ((const U_CHAR *));
471 static inline U_CHAR *ustrchr   PARAMS ((const U_CHAR *, int));
472 static inline int ufputs        PARAMS ((const U_CHAR *, FILE *));
473
474 static inline int
475 ustrcmp (s1, s2)
476      const U_CHAR *s1, *s2;
477 {
478   return strcmp ((const char *)s1, (const char *)s2);
479 }
480
481 static inline int
482 ustrncmp (s1, s2, n)
483      const U_CHAR *s1, *s2;
484      size_t n;
485 {
486   return strncmp ((const char *)s1, (const char *)s2, n);
487 }
488
489 static inline size_t
490 ustrlen (s1)
491      const U_CHAR *s1;
492 {
493   return strlen ((const char *)s1);
494 }
495
496 static inline U_CHAR *
497 uxstrdup (s1)
498      const U_CHAR *s1;
499 {
500   return (U_CHAR *) xstrdup ((const char *)s1);
501 }
502
503 static inline U_CHAR *
504 ustrchr (s1, c)
505      const U_CHAR *s1;
506      int c;
507 {
508   return (U_CHAR *) strchr ((const char *)s1, c);
509 }
510
511 static inline int
512 ufputs (s, f)
513      const U_CHAR *s;
514      FILE *f;
515 {
516   return fputs ((const char *)s, f);
517 }
518
519 #endif /* ! GCC_CPPHASH_H */