Removed accumulator stuff in favor of obstack.
[debian/tar] / src / names.c
1 /* Various processing of names.
2
3    Copyright (C) 1988, 1992, 1994, 1996, 1997, 1998, 1999, 2000, 2001,
4    2003 Free Software Foundation, Inc.
5
6    This program is free software; you can redistribute it and/or modify it
7    under the terms of the GNU General Public License as published by the
8    Free Software Foundation; either version 2, or (at your option) any later
9    version.
10
11    This program is distributed in the hope that it will be useful, but
12    WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General
14    Public License for more details.
15
16    You should have received a copy of the GNU General Public License along
17    with this program; if not, write to the Free Software Foundation, Inc.,
18    59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.  */
19
20 #include "system.h"
21
22 #include <fnmatch.h>
23 #include <hash.h>
24 #include <quotearg.h>
25
26 #include "common.h"
27 \f
28 /* User and group names.  */
29
30 struct group *getgrnam ();
31 struct passwd *getpwnam ();
32 #if ! HAVE_DECL_GETPWUID
33 struct passwd *getpwuid ();
34 #endif
35 #if ! HAVE_DECL_GETGRGID
36 struct group *getgrgid ();
37 #endif
38
39 /* Make sure you link with the proper libraries if you are running the
40    Yellow Peril (thanks for the good laugh, Ian J.!), or, euh... NIS.
41    This code should also be modified for non-UNIX systems to do something
42    reasonable.  */
43
44 static char *cached_uname;
45 static char *cached_gname;
46
47 static uid_t cached_uid;        /* valid only if cached_uname is not empty */
48 static gid_t cached_gid;        /* valid only if cached_gname is not empty */
49
50 /* These variables are valid only if nonempty.  */
51 static char *cached_no_such_uname;
52 static char *cached_no_such_gname;
53
54 /* These variables are valid only if nonzero.  It's not worth optimizing
55    the case for weird systems where 0 is not a valid uid or gid.  */
56 static uid_t cached_no_such_uid;
57 static gid_t cached_no_such_gid;
58
59 /* Given UID, find the corresponding UNAME.  */
60 void
61 uid_to_uname (uid_t uid, char **uname)
62 {
63   struct passwd *passwd;
64
65   if (uid != 0 && uid == cached_no_such_uid)
66     {
67       *uname = strdup ("");
68       return;
69     }
70
71   if (!cached_uname || uid != cached_uid)
72     {
73       passwd = getpwuid (uid);
74       if (passwd)
75         {
76           cached_uid = uid;
77           assign_string (&cached_uname, passwd->pw_name);
78         }
79       else
80         {
81           cached_no_such_uid = uid;
82           *uname = strdup ("");
83           return;
84         }
85     }
86   *uname = strdup (cached_uname);
87 }
88
89 /* Given GID, find the corresponding GNAME.  */
90 void
91 gid_to_gname (gid_t gid, char **gname)
92 {
93   struct group *group;
94
95   if (gid != 0 && gid == cached_no_such_gid)
96     {
97       *gname = strdup ("");
98       return;
99     }
100
101   if (!cached_gname || gid != cached_gid)
102     {
103       group = getgrgid (gid);
104       if (group)
105         {
106           cached_gid = gid;
107           assign_string (&cached_gname, group->gr_name);
108         }
109       else
110         {
111           cached_no_such_gid = gid;
112           *gname = strdup ("");
113           return;
114         }
115     }
116   *gname = strdup (cached_gname);
117 }
118
119 /* Given UNAME, set the corresponding UID and return 1, or else, return 0.  */
120 int
121 uname_to_uid (char *uname, uid_t *uidp)
122 {
123   struct passwd *passwd;
124
125   if (cached_no_such_uname
126       && strcmp (uname, cached_no_such_uname) == 0)
127     return 0;
128
129   if (!cached_uname
130       || uname[0] != cached_uname[0]
131       || strcmp (uname, cached_uname) != 0)
132     {
133       passwd = getpwnam (uname);
134       if (passwd)
135         {
136           cached_uid = passwd->pw_uid;
137           assign_string (&cached_uname, passwd->pw_name);
138         }
139       else
140         {
141           assign_string (&cached_no_such_uname, uname);
142           return 0;
143         }
144     }
145   *uidp = cached_uid;
146   return 1;
147 }
148
149 /* Given GNAME, set the corresponding GID and return 1, or else, return 0.  */
150 int
151 gname_to_gid (char *gname, gid_t *gidp)
152 {
153   struct group *group;
154
155   if (cached_no_such_gname
156       && strcmp (gname, cached_no_such_gname) == 0)
157     return 0;
158
159   if (!cached_gname
160       || gname[0] != cached_gname[0]
161       || strcmp (gname, cached_gname) != 0)
162     {
163       group = getgrnam (gname);
164       if (group)
165         {
166           cached_gid = group->gr_gid;
167           assign_string (&cached_gname, gname);
168         }
169       else
170         {
171           assign_string (&cached_no_such_gname, gname);
172           return 0;
173         }
174     }
175   *gidp = cached_gid;
176   return 1;
177 }
178
179 \f
180 /* Names from the command call.  */
181
182 static struct name *namelist;   /* first name in list, if any */
183 static struct name **nametail = &namelist;      /* end of name list */
184 static const char **name_array; /* store an array of names */
185 static int allocated_names;     /* how big is the array? */
186 static int names;               /* how many entries does it have? */
187 static int name_index;          /* how many of the entries have we scanned? */
188
189 /* Initialize structures.  */
190 void
191 init_names (void)
192 {
193   allocated_names = 10;
194   name_array = xmalloc (sizeof (const char *) * allocated_names);
195   names = 0;
196 }
197
198 /* Add NAME at end of name_array, reallocating it as necessary.  */
199 void
200 name_add (const char *name)
201 {
202   if (names == allocated_names)
203     {
204       allocated_names *= 2;
205       name_array =
206         xrealloc (name_array, sizeof (const char *) * allocated_names);
207     }
208   name_array[names++] = name;
209 }
210 \f
211 /* Names from external name file.  */
212
213 static FILE *name_file;         /* file to read names from */
214 static char *name_buffer;       /* buffer to hold the current file name */
215 static size_t name_buffer_length; /* allocated length of name_buffer */
216
217 /* FIXME: I should better check more closely.  It seems at first glance that
218    is_pattern is only used when reading a file, and ignored for all
219    command line arguments.  */
220
221 static inline int
222 is_pattern (const char *string)
223 {
224   return strchr (string, '*') || strchr (string, '[') || strchr (string, '?');
225 }
226
227 /* Set up to gather file names for tar.  They can either come from a
228    file or were saved from decoding arguments.  */
229 void
230 name_init (int argc, char *const *argv)
231 {
232   name_buffer = xmalloc (NAME_FIELD_SIZE + 2);
233   name_buffer_length = NAME_FIELD_SIZE;
234
235   if (files_from_option)
236     {
237       if (!strcmp (files_from_option, "-"))
238         {
239           request_stdin ("-T");
240           name_file = stdin;
241         }
242       else if (name_file = fopen (files_from_option, "r"), !name_file)
243         open_fatal (files_from_option);
244     }
245 }
246
247 void
248 name_term (void)
249 {
250   free (name_buffer);
251   free (name_array);
252 }
253
254 /* Read the next filename from name_file and null-terminate it.  Put
255    it into name_buffer, reallocating and adjusting name_buffer_length
256    if necessary.  Return 0 at end of file, 1 otherwise.  */
257 static int
258 read_name_from_file (void)
259 {
260   int character;
261   size_t counter = 0;
262
263   /* FIXME: getc may be called even if character was EOF the last time here.  */
264
265   /* FIXME: This + 2 allocation might serve no purpose.  */
266
267   while (character = getc (name_file),
268          character != EOF && character != filename_terminator)
269     {
270       if (counter == name_buffer_length)
271         {
272           if (name_buffer_length * 2 < name_buffer_length)
273             xalloc_die ();
274           name_buffer_length *= 2;
275           name_buffer = xrealloc (name_buffer, name_buffer_length + 2);
276         }
277       name_buffer[counter++] = character;
278     }
279
280   if (counter == 0 && character == EOF)
281     return 0;
282
283   if (counter == name_buffer_length)
284     {
285       if (name_buffer_length * 2 < name_buffer_length)
286         xalloc_die ();
287       name_buffer_length *= 2;
288       name_buffer = xrealloc (name_buffer, name_buffer_length + 2);
289     }
290   name_buffer[counter] = '\0';
291
292   return 1;
293 }
294
295 /* Get the next name from ARGV or the file of names.  Result is in
296    static storage and can't be relied upon across two calls.
297
298    If CHANGE_DIRS is true, treat a filename of the form "-C" as
299    meaning that the next filename is the name of a directory to change
300    to.  If filename_terminator is NUL, CHANGE_DIRS is effectively
301    always false.  */
302 char *
303 name_next (int change_dirs)
304 {
305   const char *source;
306   char *cursor;
307   int chdir_flag = 0;
308
309   if (filename_terminator == '\0')
310     change_dirs = 0;
311
312   while (1)
313     {
314       /* Get a name, either from file or from saved arguments.  */
315
316       if (name_index == names)
317         {
318           if (! name_file)
319             break;
320           if (! read_name_from_file ())
321             break;
322         }
323       else
324         {
325           size_t source_len;
326           source = name_array[name_index++];
327           source_len = strlen (source);
328           if (name_buffer_length < source_len)
329             {
330               do
331                 {
332                   name_buffer_length *= 2;
333                   if (! name_buffer_length)
334                     xalloc_die ();
335                 }
336               while (name_buffer_length < source_len);
337
338               free (name_buffer);
339               name_buffer = xmalloc (name_buffer_length + 2);
340             }
341           strcpy (name_buffer, source);
342         }
343
344       /* Zap trailing slashes.  */
345
346       cursor = name_buffer + strlen (name_buffer) - 1;
347       while (cursor > name_buffer && ISSLASH (*cursor))
348         *cursor-- = '\0';
349
350       if (chdir_flag)
351         {
352           if (chdir (name_buffer) < 0)
353             chdir_fatal (name_buffer);
354           chdir_flag = 0;
355         }
356       else if (change_dirs && strcmp (name_buffer, "-C") == 0)
357         chdir_flag = 1;
358       else
359         {
360           unquote_string (name_buffer);
361           return name_buffer;
362         }
363     }
364
365   /* No more names in file.  */
366
367   if (name_file && chdir_flag)
368     FATAL_ERROR ((0, 0, _("Missing file name after -C")));
369
370   return 0;
371 }
372
373 /* Close the name file, if any.  */
374 void
375 name_close (void)
376 {
377   if (name_file && name_file != stdin)
378     if (fclose (name_file) != 0)
379       close_error (name_buffer);
380 }
381
382 /* Gather names in a list for scanning.  Could hash them later if we
383    really care.
384
385    If the names are already sorted to match the archive, we just read
386    them one by one.  name_gather reads the first one, and it is called
387    by name_match as appropriate to read the next ones.  At EOF, the
388    last name read is just left in the buffer.  This option lets users
389    of small machines extract an arbitrary number of files by doing
390    "tar t" and editing down the list of files.  */
391
392 void
393 name_gather (void)
394 {
395   /* Buffer able to hold a single name.  */
396   static struct name *buffer;
397   static size_t allocated_size;
398
399   char const *name;
400
401   if (same_order_option)
402     {
403       static int change_dir;
404
405       if (allocated_size == 0)
406         {
407           allocated_size = offsetof (struct name, name) + NAME_FIELD_SIZE + 1;
408           buffer = xmalloc (allocated_size);
409           /* FIXME: This memset is overkill, and ugly...  */
410           memset (buffer, 0, allocated_size);
411         }
412
413       while ((name = name_next (0)) && strcmp (name, "-C") == 0)
414         {
415           char const *dir = name_next (0);
416           if (! dir)
417             FATAL_ERROR ((0, 0, _("Missing file name after -C")));
418           change_dir = chdir_arg (xstrdup (dir));
419         }
420
421       if (name)
422         {
423           size_t needed_size;
424           buffer->length = strlen (name);
425           needed_size = offsetof (struct name, name) + buffer->length + 1;
426           if (allocated_size < needed_size)
427             {
428               do
429                 {
430                   allocated_size *= 2;
431                   if (! allocated_size)
432                     xalloc_die ();
433                 }
434               while (allocated_size < needed_size);
435
436               buffer = xrealloc (buffer, allocated_size);
437             }
438           buffer->change_dir = change_dir;
439           strcpy (buffer->name, name);
440           buffer->next = 0;
441           buffer->found_count = 0;
442
443           namelist = buffer;
444           nametail = &namelist->next;
445         }
446     }
447   else
448     {
449       /* Non sorted names -- read them all in.  */
450       int change_dir = 0;
451
452       for (;;)
453         {
454           int change_dir0 = change_dir;
455           while ((name = name_next (0)) && strcmp (name, "-C") == 0)
456             {
457               char const *dir = name_next (0);
458               if (! dir)
459                 FATAL_ERROR ((0, 0, _("Missing file name after -C")));
460               change_dir = chdir_arg (xstrdup (dir));
461             }
462           if (name)
463             addname (name, change_dir);
464           else
465             {
466               if (change_dir != change_dir0)
467                 addname (0, change_dir);
468               break;
469             }
470         }
471     }
472 }
473
474 /*  Add a name to the namelist.  */
475 struct name *
476 addname (char const *string, int change_dir)
477 {
478   size_t length = string ? strlen (string) : 0;
479   struct name *name = xmalloc (offsetof (struct name, name) + length + 1);
480
481   if (string)
482     {
483       name->fake = 0;
484       strcpy (name->name, string);
485     }
486   else
487     {
488       name->fake = 1;
489
490       /* FIXME: This initialization (and the byte of memory that it
491          initializes) is probably not needed, but we are currently in
492          bug-fix mode so we'll leave it in for now.  */
493       name->name[0] = 0;
494     }
495
496   name->next = 0;
497   name->length = length;
498   name->found_count = 0;
499   name->regexp = 0;             /* assume not a regular expression */
500   name->firstch = 1;            /* assume first char is literal */
501   name->change_dir = change_dir;
502   name->dir_contents = 0;
503
504   if (string && is_pattern (string))
505     {
506       name->regexp = 1;
507       if (string[0] == '*' || string[0] == '[' || string[0] == '?')
508         name->firstch = 0;
509     }
510
511   *nametail = name;
512   nametail = &name->next;
513   return name;
514 }
515
516 /* Find a match for PATH (whose string length is LENGTH) in the name
517    list.  */
518 static struct name *
519 namelist_match (char const *path, size_t length)
520 {
521   struct name *p;
522
523   for (p = namelist; p; p = p->next)
524     {
525       /* If first chars don't match, quick skip.  */
526
527       if (p->firstch && p->name[0] != path[0])
528         continue;
529
530       if (p->regexp
531           ? fnmatch (p->name, path, recursion_option) == 0
532           : (p->length <= length
533              && (path[p->length] == '\0'
534                  || (ISSLASH (path[p->length]) && recursion_option))
535              && memcmp (path, p->name, p->length) == 0))
536         return p;
537     }
538
539   return 0;
540 }
541
542 /* Return true if and only if name PATH (from an archive) matches any
543    name from the namelist.  */
544 int
545 name_match (const char *path)
546 {
547   size_t length = strlen (path);
548
549   while (1)
550     {
551       struct name *cursor = namelist;
552
553       if (!cursor)
554         return ! files_from_option;
555
556       if (cursor->fake)
557         {
558           chdir_do (cursor->change_dir);
559           namelist = 0;
560           nametail = &namelist;
561           return ! files_from_option;
562         }
563
564       cursor = namelist_match (path, length);
565       if (cursor)
566         {
567           if (!(ISSLASH (path[cursor->length]) && recursion_option)
568               || cursor->found_count == 0)
569             cursor->found_count++; /* remember it matched */
570           if (starting_file_option)
571             {
572               free (namelist);
573               namelist = 0;
574               nametail = &namelist;
575             }
576           chdir_do (cursor->change_dir);
577
578           /* We got a match.  */
579           return ISFOUND (cursor);
580         }
581
582       /* Filename from archive not found in namelist.  If we have the whole
583          namelist here, just return 0.  Otherwise, read the next name in and
584          compare it.  If this was the last name, namelist->found_count will
585          remain on.  If not, we loop to compare the newly read name.  */
586
587       if (same_order_option && namelist->found_count)
588         {
589           name_gather ();       /* read one more */
590           if (namelist->found_count)
591             return 0;
592         }
593       else
594         return 0;
595     }
596 }
597
598 /* Returns true if all names from the namelist were processed.
599    P is the stat_info of the most recently processed entry.
600    The decision is postponed until the next entry is read if:
601
602    1) P ended with a slash (i.e. it was a directory)
603    2) P matches any entry from the namelist *and* represents a subdirectory
604    or a file lying under this entry (in the terms of directory structure).
605
606    This is necessary to handle contents of directories. */
607 bool
608 all_names_found (struct tar_stat_info *p)
609 {
610   struct name const *cursor;
611   size_t len;
612
613   if (!p->file_name || occurrence_option == 0 || p->had_trailing_slash)
614     return false;
615   len = strlen (p->file_name);
616   for (cursor = namelist; cursor; cursor = cursor->next)
617     {
618       if (cursor->regexp
619           || (!WASFOUND(cursor) && !cursor->fake)
620           || (len >= cursor->length && ISSLASH (p->file_name[cursor->length])))
621         return false;
622     }
623   return true;
624 }
625
626 /* Print the names of things in the namelist that were not matched.  */
627 void
628 names_notfound (void)
629 {
630   struct name const *cursor;
631
632   for (cursor = namelist; cursor; cursor = cursor->next)
633     if (!WASFOUND(cursor) && !cursor->fake)
634       {
635         if (cursor->found_count == 0)
636           ERROR ((0, 0, _("%s: Not found in archive"),
637                   quotearg_colon (cursor->name)));
638         else
639           ERROR ((0, 0, _("%s: Required occurrence not found in archive"),
640                   quotearg_colon (cursor->name)));
641       }
642   
643   /* Don't bother freeing the name list; we're about to exit.  */
644   namelist = 0;
645   nametail = &namelist;
646
647   if (same_order_option)
648     {
649       char *name;
650
651       while ((name = name_next (1)) != NULL)
652         ERROR ((0, 0, _("%s: Not found in archive"),
653                 quotearg_colon (name)));
654     }
655 }
656 \f
657 /* Sorting name lists.  */
658
659 /* Sort linked LIST of names, of given LENGTH, using COMPARE to order
660    names.  Return the sorted list.  Apart from the type `struct name'
661    and the definition of SUCCESSOR, this is a generic list-sorting
662    function, but it's too painful to make it both generic and portable
663    in C.  */
664
665 static struct name *
666 merge_sort (struct name *list, int length,
667             int (*compare) (struct name const*, struct name const*))
668 {
669   struct name *first_list;
670   struct name *second_list;
671   int first_length;
672   int second_length;
673   struct name *result;
674   struct name **merge_point;
675   struct name *cursor;
676   int counter;
677
678 # define SUCCESSOR(name) ((name)->next)
679
680   if (length == 1)
681     return list;
682
683   if (length == 2)
684     {
685       if ((*compare) (list, SUCCESSOR (list)) > 0)
686         {
687           result = SUCCESSOR (list);
688           SUCCESSOR (result) = list;
689           SUCCESSOR (list) = 0;
690           return result;
691         }
692       return list;
693     }
694
695   first_list = list;
696   first_length = (length + 1) / 2;
697   second_length = length / 2;
698   for (cursor = list, counter = first_length - 1;
699        counter;
700        cursor = SUCCESSOR (cursor), counter--)
701     continue;
702   second_list = SUCCESSOR (cursor);
703   SUCCESSOR (cursor) = 0;
704
705   first_list = merge_sort (first_list, first_length, compare);
706   second_list = merge_sort (second_list, second_length, compare);
707
708   merge_point = &result;
709   while (first_list && second_list)
710     if ((*compare) (first_list, second_list) < 0)
711       {
712         cursor = SUCCESSOR (first_list);
713         *merge_point = first_list;
714         merge_point = &SUCCESSOR (first_list);
715         first_list = cursor;
716       }
717     else
718       {
719         cursor = SUCCESSOR (second_list);
720         *merge_point = second_list;
721         merge_point = &SUCCESSOR (second_list);
722         second_list = cursor;
723       }
724   if (first_list)
725     *merge_point = first_list;
726   else
727     *merge_point = second_list;
728
729   return result;
730
731 #undef SUCCESSOR
732 }
733
734 /* A comparison function for sorting names.  Put found names last;
735    break ties by string comparison.  */
736
737 static int
738 compare_names (struct name const *n1, struct name const *n2)
739 {
740   int found_diff = WASFOUND(n2) - WASFOUND(n1);
741   return found_diff ? found_diff : strcmp (n1->name, n2->name);
742 }
743 \f
744 /* Add all the dirs under NAME, which names a directory, to the namelist.
745    If any of the files is a directory, recurse on the subdirectory.
746    DEVICE is the device not to leave, if the -l option is specified.  */
747
748 static void
749 add_hierarchy_to_namelist (struct name *name, dev_t device)
750 {
751   char *path = name->name;
752   char *buffer = get_directory_contents (path, device);
753
754   if (! buffer)
755     name->dir_contents = "\0\0\0\0";
756   else
757     {
758       size_t name_length = name->length;
759       size_t allocated_length = (name_length >= NAME_FIELD_SIZE
760                                  ? name_length + NAME_FIELD_SIZE
761                                  : NAME_FIELD_SIZE);
762       char *name_buffer = xmalloc (allocated_length + 1);
763                                 /* FIXME: + 2 above?  */
764       char *string;
765       size_t string_length;
766       int change_dir = name->change_dir;
767
768       name->dir_contents = buffer;
769       strcpy (name_buffer, path);
770       if (! ISSLASH (name_buffer[name_length - 1]))
771         {
772           name_buffer[name_length++] = '/';
773           name_buffer[name_length] = '\0';
774         }
775
776       for (string = buffer; *string; string += string_length + 1)
777         {
778           string_length = strlen (string);
779           if (*string == 'D')
780             {
781               if (allocated_length <= name_length + string_length)
782                 {
783                   do
784                     {
785                       allocated_length *= 2;
786                       if (! allocated_length)
787                         xalloc_die ();
788                     }
789                   while (allocated_length <= name_length + string_length);
790
791                   name_buffer = xrealloc (name_buffer, allocated_length + 1);
792                 }
793               strcpy (name_buffer + name_length, string + 1);
794               add_hierarchy_to_namelist (addname (name_buffer, change_dir),
795                                          device);
796             }
797         }
798
799       free (name_buffer);
800     }
801 }
802 \f
803 /* Collect all the names from argv[] (or whatever), expand them into a
804    directory tree, and sort them.  This gets only subdirectories, not
805    all files.  */
806
807 void
808 collect_and_sort_names (void)
809 {
810   struct name *name;
811   struct name *next_name;
812   int num_names;
813   struct stat statbuf;
814
815   name_gather ();
816
817   if (listed_incremental_option)
818     read_directory_file ();
819
820   if (!namelist)
821     addname (".", 0);
822
823   for (name = namelist; name; name = next_name)
824     {
825       next_name = name->next;
826       if (name->found_count || name->dir_contents)
827         continue;
828       if (name->regexp)         /* FIXME: just skip regexps for now */
829         continue;
830       chdir_do (name->change_dir);
831       if (name->fake)
832         continue;
833
834       if (deref_stat (dereference_option, name->name, &statbuf) != 0)
835         {
836           stat_diag (name->name);
837           continue;
838         }
839       if (S_ISDIR (statbuf.st_mode))
840         {
841           name->found_count++;
842           add_hierarchy_to_namelist (name, statbuf.st_dev);
843         }
844     }
845
846   num_names = 0;
847   for (name = namelist; name; name = name->next)
848     num_names++;
849   namelist = merge_sort (namelist, num_names, compare_names);
850
851   for (name = namelist; name; name = name->next)
852     name->found_count = 0;
853 }
854
855 /* This is like name_match, except that it returns a pointer to the
856    name it matched, and doesn't set FOUND in structure.  The caller
857    will have to do that if it wants to.  Oh, and if the namelist is
858    empty, it returns null, unlike name_match, which returns TRUE.  */
859 struct name *
860 name_scan (const char *path)
861 {
862   size_t length = strlen (path);
863
864   while (1)
865     {
866       struct name *cursor = namelist_match (path, length);
867       if (cursor)
868         return cursor;
869
870       /* Filename from archive not found in namelist.  If we have the whole
871          namelist here, just return 0.  Otherwise, read the next name in and
872          compare it.  If this was the last name, namelist->found_count will
873          remain on.  If not, we loop to compare the newly read name.  */
874
875       if (same_order_option && namelist && namelist->found_count)
876         {
877           name_gather ();       /* read one more */
878           if (namelist->found_count)
879             return 0;
880         }
881       else
882         return 0;
883     }
884 }
885
886 /* This returns a name from the namelist which doesn't have ->found
887    set.  It sets ->found before returning, so successive calls will
888    find and return all the non-found names in the namelist.  */
889 struct name *gnu_list_name;
890
891 char *
892 name_from_list (void)
893 {
894   if (!gnu_list_name)
895     gnu_list_name = namelist;
896   while (gnu_list_name && (gnu_list_name->found_count || gnu_list_name->fake))
897     gnu_list_name = gnu_list_name->next;
898   if (gnu_list_name)
899     {
900       gnu_list_name->found_count++;
901       chdir_do (gnu_list_name->change_dir);
902       return gnu_list_name->name;
903     }
904   return 0;
905 }
906
907 void
908 blank_name_list (void)
909 {
910   struct name *name;
911
912   gnu_list_name = 0;
913   for (name = namelist; name; name = name->next)
914     name->found_count = 0;
915 }
916
917 /* Yield a newly allocated file name consisting of PATH concatenated to
918    NAME, with an intervening slash if PATH does not already end in one.  */
919 char *
920 new_name (const char *path, const char *name)
921 {
922   size_t pathlen = strlen (path);
923   size_t namesize = strlen (name) + 1;
924   int slash = pathlen && ! ISSLASH (path[pathlen - 1]);
925   char *buffer = xmalloc (pathlen + slash + namesize);
926   memcpy (buffer, path, pathlen);
927   buffer[pathlen] = '/';
928   memcpy (buffer + pathlen + slash, name, namesize);
929   return buffer;
930 }
931
932 /* Return nonzero if file NAME is excluded.  */
933 bool
934 excluded_name (char const *name)
935 {
936   return excluded_filename (excluded, name + FILESYSTEM_PREFIX_LEN (name));
937 }
938 \f
939 /* Hash tables of strings.  */
940
941 /* Calculate the hash of a string.  */
942 static unsigned
943 hash_string_hasher (void const *name, unsigned n_buckets)
944 {
945   return hash_string (name, n_buckets);
946 }
947
948 /* Compare two strings for equality.  */
949 static bool
950 hash_string_compare (void const *name1, void const *name2)
951 {
952   return strcmp (name1, name2) == 0;
953 }
954
955 /* Return zero if TABLE contains a copy of STRING; otherwise, insert a
956    copy of STRING to TABLE and return 1.  */
957 static bool
958 hash_string_insert (Hash_table **table, char const *string)
959 {
960   Hash_table *t = *table;
961   char *s = xstrdup (string);
962   char *e;
963
964   if (! ((t
965           || (*table = t = hash_initialize (0, 0, hash_string_hasher,
966                                             hash_string_compare, 0)))
967          && (e = hash_insert (t, s))))
968     xalloc_die ();
969
970   if (e == s)
971     return 1;
972   else
973     {
974       free (s);
975       return 0;
976     }
977 }
978
979 /* Return 1 if TABLE contains STRING.  */
980 static bool
981 hash_string_lookup (Hash_table const *table, char const *string)
982 {
983   return table && hash_lookup (table, string);
984 }
985 \f
986 /* Names to avoid dumping.  */
987 static Hash_table *avoided_name_table;
988
989 /* Remember to not archive NAME.  */
990 void
991 add_avoided_name (char const *name)
992 {
993   hash_string_insert (&avoided_name_table, name);
994 }
995
996 /* Should NAME be avoided when archiving?  */
997 bool
998 is_avoided_name (char const *name)
999 {
1000   return hash_string_lookup (avoided_name_table, name);
1001 }
1002 \f
1003 /* Return a safer suffix of FILE_NAME, or "." if it has no safer
1004    suffix.  Check for fully specified file names and other atrocities.
1005    Warn the user if we do not return NAME.  If LINK_TARGET is 1,
1006    FILE_NAME is the target of a hard link, not a member name.  */
1007
1008 char *
1009 safer_name_suffix (char const *file_name, bool link_target)
1010 {
1011   char const *p;
1012
1013   if (absolute_names_option)
1014     p = file_name;
1015   else
1016     {
1017       /* Skip file system prefixes, leading pathnames that contain
1018          "..", and leading slashes.  */
1019
1020       size_t prefix_len = FILESYSTEM_PREFIX_LEN (file_name);
1021
1022       for (p = file_name + prefix_len; *p; )
1023         {
1024           if (p[0] == '.' && p[1] == '.' && (ISSLASH (p[2]) || !p[2]))
1025             prefix_len = p + 2 - file_name;
1026           
1027           do
1028             {
1029               char c = *p++;
1030               if (ISSLASH (c))
1031                 break;
1032             }
1033           while (*p);
1034         }
1035
1036       for (p = file_name + prefix_len; ISSLASH (*p); p++)
1037         continue;
1038       prefix_len = p - file_name;
1039
1040       if (prefix_len)
1041         {
1042           static Hash_table *prefix_table[2];
1043           char *prefix = alloca (prefix_len + 1);
1044           memcpy (prefix, file_name, prefix_len);
1045           prefix[prefix_len] = '\0';
1046
1047           if (hash_string_insert (&prefix_table[link_target], prefix))
1048             {
1049               static char const *const diagnostic[] =
1050               {
1051                 N_("Removing leading `%s' from member names"),
1052                 N_("Removing leading `%s' from hard link targets")
1053               };
1054               WARN ((0, 0, _(diagnostic[link_target]), prefix));
1055             }
1056         }
1057     }
1058
1059   if (! *p)
1060     {
1061       if (p == file_name)
1062         {
1063           static char const *const diagnostic[] =
1064           {
1065             N_("Substituting `.' for empty member name"),
1066             N_("Substituting `.' for empty hard link target")
1067           };
1068           WARN ((0, 0, _(diagnostic[link_target])));
1069         }
1070       
1071       p = ".";
1072     }
1073
1074   return (char *) p;
1075 }
1076 \f
1077 /* Return the size of the prefix of FILE_NAME that is removed after
1078    stripping NUM leading path name components.  NUM must be
1079    positive.  */
1080
1081 size_t
1082 stripped_prefix_len (char const *file_name, size_t num)
1083 {
1084   char const *p = file_name + FILESYSTEM_PREFIX_LEN (file_name);
1085   while (ISSLASH (*p))
1086     p++;
1087   while (*p)
1088     {
1089       bool slash = ISSLASH (*p);
1090       p++;
1091       if (slash)
1092         {
1093           if (--num == 0)
1094             return p - file_name;
1095           while (ISSLASH (*p))
1096             p++;
1097         }
1098     }
1099   return -1;
1100 }
1101 \f
1102 /* Return nonzero if NAME contains ".." as a path name component.  */
1103 bool
1104 contains_dot_dot (char const *name)
1105 {
1106   char const *p = name + FILESYSTEM_PREFIX_LEN (name);
1107
1108   for (;; p++)
1109     {
1110       if (p[0] == '.' && p[1] == '.' && (ISSLASH (p[2]) || !p[2]))
1111         return 1;
1112
1113       do
1114         {
1115           if (! *p++)
1116             return 0;
1117         }
1118       while (! ISSLASH (*p));
1119     }
1120 }