(extract_file): Handle to_command_option
[debian/tar] / src / extract.c
1 /* Extract files from a tar archive.
2
3    Copyright (C) 1988, 1992, 1993, 1994, 1996, 1997, 1998, 1999, 2000,
4    2001, 2003, 2004 Free Software Foundation, Inc.
5
6    Written by John Gilmore, on 1985-11-19.
7
8    This program is free software; you can redistribute it and/or modify it
9    under the terms of the GNU General Public License as published by the
10    Free Software Foundation; either version 2, or (at your option) any later
11    version.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General
16    Public License for more details.
17
18    You should have received a copy of the GNU General Public License along
19    with this program; if not, write to the Free Software Foundation, Inc.,
20    59 Temple Place - Suite 330, Boston, MA 02111-1307, USA.  */
21
22 #include <system.h>
23 #include <quotearg.h>
24 #include <errno.h>
25 #include <xgetcwd.h>
26
27 #if HAVE_UTIME_H
28 # include <utime.h>
29 #else
30 struct utimbuf
31   {
32     long actime;
33     long modtime;
34   };
35 #endif
36
37 #include "common.h"
38
39 bool we_are_root;               /* true if our effective uid == 0 */
40 static mode_t newdir_umask;     /* umask when creating new directories */
41 static mode_t current_umask;    /* current umask (which is set to 0 if -p) */
42
43 /* Status of the permissions of a file that we are extracting.  */
44 enum permstatus
45 {
46   /* This file may have existed already; its permissions are unknown.  */
47   UNKNOWN_PERMSTATUS,
48
49   /* This file was created using the permissions from the archive.  */
50   ARCHIVED_PERMSTATUS,
51
52   /* This is an intermediate directory; the archive did not specify
53      its permissions.  */
54   INTERDIR_PERMSTATUS
55 };
56
57 /* List of directories whose statuses we need to extract after we've
58    finished extracting their subsidiary files.  If you consider each
59    contiguous subsequence of elements of the form [D]?[^D]*, where [D]
60    represents an element where AFTER_SYMLINKS is nonzero and [^D]
61    represents an element where AFTER_SYMLINKS is zero, then the head
62    of the subsequence has the longest name, and each non-head element
63    in the prefix is an ancestor (in the directory hierarchy) of the
64    preceding element.  */
65
66 struct delayed_set_stat
67   {
68     struct delayed_set_stat *next;
69     struct stat stat_info;
70     size_t file_name_len;
71     mode_t invert_permissions;
72     enum permstatus permstatus;
73     bool after_symlinks;
74     char file_name[1];
75   };
76
77 static struct delayed_set_stat *delayed_set_stat_head;
78
79 /* List of symbolic links whose creation we have delayed.  */
80 struct delayed_symlink
81   {
82     /* The next delayed symbolic link in the list.  */
83     struct delayed_symlink *next;
84
85     /* The device, inode number and last-modified time of the placeholder.  */
86     dev_t dev;
87     ino_t ino;
88     time_t mtime;
89
90     /* The desired owner and group of the symbolic link.  */
91     uid_t uid;
92     gid_t gid;
93
94     /* A list of sources for this symlink.  The sources are all to be
95        hard-linked together.  */
96     struct string_list *sources;
97
98     /* The desired target of the desired link.  */
99     char target[1];
100   };
101
102 static struct delayed_symlink *delayed_symlink_head;
103
104 struct string_list
105   {
106     struct string_list *next;
107     char string[1];
108   };
109
110 /*  Set up to extract files.  */
111 void
112 extr_init (void)
113 {
114   we_are_root = geteuid () == 0;
115   same_permissions_option += we_are_root;
116   same_owner_option += we_are_root;
117
118   /* Save 'root device' to avoid purging mount points.
119      FIXME: Should the same be done after handling -C option ? */
120   if (one_file_system_option)
121     {
122       struct stat st;      
123       char *dir = xgetcwd ();
124
125       if (deref_stat (true, dir, &st))
126         stat_diag (dir);
127       else
128         root_device = st.st_dev;
129     }
130   
131   /* Option -p clears the kernel umask, so it does not affect proper
132      restoration of file permissions.  New intermediate directories will
133      comply with umask at start of program.  */
134
135   newdir_umask = umask (0);
136   if (0 < same_permissions_option)
137     current_umask = 0;
138   else
139     {
140       umask (newdir_umask);     /* restore the kernel umask */
141       current_umask = newdir_umask;
142     }
143 }
144
145 /* If restoring permissions, restore the mode for FILE_NAME from
146    information given in *STAT_INFO (where *CUR_INFO gives
147    the current status if CUR_INFO is nonzero); otherwise invert the
148    INVERT_PERMISSIONS bits from the file's current permissions.
149    PERMSTATUS specifies the status of the file's permissions.
150    TYPEFLAG specifies the type of the file.  */
151 static void
152 set_mode (char const *file_name,
153           struct stat const *stat_info,
154           struct stat const *cur_info,
155           mode_t invert_permissions, enum permstatus permstatus,
156           char typeflag)
157 {
158   mode_t mode;
159
160   if (0 < same_permissions_option
161       && permstatus != INTERDIR_PERMSTATUS)
162     {
163       mode = stat_info->st_mode;
164
165       /* If we created the file and it has a usual mode, then its mode
166          is normally set correctly already.  But on many hosts, some
167          directories inherit the setgid bits from their parents, so we
168          we must set directories' modes explicitly.  */
169       if (permstatus == ARCHIVED_PERMSTATUS
170           && ! (mode & ~ MODE_RWX)
171           && typeflag != DIRTYPE
172           && typeflag != GNUTYPE_DUMPDIR)
173         return;
174     }
175   else if (! invert_permissions)
176     return;
177   else
178     {
179       /* We must inspect a directory's current permissions, since the
180          directory may have inherited its setgid bit from its parent.
181
182          INVERT_PERMISSIONS happens to be nonzero only for directories
183          that we created, so there's no point optimizing this code for
184          other cases.  */
185       struct stat st;
186       if (! cur_info)
187         {
188           if (stat (file_name, &st) != 0)
189             {
190               stat_error (file_name);
191               return;
192             }
193           cur_info = &st;
194         }
195       mode = cur_info->st_mode ^ invert_permissions;
196     }
197
198   if (chmod (file_name, mode) != 0)
199     chmod_error_details (file_name, mode);
200 }
201
202 /* Check time after successfully setting FILE_NAME's time stamp to T.  */
203 static void
204 check_time (char const *file_name, time_t t)
205 {
206   time_t now;
207   if (t <= 0)
208     WARN ((0, 0, _("%s: implausibly old time stamp %s"),
209            file_name, tartime (t)));
210   else if (start_time < t && (now = time (0)) < t)
211     WARN ((0, 0, _("%s: time stamp %s is %lu s in the future"),
212            file_name, tartime (t), (unsigned long) (t - now)));
213 }
214
215 /* Restore stat attributes (owner, group, mode and times) for
216    FILE_NAME, using information given in *STAT_INFO.
217    If CUR_INFO is nonzero, *CUR_INFO is the
218    file's currernt status.
219    If not restoring permissions, invert the
220    INVERT_PERMISSIONS bits from the file's current permissions.
221    PERMSTATUS specifies the status of the file's permissions.
222    TYPEFLAG specifies the type of the file.  */
223
224 /* FIXME: About proper restoration of symbolic link attributes, we still do
225    not have it right.  Pretesters' reports tell us we need further study and
226    probably more configuration.  For now, just use lchown if it exists, and
227    punt for the rest.  Sigh!  */
228
229 static void
230 set_stat (char const *file_name,
231           struct stat const *stat_info,
232           struct stat const *cur_info,
233           mode_t invert_permissions, enum permstatus permstatus,
234           char typeflag)
235 {
236   struct utimbuf utimbuf;
237
238   if (typeflag != SYMTYPE)
239     {
240       /* We do the utime before the chmod because some versions of utime are
241          broken and trash the modes of the file.  */
242
243       if (! touch_option && permstatus != INTERDIR_PERMSTATUS)
244         {
245           /* We set the accessed time to `now', which is really the time we
246              started extracting files, unless incremental_option is used, in
247              which case .st_atime is used.  */
248
249           /* FIXME: incremental_option should set ctime too, but how?  */
250
251           if (incremental_option)
252             utimbuf.actime = stat_info->st_atime;
253           else
254             utimbuf.actime = start_time;
255
256           utimbuf.modtime = stat_info->st_mtime;
257
258           if (utime (file_name, &utimbuf) < 0)
259             utime_error (file_name);
260           else
261             {
262               check_time (file_name, utimbuf.actime);
263               check_time (file_name, utimbuf.modtime);
264             }
265         }
266
267       /* Some systems allow non-root users to give files away.  Once this
268          done, it is not possible anymore to change file permissions, so we
269          have to set permissions prior to possibly giving files away.  */
270
271       set_mode (file_name, stat_info, cur_info,
272                 invert_permissions, permstatus, typeflag);
273     }
274
275   if (0 < same_owner_option && permstatus != INTERDIR_PERMSTATUS)
276     {
277       /* When lchown exists, it should be used to change the attributes of
278          the symbolic link itself.  In this case, a mere chown would change
279          the attributes of the file the symbolic link is pointing to, and
280          should be avoided.  */
281
282       if (typeflag == SYMTYPE)
283         {
284 #if HAVE_LCHOWN
285           if (lchown (file_name, stat_info->st_uid, stat_info->st_gid) < 0)
286             chown_error_details (file_name,
287                                  stat_info->st_uid, stat_info->st_gid);
288 #endif
289         }
290       else
291         {
292           if (chown (file_name, stat_info->st_uid, stat_info->st_gid) < 0)
293             chown_error_details (file_name,
294                                  stat_info->st_uid, stat_info->st_gid);
295
296           /* On a few systems, and in particular, those allowing to give files
297              away, changing the owner or group destroys the suid or sgid bits.
298              So let's attempt setting these bits once more.  */
299           if (stat_info->st_mode & (S_ISUID | S_ISGID | S_ISVTX))
300             set_mode (file_name, stat_info, 0,
301                       invert_permissions, permstatus, typeflag);
302         }
303     }
304 }
305
306 /* Remember to restore stat attributes (owner, group, mode and times)
307    for the directory FILE_NAME, using information given in *STAT_INFO,
308    once we stop extracting files into that directory.
309    If not restoring permissions, remember to invert the
310    INVERT_PERMISSIONS bits from the file's current permissions.
311    PERMSTATUS specifies the status of the file's permissions.  */
312 static void
313 delay_set_stat (char const *file_name, struct stat const *stat_info,
314                 mode_t invert_permissions, enum permstatus permstatus)
315 {
316   size_t file_name_len = strlen (file_name);
317   struct delayed_set_stat *data =
318     xmalloc (offsetof (struct delayed_set_stat, file_name)
319              + file_name_len + 1);
320   data->file_name_len = file_name_len;
321   strcpy (data->file_name, file_name);
322   data->invert_permissions = invert_permissions;
323   data->permstatus = permstatus;
324   data->after_symlinks = 0;
325   data->stat_info = *stat_info;
326   data->next = delayed_set_stat_head;
327   delayed_set_stat_head = data;
328 }
329
330 /* Update the delayed_set_stat info for an intermediate directory
331    created within the file name of DIR.  The intermediate directory turned
332    out to be the same as this directory, e.g. due to ".." or symbolic
333    links.  *DIR_STAT_INFO is the status of the directory.  */
334 static void
335 repair_delayed_set_stat (char const *dir,
336                          struct stat const *dir_stat_info)
337 {
338   struct delayed_set_stat *data;
339   for (data = delayed_set_stat_head;  data;  data = data->next)
340     {
341       struct stat st;
342       if (stat (data->file_name, &st) != 0)
343         {
344           stat_error (data->file_name);
345           return;
346         }
347
348       if (st.st_dev == dir_stat_info->st_dev
349           && st.st_ino == dir_stat_info->st_ino)
350         {
351           data->stat_info = current_stat_info.stat;
352           data->invert_permissions =
353             (MODE_RWX & (current_stat_info.stat.st_mode ^ st.st_mode));
354           data->permstatus = ARCHIVED_PERMSTATUS;
355           return;
356         }
357     }
358
359   ERROR ((0, 0, _("%s: Unexpected inconsistency when making directory"),
360           quotearg_colon (dir)));
361 }
362
363 /* After a file/link/symlink/directory creation has failed, see if
364    it's because some required directory was not present, and if so,
365    create all required directories.  Return non-zero if a directory
366    was created.  */
367 static int
368 make_directories (char *file_name)
369 {
370   char *cursor0 = file_name + FILE_SYSTEM_PREFIX_LEN (file_name);
371   char *cursor;                 /* points into the file name */
372   int did_something = 0;        /* did we do anything yet? */
373   int mode;
374   int invert_permissions;
375   int status;
376
377
378   for (cursor = cursor0; *cursor; cursor++)
379     {
380       if (! ISSLASH (*cursor))
381         continue;
382
383       /* Avoid mkdir of empty string, if leading or double '/'.  */
384
385       if (cursor == cursor0 || ISSLASH (cursor[-1]))
386         continue;
387
388       /* Avoid mkdir where last part of file name is "." or "..".  */
389
390       if (cursor[-1] == '.'
391           && (cursor == cursor0 + 1 || ISSLASH (cursor[-2])
392               || (cursor[-2] == '.'
393                   && (cursor == cursor0 + 2 || ISSLASH (cursor[-3])))))
394         continue;
395
396       *cursor = '\0';           /* truncate the name there */
397       mode = MODE_RWX & ~ newdir_umask;
398       invert_permissions = we_are_root ? 0 : MODE_WXUSR & ~ mode;
399       status = mkdir (file_name, mode ^ invert_permissions);
400
401       if (status == 0)
402         {
403           /* Create a struct delayed_set_stat even if
404              invert_permissions is zero, because
405              repair_delayed_set_stat may need to update the struct.  */
406           delay_set_stat (file_name,
407                           &current_stat_info.stat /* ignored */,
408                           invert_permissions, INTERDIR_PERMSTATUS);
409
410           print_for_mkdir (file_name, cursor - file_name, mode);
411           did_something = 1;
412
413           *cursor = '/';
414           continue;
415         }
416
417       *cursor = '/';
418
419       if (errno == EEXIST)
420         continue;               /* Directory already exists.  */
421       else if ((errno == ENOSYS /* Automounted dirs on Solaris return
422                                    this. Reported by Warren Hyde
423                                    <Warren.Hyde@motorola.com> */
424                || ERRNO_IS_EACCES)  /* Turbo C mkdir gives a funny errno.  */
425                && access (file_name, W_OK) == 0)
426         continue;
427
428       /* Some other error in the mkdir.  We return to the caller.  */
429       break;
430     }
431
432   return did_something;         /* tell them to retry if we made one */
433 }
434
435 static bool
436 file_newer_p (const char *file_name, struct tar_stat_info *tar_stat)
437 {
438   struct stat st;
439
440   if (stat (file_name, &st))
441     {
442       stat_warn (file_name);
443       return true; /* Be on the safe side */
444     }
445   if (!S_ISDIR (st.st_mode)
446       && st.st_mtime >= tar_stat->stat.st_mtime)
447     {
448       return true;
449     }
450   return false;
451 }
452
453 /* Attempt repairing what went wrong with the extraction.  Delete an
454    already existing file or create missing intermediate directories.
455    Return nonzero if we somewhat increased our chances at a successful
456    extraction.  errno is properly restored on zero return.  */
457 static int
458 maybe_recoverable (char *file_name, int *interdir_made)
459 {
460   int e = errno;
461
462   if (*interdir_made)
463     return 0;
464
465   switch (errno)
466     {
467     case EEXIST:
468       /* Remove an old file, if the options allow this.  */
469
470       switch (old_files_option)
471         {
472         case KEEP_OLD_FILES:
473           return 0;
474
475         case KEEP_NEWER_FILES:
476           if (file_newer_p (file_name, &current_stat_info))
477             {
478               errno = e;
479               return 0;
480             }
481           /* FALL THROUGH */
482
483         case DEFAULT_OLD_FILES:
484         case NO_OVERWRITE_DIR_OLD_FILES:
485         case OVERWRITE_OLD_FILES:
486           {
487             int r = remove_any_file (file_name, ORDINARY_REMOVE_OPTION);
488             errno = EEXIST;
489             return r;
490           }
491
492         case UNLINK_FIRST_OLD_FILES:
493           break;
494         }
495
496     case ENOENT:
497       /* Attempt creating missing intermediate directories.  */
498       if (! make_directories (file_name))
499         {
500           errno = ENOENT;
501           return 0;
502         }
503       *interdir_made = 1;
504       return 1;
505
506     default:
507       /* Just say we can't do anything about it...  */
508
509       return 0;
510     }
511 }
512
513 /* Fix the statuses of all directories whose statuses need fixing, and
514    which are not ancestors of FILE_NAME.  If AFTER_SYMLINKS is
515    nonzero, do this for all such directories; otherwise, stop at the
516    first directory that is marked to be fixed up only after delayed
517    symlinks are applied.  */
518 static void
519 apply_nonancestor_delayed_set_stat (char const *file_name, bool after_symlinks)
520 {
521   size_t file_name_len = strlen (file_name);
522   bool check_for_renamed_directories = 0;
523
524   while (delayed_set_stat_head)
525     {
526       struct delayed_set_stat *data = delayed_set_stat_head;
527       bool skip_this_one = 0;
528       struct stat st;
529       struct stat const *cur_info = 0;
530
531       check_for_renamed_directories |= data->after_symlinks;
532
533       if (after_symlinks < data->after_symlinks
534           || (data->file_name_len < file_name_len
535               && file_name[data->file_name_len]
536               && (ISSLASH (file_name[data->file_name_len])
537                   || ISSLASH (file_name[data->file_name_len - 1]))
538               && memcmp (file_name, data->file_name, data->file_name_len) == 0))
539         break;
540
541       if (check_for_renamed_directories)
542         {
543           cur_info = &st;
544           if (stat (data->file_name, &st) != 0)
545             {
546               stat_error (data->file_name);
547               skip_this_one = 1;
548             }
549           else if (! (st.st_dev == data->stat_info.st_dev
550                       && (st.st_ino == data->stat_info.st_ino)))
551             {
552               ERROR ((0, 0,
553                       _("%s: Directory renamed before its status could be extracted"),
554                       quotearg_colon (data->file_name)));
555               skip_this_one = 1;
556             }
557         }
558
559       if (! skip_this_one)
560         set_stat (data->file_name, &data->stat_info, cur_info,
561                   data->invert_permissions, data->permstatus, DIRTYPE);
562
563       delayed_set_stat_head = data->next;
564       free (data);
565     }
566 }
567
568 \f
569
570 /* Extractor functions for various member types */
571
572 static int
573 extract_dir (char *file_name, int typeflag)
574 {
575   int status;
576   mode_t mode;
577   int interdir_made = 0;
578   
579   if (incremental_option)
580     /* Read the entry and delete files that aren't listed in the archive.  */
581     purge_directory (file_name);
582   else if (typeflag == GNUTYPE_DUMPDIR)
583     skip_member ();
584
585   mode = (current_stat_info.stat.st_mode | (we_are_root ? 0 : MODE_WXUSR)) & MODE_RWX;
586
587   while ((status = mkdir (file_name, mode)))
588     {
589       if (errno == EEXIST
590           && (interdir_made
591               || old_files_option == DEFAULT_OLD_FILES
592               || old_files_option == OVERWRITE_OLD_FILES))
593         {
594           struct stat st;
595           if (stat (file_name, &st) == 0)
596             {
597               if (interdir_made)
598                 {
599                   repair_delayed_set_stat (file_name, &st);
600                   return 0;
601                 }
602               if (S_ISDIR (st.st_mode))
603                 {
604                   mode = st.st_mode & ~ current_umask;
605                   break;
606                 }
607             }
608           errno = EEXIST;
609         }
610       
611       if (maybe_recoverable (file_name, &interdir_made))
612         continue;
613       
614       if (errno != EEXIST)
615         {
616           mkdir_error (file_name);
617           return 1;
618         }
619       break;
620     }
621   
622   if (status == 0
623       || old_files_option == DEFAULT_OLD_FILES
624       || old_files_option == OVERWRITE_OLD_FILES)
625     delay_set_stat (file_name, &current_stat_info.stat,
626                     MODE_RWX & (mode ^ current_stat_info.stat.st_mode),
627                     (status == 0
628                      ? ARCHIVED_PERMSTATUS
629                      : UNKNOWN_PERMSTATUS));
630
631   return status;
632 }
633
634
635 static int
636 open_output_file (char *file_name, int typeflag)
637 {
638   int fd;
639   int openflag = (O_WRONLY | O_BINARY | O_CREAT
640                   | (old_files_option == OVERWRITE_OLD_FILES
641                      ? O_TRUNC
642                      : O_EXCL));
643   mode_t mode = current_stat_info.stat.st_mode & MODE_RWX & ~ current_umask;
644
645 #if O_CTG
646   /* Contiguous files (on the Masscomp) have to specify the size in
647      the open call that creates them.  */
648
649   if (typeflag == CONTTYPE)
650     fd = open (file_name, openflag | O_CTG, mode, current_stat_info.stat.st_size);
651   else
652     fd = open (file_name, openflag, mode);
653
654 #else /* not O_CTG */
655   if (typeflag == CONTTYPE)
656     {
657       static int conttype_diagnosed;
658
659       if (!conttype_diagnosed)
660         {
661           conttype_diagnosed = 1;
662           WARN ((0, 0, _("Extracting contiguous files as regular files")));
663         }
664     }
665   fd = open (file_name, openflag, mode);
666
667 #endif /* not O_CTG */
668   
669   return fd;
670 }
671
672 static int
673 extract_file (char *file_name, int typeflag)
674 {
675   int fd;
676   off_t size;
677   union block *data_block;
678   int status;
679   size_t count;
680   size_t written;
681   int interdir_made = 0;
682   
683   /* FIXME: deal with protection issues.  */
684
685   if (to_stdout_option)
686     fd = STDOUT_FILENO;
687   else if (to_command_option)
688     {
689       fd = sys_exec_command (file_name, 'f', &current_stat_info);
690       if (fd < 0)
691         {
692           skip_member ();
693           return 0;
694         }
695     }
696   else
697     {
698       do
699         fd = open_output_file (file_name, typeflag);
700       while (fd < 0 && maybe_recoverable (file_name, &interdir_made));
701     
702       if (fd < 0)
703         {
704           open_error (file_name);
705           return 1;
706         }
707     }
708     
709   if (current_stat_info.is_sparse)
710     sparse_extract_file (fd, &current_stat_info, &size);
711   else
712     for (size = current_stat_info.stat.st_size; size > 0; )
713       {
714         if (multi_volume_option)
715           {
716             assign_string (&save_name, current_stat_info.file_name);
717             save_totsize = current_stat_info.stat.st_size;
718             save_sizeleft = size;
719           }
720
721         /* Locate data, determine max length writeable, write it,
722            block that we have used the data, then check if the write
723            worked.  */
724         
725         data_block = find_next_block ();
726         if (! data_block)
727           {
728             ERROR ((0, 0, _("Unexpected EOF in archive")));
729             break;              /* FIXME: What happens, then?  */
730           }
731
732         written = available_space_after (data_block);
733         
734         if (written > size)
735           written = size;
736         errno = 0;
737         count = full_write (fd, data_block->buffer, written);
738         size -= written;
739         
740         set_next_block_after ((union block *)
741                               (data_block->buffer + written - 1));
742         if (count != written)
743           {
744             if (!to_command_option)
745               write_error_details (file_name, count, written);
746             /* FIXME: shouldn't we restore from backup? */
747             break;
748           }
749       }
750   
751   skip_file (size);
752
753   if (multi_volume_option)
754     assign_string (&save_name, 0);
755
756   /* If writing to stdout, don't try to do anything to the filename;
757      it doesn't exist, or we don't want to touch it anyway.  */
758
759   if (to_stdout_option)
760     return 0;
761
762   status = close (fd);
763   if (status < 0)
764     close_error (file_name);
765
766   if (to_command_option)
767     sys_wait_command ();
768   else
769     set_stat (file_name, &current_stat_info.stat, 0, 0,
770               (old_files_option == OVERWRITE_OLD_FILES ?
771                UNKNOWN_PERMSTATUS : ARCHIVED_PERMSTATUS),
772               typeflag);
773
774   return status;
775 }  
776
777 static int
778 extract_link (char *file_name, int typeflag)
779 {
780   char const *link_name = safer_name_suffix (current_stat_info.link_name, true);
781   int interdir_made = 0;
782   
783   do
784     {
785       struct stat st1, st2;
786       int e;
787       int status = link (link_name, file_name);
788       e = errno;
789
790       if (status == 0)
791         {
792           struct delayed_symlink *ds = delayed_symlink_head;
793           if (ds && lstat (link_name, &st1) == 0)
794             for (; ds; ds = ds->next)
795               if (ds->dev == st1.st_dev
796                   && ds->ino == st1.st_ino
797                   && ds->mtime == st1.st_mtime)
798                 {
799                   struct string_list *p =  xmalloc (offsetof (struct string_list, string)
800                                                     + strlen (file_name) + 1);
801                   strcpy (p->string, file_name);
802                   p->next = ds->sources;
803                   ds->sources = p;
804                   break;
805                 }
806           return 0;
807         }
808       else if ((e == EEXIST && strcmp (link_name, file_name) == 0)
809                || (lstat (link_name, &st1) == 0
810                    && lstat (file_name, &st2) == 0
811                    && st1.st_dev == st2.st_dev
812                    && st1.st_ino == st2.st_ino))
813         return 0;
814       
815       errno = e;
816     }
817   while (maybe_recoverable (file_name, &interdir_made));
818
819   if (!(incremental_option && errno == EEXIST))
820     {
821       link_error (link_name, file_name);
822       return 1;
823     }
824   return 0;
825 }  
826
827 static int
828 extract_symlink (char *file_name, int typeflag)
829 {
830 #ifdef HAVE_SYMLINK
831   int status, fd;
832   int interdir_made = 0;
833   
834   if (absolute_names_option
835       || ! (IS_ABSOLUTE_FILE_NAME (current_stat_info.link_name)
836             || contains_dot_dot (current_stat_info.link_name)))
837     {
838       while ((status = symlink (current_stat_info.link_name, file_name)))
839         if (!maybe_recoverable (file_name, &interdir_made))
840           break;
841
842       if (status == 0)
843         set_stat (file_name, &current_stat_info.stat, 0, 0, 0, SYMTYPE);
844       else
845         symlink_error (current_stat_info.link_name, file_name);
846     }
847   else
848     {
849       /* This symbolic link is potentially dangerous.  Don't
850          create it now; instead, create a placeholder file, which
851          will be replaced after other extraction is done.  */
852       struct stat st;
853
854       while ((fd = open (file_name, O_WRONLY | O_CREAT | O_EXCL, 0)) < 0)
855         if (! maybe_recoverable (file_name, &interdir_made))
856           break;
857
858       status = -1;
859       if (fd < 0)
860         open_error (file_name);
861       else if (fstat (fd, &st) != 0)
862         {
863           stat_error (file_name);
864           close (fd);
865         }
866       else if (close (fd) != 0)
867         close_error (file_name);
868       else
869         {
870           struct delayed_set_stat *h;
871           struct delayed_symlink *p = xmalloc (offsetof (struct delayed_symlink, target)
872                                                + strlen (current_stat_info.link_name)
873                                                + 1);
874           p->next = delayed_symlink_head;
875           delayed_symlink_head = p;
876           p->dev = st.st_dev;
877           p->ino = st.st_ino;
878           p->mtime = st.st_mtime;
879           p->uid = current_stat_info.stat.st_uid;
880           p->gid = current_stat_info.stat.st_gid;
881           p->sources = xmalloc (offsetof (struct string_list, string)
882                                 + strlen (file_name) + 1);
883           p->sources->next = 0;
884           strcpy (p->sources->string, file_name);
885           strcpy (p->target, current_stat_info.link_name);
886
887           h = delayed_set_stat_head;
888           if (h && ! h->after_symlinks
889               && strncmp (file_name, h->file_name, h->file_name_len) == 0
890               && ISSLASH (file_name[h->file_name_len])
891               && (base_name (file_name) == file_name + h->file_name_len + 1))
892             {
893               do
894                 {
895                   h->after_symlinks = 1;
896                   
897                   if (stat (h->file_name, &st) != 0)
898                     stat_error (h->file_name);
899                   else
900                     {
901                       h->stat_info.st_dev = st.st_dev;
902                       h->stat_info.st_ino = st.st_ino;
903                     }
904                 }
905               while ((h = h->next) && ! h->after_symlinks);
906             }
907           
908           status = 0;
909         }
910     }
911
912   return status;
913
914 #else
915   static int warned_once;
916
917   if (!warned_once)
918     {
919       warned_once = 1;
920       WARN ((0, 0, _("Attempting extraction of symbolic links as hard links")));
921     }
922   return extract_link (file_name, typeflag);  
923 #endif
924 }  
925
926 #if S_IFCHR || S_IFBLK
927 static int
928 extract_node (char *file_name, int typeflag)
929 {
930   int status;
931   int interdir_made = 0;
932   
933   do
934     status = mknod (file_name, current_stat_info.stat.st_mode,
935                     current_stat_info.stat.st_rdev);
936   while (status && maybe_recoverable (file_name, &interdir_made));
937   
938   if (status != 0)
939     mknod_error (file_name);
940   else
941     set_stat (file_name, &current_stat_info.stat, 0, 0, ARCHIVED_PERMSTATUS, typeflag);
942   return status;
943 }
944 #endif
945
946 #if HAVE_MKFIFO || defined mkfifo
947 static int
948 extract_fifo (char *file_name, int typeflag)
949 {
950   int status;
951   int interdir_made = 0;
952   
953   while ((status = mkfifo (file_name, current_stat_info.stat.st_mode)))
954     if (!maybe_recoverable (file_name, &interdir_made))
955       break;
956
957   if (status == 0)
958     set_stat (file_name, &current_stat_info.stat, NULL, 0,
959               ARCHIVED_PERMSTATUS, typeflag);
960   else
961     mkfifo_error (file_name);
962   return status;
963 }  
964 #endif
965
966 static int
967 extract_mangle_wrapper (char *file_name, int typeflag)
968 {
969   extract_mangle ();
970   return 0;
971 }
972
973      
974 static int
975 extract_failure (char *file_name, int typeflag)
976 {
977   return 1;
978 }
979
980 typedef int (*tar_extractor_t) (char *file_name, int typeflag);
981
982 \f
983
984 #define EXTRACT_OVER_PIPE (to_stdout_option || to_command_option)
985
986 /* Prepare to extract a file. Find extractor function.
987    Return zero if extraction should not proceed.  */
988
989 static int
990 prepare_to_extract (char const *file_name, int typeflag, tar_extractor_t *fun)
991 {
992   int rc = 1;
993   
994   if (EXTRACT_OVER_PIPE)
995     rc = 0;
996
997   /* Select the extractor */
998   switch (typeflag)
999     {
1000     case GNUTYPE_SPARSE:
1001       *fun = extract_file;
1002       rc = 1;
1003       break;
1004       
1005     case AREGTYPE:
1006     case REGTYPE:
1007     case CONTTYPE:
1008       /* Appears to be a file.  But BSD tar uses the convention that a slash
1009          suffix means a directory.  */
1010       if (current_stat_info.had_trailing_slash)
1011         *fun = extract_dir;
1012       else
1013         {
1014           *fun = extract_file;
1015           rc = 1;
1016         }
1017       break;
1018
1019     case SYMTYPE:
1020       *fun = extract_symlink;
1021       break;
1022
1023     case LNKTYPE:
1024       *fun = extract_link;
1025       break;
1026
1027 #if S_IFCHR
1028     case CHRTYPE:
1029       current_stat_info.stat.st_mode |= S_IFCHR;
1030       *fun = extract_node;
1031       break;
1032 #endif
1033
1034 #if S_IFBLK
1035     case BLKTYPE:
1036       current_stat_info.stat.st_mode |= S_IFBLK;
1037       *fun = extract_node;
1038       break;
1039 #endif
1040
1041 #if HAVE_MKFIFO || defined mkfifo
1042     case FIFOTYPE:
1043       *fun = extract_fifo;
1044       break;
1045 #endif
1046
1047     case DIRTYPE:
1048     case GNUTYPE_DUMPDIR:
1049       *fun = extract_dir;
1050       break;
1051
1052     case GNUTYPE_VOLHDR:
1053       if (verbose_option)
1054         fprintf (stdlis, _("Reading %s\n"), quote (current_stat_info.file_name));
1055       *fun = NULL;
1056       break;
1057
1058     case GNUTYPE_NAMES:
1059       *fun = extract_mangle_wrapper;
1060       break;
1061
1062     case GNUTYPE_MULTIVOL:
1063       ERROR ((0, 0,
1064               _("%s: Cannot extract -- file is continued from another volume"),
1065               quotearg_colon (current_stat_info.file_name)));
1066       *fun = extract_failure;
1067       break;
1068
1069     case GNUTYPE_LONGNAME:
1070     case GNUTYPE_LONGLINK:
1071       ERROR ((0, 0, _("Unexpected long name header")));
1072       *fun = extract_failure;
1073       break;
1074
1075     default:
1076       WARN ((0, 0,
1077              _("%s: Unknown file type '%c', extracted as normal file"),
1078              quotearg_colon (file_name), typeflag));
1079       *fun = extract_file;
1080     }
1081
1082   /* Determine whether the extraction should proceed */
1083   if (rc == 0)
1084     return 0;
1085   
1086   switch (old_files_option)
1087     {
1088     case UNLINK_FIRST_OLD_FILES:
1089       if (!remove_any_file (file_name, 
1090                             recursive_unlink_option ? RECURSIVE_REMOVE_OPTION 
1091                                                       : ORDINARY_REMOVE_OPTION)
1092           && errno && errno != ENOENT)
1093         {
1094           unlink_error (file_name);
1095           return 0;
1096         }
1097       break;
1098
1099     case KEEP_NEWER_FILES:
1100       if (file_newer_p (file_name, &current_stat_info))
1101         {
1102           WARN ((0, 0, _("Current %s is newer"), quote (file_name)));
1103           return 0;
1104         }
1105       break;
1106
1107     default:
1108       break;
1109     }
1110
1111   return 1;
1112 }
1113
1114 /* Extract a file from the archive.  */
1115 void
1116 extract_archive (void)
1117 {
1118   char typeflag;
1119   char *file_name;
1120   tar_extractor_t fun;
1121   
1122   set_next_block_after (current_header);
1123   decode_header (current_header, &current_stat_info, &current_format, 1);
1124
1125   if (interactive_option && !confirm ("extract", current_stat_info.file_name))
1126     {
1127       skip_member ();
1128       return;
1129     }
1130
1131   /* Print the block from current_header and current_stat.  */
1132
1133   if (verbose_option)
1134     print_header (&current_stat_info, -1);
1135
1136   file_name = safer_name_suffix (current_stat_info.file_name, false);
1137   if (strip_name_components)
1138     {
1139       size_t prefix_len = stripped_prefix_len (file_name, strip_name_components);
1140       if (prefix_len == (size_t) -1)
1141         {
1142           skip_member ();
1143           return;
1144         }
1145       file_name += prefix_len;
1146     }
1147
1148   apply_nonancestor_delayed_set_stat (file_name, 0);
1149
1150   /* Take a safety backup of a previously existing file.  */
1151
1152   if (backup_option && ! EXTRACT_OVER_PIPE)
1153     if (!maybe_backup_file (file_name, 0))
1154       {
1155         int e = errno;
1156         ERROR ((0, e, _("%s: Was unable to backup this file"),
1157                 quotearg_colon (file_name)));
1158         skip_member ();
1159         return;
1160       }
1161
1162   /* Extract the archive entry according to its type.  */
1163
1164   /* KLUDGE */
1165   typeflag = sparse_member_p (&current_stat_info) ?
1166                   GNUTYPE_SPARSE : current_header->header.typeflag;
1167
1168   if (prepare_to_extract (file_name, typeflag, &fun))
1169     {
1170       if (fun && (*fun) (file_name, typeflag) && backup_option)
1171         undo_last_backup ();
1172     }
1173   else
1174     skip_member ();
1175   
1176 }
1177
1178 /* Extract the symbolic links whose final extraction were delayed.  */
1179 static void
1180 apply_delayed_symlinks (void)
1181 {
1182   struct delayed_symlink *ds;
1183
1184   for (ds = delayed_symlink_head; ds; )
1185     {
1186       struct string_list *sources = ds->sources;
1187       char const *valid_source = 0;
1188
1189       for (sources = ds->sources; sources; sources = sources->next)
1190         {
1191           char const *source = sources->string;
1192           struct stat st;
1193
1194           /* Make sure the placeholder file is still there.  If not,
1195              don't create a symlink, as the placeholder was probably
1196              removed by a later extraction.  */
1197           if (lstat (source, &st) == 0
1198               && st.st_dev == ds->dev
1199               && st.st_ino == ds->ino
1200               && st.st_mtime == ds->mtime)
1201             {
1202               /* Unlink the placeholder, then create a hard link if possible,
1203                  a symbolic link otherwise.  */
1204               if (unlink (source) != 0)
1205                 unlink_error (source);
1206               else if (valid_source && link (valid_source, source) == 0)
1207                 ;
1208               else if (symlink (ds->target, source) != 0)
1209                 symlink_error (ds->target, source);
1210               else
1211                 {
1212                   valid_source = source;
1213                   st.st_uid = ds->uid;
1214                   st.st_gid = ds->gid;
1215                   set_stat (source, &st, 0, 0, 0, SYMTYPE);
1216                 }
1217             }
1218         }
1219
1220       for (sources = ds->sources; sources; )
1221         {
1222           struct string_list *next = sources->next;
1223           free (sources);
1224           sources = next;
1225         }
1226
1227       {
1228         struct delayed_symlink *next = ds->next;
1229         free (ds);
1230         ds = next;
1231       }
1232     }
1233
1234   delayed_symlink_head = 0;
1235 }
1236
1237 /* Finish the extraction of an archive.  */
1238 void
1239 extract_finish (void)
1240 {
1241   /* First, fix the status of ordinary directories that need fixing.  */
1242   apply_nonancestor_delayed_set_stat ("", 0);
1243
1244   /* Then, apply delayed symlinks, so that they don't affect delayed
1245      directory status-setting for ordinary directories.  */
1246   apply_delayed_symlinks ();
1247
1248   /* Finally, fix the status of directories that are ancestors
1249      of delayed symlinks.  */
1250   apply_nonancestor_delayed_set_stat ("", 1);
1251 }
1252
1253 void
1254 fatal_exit (void)
1255 {
1256   extract_finish ();
1257   error (TAREXIT_FAILURE, 0, _("Error is not recoverable: exiting now"));
1258   abort ();
1259 }
1260
1261 void
1262 xalloc_die (void)
1263 {
1264   error (0, 0, "%s", _("memory exhausted"));
1265   fatal_exit ();
1266 }