Diff for /loncom/metadata_database/searchcat.pl between versions 1.62 and 1.76

version 1.62, 2005/03/11 03:25:18 version 1.76, 2007/04/11 22:44:18
Line 65  and correct user experience. Line 65  and correct user experience.
 =cut  =cut
   
 use strict;  use strict;
   
 use DBI;  use DBI;
 use lib '/home/httpd/lib/perl/';  use lib '/home/httpd/lib/perl/';
 use LONCAPA::Configuration;  
 use LONCAPA::lonmetadata;  use LONCAPA::lonmetadata;
   use LONCAPA;
 use Getopt::Long;  use Getopt::Long;
 use IO::File;  use IO::File;
 use HTML::TokeParser;  use HTML::TokeParser;
 use GDBM_File;  use GDBM_File;
 use POSIX qw(strftime mktime);  use POSIX qw(strftime mktime);
   
 use Sys::Hostname;  use Apache::lonnet();
   
 use File::Find;  use File::Find;
   
 #  #
 # Set up configuration options  # Set up configuration options
 my ($simulate,$oneuser,$help,$verbose,$logfile,$debug,$multidom);  my ($simulate,$oneuser,$help,$verbose,$logfile,$debug);
 GetOptions (  GetOptions (
             'help'     => \$help,              'help'     => \$help,
             'simulate' => \$simulate,              'simulate' => \$simulate,
             'only=s'   => \$oneuser,              'only=s'   => \$oneuser,
             'verbose=s'  => \$verbose,              'verbose=s'  => \$verbose,
             'debug' => \$debug,              'debug' => \$debug,
             'multi_domain'  => \$multidom,  
             );              );
   
 if ($help) {  if ($help) {
Line 103  Options: Line 100  Options:
     -only=user     Only compute for the given user.  Implies -simulate         -only=user     Only compute for the given user.  Implies -simulate   
     -verbose=val   Sets logging level, val must be a number      -verbose=val   Sets logging level, val must be a number
     -debug         Turns on debugging output      -debug         Turns on debugging output
     -multi_domain  Parse the hosts.tab file domain(s) to use.  
 ENDHELP  ENDHELP
     exit 0;      exit 0;
 }  }
Line 122  if (defined($oneuser)) { Line 118  if (defined($oneuser)) {
   
 ##  ##
 ## Use variables for table names so we can test this routine a little easier  ## Use variables for table names so we can test this routine a little easier
 my $oldname = 'metadata';  my %oldnames = (
 my $newname = 'newmetadata'.$$; # append pid to have unique temporary table                   'metadata'    => 'metadata',
                    'portfolio'   => 'portfolio_metadata',
                    'access'      => 'portfolio_access',
                    'addedfields' => 'portfolio_addedfields',
                  );
   
   my %newnames;
   # new table names -  append pid to have unique temporary tables
   foreach my $key (keys(%oldnames)) {
       $newnames{$key} = 'new'.$oldnames{$key}.$$;
   }
   
 #  #
 # Read loncapa_apache.conf and loncapa.conf  
 my $perlvarref=LONCAPA::Configuration::read_conf('loncapa.conf');  
 my %perlvar=%{$perlvarref};  
 undef $perlvarref;  
 delete $perlvar{'lonReceipt'}; # remove since sensitive (really?) & not needed  
 #  
 # Only run if machine is a library server  # Only run if machine is a library server
 exit if ($perlvar{'lonRole'} ne 'library');  exit if ($Apache::lonnet::perlvar{'lonRole'} ne 'library');
 #  #
 #  Make sure this process is running from user=www  #  Make sure this process is running from user=www
 my $wwwid=getpwnam('www');  my $wwwid=getpwnam('www');
 if ($wwwid!=$<) {  if ($wwwid!=$<) {
     my $emailto="$perlvar{'lonAdmEMail'},$perlvar{'lonSysEMail'}";      my $emailto="$Apache::lonnet::perlvar{'lonAdmEMail'},$Apache::lonnet::perlvar{'lonSysEMail'}";
     my $subj="LON: $perlvar{'lonHostID'} User ID mismatch";      my $subj="LON: $Apache::lonnet::perlvar{'lonHostID'} User ID mismatch";
     system("echo 'User ID mismatch. searchcat.pl must be run as user www.' |\      system("echo 'User ID mismatch. searchcat.pl must be run as user www.' |\
  mailto $emailto -s '$subj' > /dev/null");   mail -s '$subj' $emailto > /dev/null");
     exit 1;      exit 1;
 }  }
 #  #
 # Let people know we are running  # Let people know we are running
 open(LOG,'>>'.$perlvar{'lonDaemons'}.'/logs/searchcat.log');  open(LOG,'>>'.$Apache::lonnet::perlvar{'lonDaemons'}.'/logs/searchcat.log');
 &log(0,'==== Searchcat Run '.localtime()."====");  &log(0,'==== Searchcat Run '.localtime()."====");
   
   
Line 158  if ($debug) { Line 158  if ($debug) {
 #  #
 # Connect to database  # Connect to database
 my $dbh;  my $dbh;
 if (! ($dbh = DBI->connect("DBI:mysql:loncapa","www",$perlvar{'lonSqlAccess'},  if (! ($dbh = DBI->connect("DBI:mysql:loncapa","www",$Apache::lonnet::perlvar{'lonSqlAccess'},
                           { RaiseError =>0,PrintError=>0}))) {                            { RaiseError =>0,PrintError=>0}))) {
     &log(0,"Cannot connect to database!");      &log(0,"Cannot connect to database!");
     die "MySQL Error: Cannot connect to database!\n";      die "MySQL Error: Cannot connect to database!\n";
 }  }
 # This can return an error and still be okay, so we do not bother checking.  # This can return an error and still be okay, so we do not bother checking.
 # (perhaps it should be more robust and check for specific errors)  # (perhaps it should be more robust and check for specific errors)
 $dbh->do('DROP TABLE IF EXISTS '.$newname);  foreach my $key (keys(%newnames)) {
 #      if ($newnames{$key} ne '') {
 # Create the new table          $dbh->do('DROP TABLE IF EXISTS '.$newnames{$key});
 my $request = &LONCAPA::lonmetadata::create_metadata_storage($newname);      }
 $dbh->do($request);  
 if ($dbh->err) {  
     $dbh->disconnect();  
     &log(0,"MySQL Error Create: ".$dbh->errstr);  
     die $dbh->errstr;  
 }  }
   
 #  #
 # find out which users we need to examine  # Create the new metadata and portfolio tables
 my @domains;  foreach my $key (keys(%newnames)) {
 if (defined($multidom)) {      if ($newnames{$key} ne '') { 
     &log(1,'====multi domain setup====');          my $request =
     # Peek into the hosts.tab and look for matches of our hostname               &LONCAPA::lonmetadata::create_metadata_storage($newnames{$key},$oldnames{$key});
     my $host = hostname();          $dbh->do($request);
     &log(9,'hostname = "'.$host.'"');          if ($dbh->err) {
     open(HOSTFILE,$perlvar{'lonTabDir'}.'/hosts.tab') ||               $dbh->disconnect();
         die ("Unable to determine domain(s) of multi-domain server");              &log(0,"MySQL Error Create: ".$dbh->errstr);
     my %domains;              die $dbh->errstr;
     while (<HOSTFILE>) {          }
         next if (/^\#/);  
         next if (!/:\Q$host\E/);  
         &log(9,$_);  
         $domains{(split(':',$_))[1]}++;  
     }  
     close HOSTFILE;  
     @domains = sort(keys(%domains));  
     &log(9,join(',',@domains));  
     if (! scalar(@domains)) {  
         die ("Unable to find any domains in the hosts.tab that match ".$host);  
     }      }
 } else {  
     push(@domains,$perlvar{'lonDefDomain'});  
 }  }
   
   #
   # find out which users we need to examine
   my @domains = sort(&Apache::lonnet::current_machine_domains());
   &log(9,'domains ="'.join('","',@domains).'"');
   
 foreach my $dom (@domains) {  foreach my $dom (@domains) {
     &log(9,'domain = '.$dom);      &log(9,'domain = '.$dom);
     opendir(RESOURCES,"$perlvar{'lonDocRoot'}/res/$dom");      opendir(RESOURCES,"$Apache::lonnet::perlvar{'lonDocRoot'}/res/$dom");
     my @homeusers =       my @homeusers = 
         grep {          grep {
             &ishome("$perlvar{'lonDocRoot'}/res/$dom/$_");              &ishome("$Apache::lonnet::perlvar{'lonDocRoot'}/res/$dom/$_");
         } grep {           } grep { 
             !/^\.\.?$/;              !/^\.\.?$/;
         } readdir(RESOURCES);          } readdir(RESOURCES);
Line 229  foreach my $dom (@domains) { Line 218  foreach my $dom (@domains) {
               #wanted     => \&print_filename,                #wanted     => \&print_filename,
               #wanted     => \&log_metadata,                #wanted     => \&log_metadata,
               wanted     => \&process_meta_file,                wanted     => \&process_meta_file,
              }, join('/',($perlvar{'lonDocRoot'},'res',$dom,$user)) );                no_chdir   => 1,
                }, join('/',($Apache::lonnet::perlvar{'lonDocRoot'},'res',$dom,$user)) );
       }
       # Search for public portfolio files
       my %portusers;
       if ($oneuser) {
           %portusers = (
                           $oneuser => '',
                          );
       } else {
           my $dir = $Apache::lonnet::perlvar{lonUsersDir}.'/'.$dom;
           &descend_tree($dir,0,\%portusers);
       }
       foreach my $uname (keys(%portusers)) {
           my $urlstart = '/uploaded/'.$dom.'/'.$uname;
           my $pathstart = &propath($dom,$uname).'/userfiles';
           my $is_course = &Apache::lonnet::is_course($dom,$uname);
           my $curr_perm = &Apache::lonnet::get_portfile_permissions($dom,$uname);
           my %access = &Apache::lonnet::get_access_controls($curr_perm);
           foreach my $file (keys(%access)) {
               my ($group,$url,$fullpath);
               if ($is_course) {
                   ($group, my ($path)) = ($file =~ /^(\w+)(\/.+)$/);
                   $fullpath = $pathstart.'/groups/'.$group.'/portfolio'.$path;
                   $url = $urlstart.'/groups/'.$group.'/portfolio'.$path;
               } else {
                   $fullpath = $pathstart.'/portfolio'.$file;
                   $url = $urlstart.'/portfolio'.$file;
               }
               if (ref($access{$file}) eq 'HASH') {
                   my %portaccesslog = 
                       &LONCAPA::lonmetadata::process_portfolio_access_data($dbh,
                              $simulate,\%newnames,$url,$fullpath,$access{$file});
                   &portfolio_logging(%portaccesslog);
               }
               my %portmetalog = &LONCAPA::lonmetadata::process_portfolio_metadata($dbh,$simulate,\%newnames,$url,$fullpath,$is_course,$dom,$uname,$group);
               &portfolio_logging(%portmetalog);
           }
     }      }
 }  }
   
 #  #
 # Rename the table  # Rename the tables
 if (! $simulate) {  if (! $simulate) {
     $dbh->do('DROP TABLE IF EXISTS '.$oldname);      foreach my $key (keys(%oldnames)) {
     if (! $dbh->do('RENAME TABLE '.$newname.' TO '.$oldname)) {          if (($oldnames{$key} ne '') && ($newnames{$key} ne '')) {
         &log(0,"MySQL Error Rename: ".$dbh->errstr);              $dbh->do('DROP TABLE IF EXISTS '.$oldnames{$key});
         die $dbh->errstr;              if (! $dbh->do('RENAME TABLE '.$newnames{$key}.' TO '.$oldnames{$key})) {
     } else {                  &log(0,"MySQL Error Rename: ".$dbh->errstr);
         &log(1,"MySQL table rename successful.");                  die $dbh->errstr;
               } else {
                   &log(1,"MySQL table rename successful for $key.");
               }
           }
     }      }
 }  }
 if (! $dbh->disconnect) {  if (! $dbh->disconnect) {
Line 274  sub log { Line 305  sub log {
     }      }
 }  }
   
   sub portfolio_logging {
       my (%portlog) = @_;
       foreach my $key (keys(%portlog)) {
           if (ref($portlog{$key}) eq 'HASH') {
               foreach my $item (keys(%{$portlog{$key}})) {
                   &log(0,$portlog{$key}{$item});
               }
           }
       }
   }
   
   sub descend_tree {
       my ($dir,$depth,$alldomusers) = @_;
       if (-d $dir) {
           opendir(DIR,$dir);
           my @contents = grep(!/^\./,readdir(DIR));
           closedir(DIR);
           $depth ++;
           foreach my $item (@contents) {
               if ($depth < 4) {
                   &descend_tree($dir.'/'.$item,$depth,$alldomusers);
               } else {
                   if (-e $dir.'/'.$item.'/file_permissions.db') {
                    
                       $$alldomusers{$item} = '';
                   }
               }       
           }
       } 
   }
   
 ########################################################  ########################################################
 ########################################################  ########################################################
 ###                                                  ###  ###                                                  ###
Line 293  sub only_meta_files { Line 355  sub only_meta_files {
     foreach my $file (@PossibleFiles) {      foreach my $file (@PossibleFiles) {
         if ( ($file =~ /\.meta$/ &&            # Ends in meta          if ( ($file =~ /\.meta$/ &&            # Ends in meta
               $file !~ /\.\d+\.[^\.]+\.meta$/  # is not for a prior version                $file !~ /\.\d+\.[^\.]+\.meta$/  # is not for a prior version
              ) || (-d $file )) { # directories are okay               ) || (-d $File::Find::dir."/".$file )) { # directories are okay
                  # but we do not want /. or /..                   # but we do not want /. or /..
             push(@ChosenFiles,$file);              push(@ChosenFiles,$file);
         }          }
Line 324  sub log_metadata { Line 386  sub log_metadata {
     return if (-d $fullfilename); # No need to do anything here for directories      return if (-d $fullfilename); # No need to do anything here for directories
     if ($debug) {      if ($debug) {
         &log(6,$fullfilename);          &log(6,$fullfilename);
         my $ref=&metadata($fullfilename);          my $ref = &metadata($fullfilename);
         if (! defined($ref)) {          if (! defined($ref)) {
             &log(6,"    No data");              &log(6,"    No data");
             return;              return;
Line 348  sub process_meta_file { Line 410  sub process_meta_file {
     #      #
     &log(3,$filename) if ($debug);      &log(3,$filename) if ($debug);
     #      #
     my $ref=&metadata($filename);      my $ref = &metadata($filename);
     #      #
     # $url is the original file url, not the metadata file      # $url is the original file url, not the metadata file
     my $target = $filename;      my $target = $filename;
Line 377  sub process_meta_file { Line 439  sub process_meta_file {
         %dyn=&get_dynamic_metadata($url);          %dyn=&get_dynamic_metadata($url);
         &count_type($url);          &count_type($url);
     }      }
       &LONCAPA::lonmetadata::getfiledates($ref,$target);
     #      #
     if (! defined($ref->{'creationdate'}) ||  
         $ref->{'creationdate'} =~ /^\s*$/) {  
         $ref->{'creationdate'} = (stat($target))[9];  
     }  
     if (! defined($ref->{'lastrevisiondate'}) ||  
         $ref->{'lastrevisiondate'} =~ /^\s*$/) {  
         $ref->{'lastrevisiondate'} = (stat($target))[9];  
     }  
     $ref->{'creationdate'}     = &sqltime($ref->{'creationdate'});  
     $ref->{'lastrevisiondate'} = &sqltime($ref->{'lastrevisiondate'});  
     my %Data = (      my %Data = (
                 %$ref,                  %$ref,
                 %dyn,                  %dyn,
                 'url'=>$url,                  'url'=>$url,
                 'version'=>'current');                  'version'=>'current');
     if (! $simulate) {      if (! $simulate) {
         my ($count,$err) = &LONCAPA::lonmetadata::store_metadata($dbh,$newname,          my ($count,$err) = 
                                                                  \%Data);            &LONCAPA::lonmetadata::store_metadata($dbh,$newnames{'metadata'},
                                                   'metadata',\%Data);
         if ($err) {          if ($err) {
             &log(0,"MySQL Error Insert: ".$err);              &log(0,"MySQL Error Insert: ".$err);
         }          }
Line 417  sub process_meta_file { Line 471  sub process_meta_file {
 ########################################################  ########################################################
 ########################################################  ########################################################
 sub metadata {  sub metadata {
     my ($uri)=@_;      my ($uri) = @_;
     my %metacache=();      my %metacache=();
     $uri=&declutter($uri);      $uri=&declutter($uri);
     my $filename=$uri;      my $filename=$uri;
Line 426  sub metadata { Line 480  sub metadata {
     if ($filename !~ /\.meta$/) {       if ($filename !~ /\.meta$/) { 
         $filename.='.meta';          $filename.='.meta';
     }      }
     my $metastring=&getfile($perlvar{'lonDocRoot'}.'/res/'.$filename);      my $metastring = 
           &LONCAPA::lonmetadata::getfile($Apache::lonnet::perlvar{'lonDocRoot'}.'/res/'.$filename);
     return undef if (! defined($metastring));      return undef if (! defined($metastring));
     my $parser=HTML::TokeParser->new(\$metastring);      my $parser=HTML::TokeParser->new(\$metastring);
     my $token;      my $token;
Line 447  sub metadata { Line 502  sub metadata {
             }              }
             foreach ( @{$token->[3]}) {              foreach ( @{$token->[3]}) {
                 $metacache{$uri.''.$unikey.'.'.$_}=$token->[2]->{$_};                  $metacache{$uri.''.$unikey.'.'.$_}=$token->[2]->{$_};
             }               }
             if (! ($metacache{$uri.''.$unikey}=$parser->get_text('/'.$entry))){              if (! ($metacache{$uri.''.$unikey}=$parser->get_text('/'.$entry))){
                 $metacache{$uri.''.$unikey} =                   $metacache{$uri.''.$unikey} = 
                     $metacache{$uri.''.$unikey.'.default'};                      $metacache{$uri.''.$unikey.'.default'};
Line 457  sub metadata { Line 512  sub metadata {
     return \%metacache;      return \%metacache;
 }  }
   
 ##  
 ## &getfile($filename)  
 ##   Slurps up an entire file into a scalar.    
 ##   Returns undef if the file does not exist  
 sub getfile {  
     my $file = shift();  
     if (! -e $file ) {   
         return undef;   
     }  
     my $fh=IO::File->new($file);  
     my $contents = '';  
     while (<$fh>) {   
         $contents .= $_;  
     }  
     return $contents;  
 }  
   
 ########################################################  ########################################################
 ########################################################  ########################################################
 ###                                                  ###  ###                                                  ###
Line 535  sub process_dynamic_metadata { Line 573  sub process_dynamic_metadata {
     %DynamicData = &LONCAPA::lonmetadata::process_reseval_data(\%evaldata);      %DynamicData = &LONCAPA::lonmetadata::process_reseval_data(\%evaldata);
     untie(%evaldata);      untie(%evaldata);
     $DynamicData{'domain'} = $dom;      $DynamicData{'domain'} = $dom;
     print('user = '.$user.' domain = '.$dom.$/);      #print('user = '.$user.' domain = '.$dom.$/);
     #      #
     # Read in the access count data      # Read in the access count data
     &log(7,'Reading access count data') if ($debug);      &log(7,'Reading access count data') if ($debug);
Line 641  sub write_copyright_count { Line 679  sub write_copyright_count {
 ##   (copied from lond, modification of the return value)  ##   (copied from lond, modification of the return value)
 sub ishome {  sub ishome {
     my $author=shift;      my $author=shift;
     $author=~s/\/home\/httpd\/html\/res\/([^\/]*)\/([^\/]*).*/$1\/$2/;      $author=~s{/home/httpd/html/res/([^/]*)/([^/]*).*}{$1/$2};
     my ($udom,$uname)=split(/\//,$author);      my ($udom,$uname)=split(/\//,$author);
     my $proname=propath($udom,$uname);      my $proname=propath($udom,$uname);
     if (-e $proname) {      if (-e $proname) {
Line 652  sub ishome { Line 690  sub ishome {
 }  }
   
 ##  ##
 ## &propath($udom,$uname)  
 ##   Returns the path to the users LON-CAPA directory  
 ##   (copied from lond)  
 sub propath {  
     my ($udom,$uname)=@_;  
     $udom=~s/\W//g;  
     $uname=~s/\W//g;  
     my $subdir=$uname.'__';  
     $subdir =~ s/(.)(.)(.).*/$1\/$2\/$3/;  
     my $proname="$perlvar{'lonUsersDir'}/$udom/$subdir/$uname";  
     return $proname;  
 }   
   
 ##  
 ## &sqltime($timestamp)  
 ##  
 ## Convert perl $timestamp to MySQL time.  MySQL expects YYYY-MM-DD HH:MM:SS  
 ##  
 sub sqltime {  
     my ($time) = @_;  
     my $mysqltime;  
     if ($time =~   
         /(\d+)-(\d+)-(\d+) # YYYY-MM-DD  
         \s                 # a space  
         (\d+):(\d+):(\d+)  # HH:MM::SS  
         /x ) {   
         # Some of the .meta files have the time in mysql  
         # format already, so just make sure they are 0 padded and  
         # pass them back.  
         $mysqltime = sprintf('%04d-%02d-%02d %02d:%02d:%02d',  
                              $1,$2,$3,$4,$5,$6);  
     } elsif ($time =~ /^\d+$/) {  
         my @TimeData = gmtime($time);  
         # Alter the month to be 1-12 instead of 0-11  
         $TimeData[4]++;  
         # Alter the year to be from 0 instead of from 1900  
         $TimeData[5]+=1900;  
         $mysqltime = sprintf('%04d-%02d-%02d %02d:%02d:%02d',  
                              @TimeData[5,4,3,2,1,0]);  
     } elsif (! defined($time) || $time == 0) {  
         $mysqltime = 0;  
     } else {  
         &log(0,"    sqltime:Unable to decode time ".$time);  
         $mysqltime = 0;  
     }  
     return $mysqltime;  
 }  
   
 ##  
 ## &declutter($filename)  ## &declutter($filename)
 ##   Given a filename, returns a url for the filename.  ##   Given a filename, returns a url for the filename.
 sub declutter {  sub declutter {
     my $thisfn=shift;      my $thisfn=shift;
     $thisfn=~s/^$perlvar{'lonDocRoot'}//;      $thisfn=~s/^$Apache::lonnet::perlvar{'lonDocRoot'}//;
     $thisfn=~s/^\///;      $thisfn=~s/^\///;
     $thisfn=~s/^res\///;      $thisfn=~s/^res\///;
     return $thisfn;      return $thisfn;
 }  }
   
 ##  
 ## Escape / Unescape special characters  
 sub unescape {  
     my $str=shift;  
     $str =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C",hex($1))/eg;  
     return $str;  
 }  
   
 sub escape {  
     my $str=shift;  
     $str =~ s/(\W)/"%".unpack('H2',$1)/eg;  
     return $str;  
 }  

Removed from v.1.62  
changed lines
  Added in v.1.76


FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>