| Autor | 
    Nachricht | 
  
  
    | 
      
     | 
    
      
        
					
            Titel: HTML-Links via Perl auslesen? 
             Verfasst am: 08.11.2006, 13:05 Uhr
           | 
				 
       
     | 
  
  
    
      
        
          
             
            
  
            Anmeldung: 30. Jun 2005 
            Beiträge: 449 
             
            
            
           | 
         
       
     | 
    
      
        
          Hallo Linux-Freunde, 
 
ein Freund von mir sucht eine Möglichkeit HTML-Links mit Perl auszulesen. Dazu greift er via Perl auf den Online-Sourcecode zu, speichert ihn in einer String-Variable und nun benötigt er noch die Möglichkeit sich die Inhalte von allen 
Code: 
<a href> DAS BRAUCHEN WIR </a href> 
 
auszugeben. Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren
 
 
Ich würd' ihm gern helfen, aber habe offen gestanden bisher keine Ahnung von Perl. Wäre super, wenn jemand eine Idee hätte. 
 
 
Greetz
 
DANNYBOY | 
         
        
          | 
          
            
          
            
            
           | 
         
         
	        |     | 
	       
       
     | 
  
  
    | 
      
      
     | 
  
  
      | 
  
  
    | 
      
     | 
    
      
        
					
            Titel: RE: HTML-Links via Perl auslesen? 
             Verfasst am: 08.11.2006, 13:38 Uhr
           | 
				 
       
     | 
  
  
    
      
        
          
             
             
  
            Anmeldung: 20. Jul 2004 
            Beiträge: 316 
             
            
            
           | 
         
       
     | 
    
      
        
          | Er soll nicht in einen String speichern, sondern in ein Array (die Dinger mit dem @ am Anfang). Dann jagt er eine Suche drüber und speichert für jede Zeile in der der entsprechende Tag vorkommt eine neue Variable. | 
         
        
          
          
            
          
             _________________ Wenn Windows die Lösung ist...
 
kann ich dann bitte das Problem zurück haben?
            
           | 
         
         
	        |     | 
	       
       
     | 
  
  
    | 
      
      
     | 
  
  
      | 
  
  
    | 
      
     | 
    
      
        
					
            Titel:  
             Verfasst am: 10.11.2006, 16:02 Uhr
           | 
				 
       
     | 
  
  
    
      
        
          
             
             
  
            Anmeldung: 05. Apr 2005 
            Beiträge: 499 
            Wohnort: Bielefeld <:-P 
            
            
           | 
         
       
     | 
    
      
        
          Ein apt-cache search html|grep perl|more fördert u.a. diese Perl-Module zu Tage (neben vielen anderen die sich mit HTML beschäftigen):libhtml-linkextractor-perl - Perl module used to extract links from HTML documents
 
libhtml-parser-perl - A collection of modules that parse HTML text documents
 
 
 
was wohl für die Aufgabenstellung Arbeit abnehmen könnte.
 
 
Bei installierten perl-doc Paket kann dann die Doku dazu per
 
perldoc HTML::LinkExtractor  & perldoc HTML::LinkExtor eingesehen werden.
 
(siehe auch /usr/share/doc/libhtml-linkextractor-perl/README)
 
 
mfg. Hack-o-Master | 
         
        
          
          
            
          
             _________________ sidux2007-02 64Bit, Kernel 2.6.23rc..(Crypto-root), X.org 7.3, KDE 3.5.7
 
http://bernd-das-brot.de.be | Gästebuch ,  certified B.O.F.H.
            
  Zuletzt bearbeitet von Hack-o-Master am 10.11.2006, 16:17 Uhr, insgesamt ein Mal bearbeitet
           | 
         
         
	        |     | 
	       
       
     | 
  
  
    | 
      
      
     | 
  
  
      | 
  
  
    | 
      
     | 
    
      
        
					
            Titel:  
             Verfasst am: 10.11.2006, 16:15 Uhr
           | 
				 
       
     | 
  
  
    
      
        
          
             
            
  
            Anmeldung: 01. Nov 2006 
            Beiträge: 32 
             
            
            
           | 
         
       
     | 
    
      
        
          Mein bester Freund hatte so komplizierte Hausaufgaben.
 
 
Also alpha=40° und jetzt brauche ich a, muss aber mit dem Satz des Pythagoras gemacht werden  
 
 
Ja ne, schon klar. | 
         
        
          | 
          
            
          
            
            
           | 
         
         
	        |     | 
	       
       
     | 
  
  
    | 
      
      
     | 
  
  
      | 
  
  
    | 
      
     | 
    
      
        
					
            Titel: Re: HTML-Links via Perl auslesen? 
             Verfasst am: 10.11.2006, 18:04 Uhr
           | 
				 
       
     | 
  
  
    
      
        
          
             
             
  
            Anmeldung: 05. Jul 2006 
            Beiträge: 127 
             
            
            
           | 
         
       
     | 
    
      
        
          | 
 Dannyboy hat folgendes geschrieben:: 
Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren
 
 
 
dein freund muss dafür nicht perl können   
 
dieses hier für die console
 
 
Code: 
lynx -dump http://kanotix.com/index.html | sed '1,/^References/d' | grep http | awk '{print $NF}'
 
 
 | 
         
        
          | 
          
            
          
            
            
           | 
         
         
	        |     | 
	       
       
     | 
  
  
    | 
      
      
     | 
  
  
      | 
  
  
  
    | 
      
     |