ilch Forum » Allgemein » HTML, PHP, SQL,... » sitecrawling

Geschlossen
  1. #1
    User Pic
    sinan Mitglied
    Registriert seit
    28.10.2007
    Beiträge
    85
    Beitragswertungen
    0 Beitragspunkte
    hallo forum,

    ich möchte den inhalt einer seite crawlen und kämpfe da gerade mit den üblichen preg_match() tücken. der ungefähre aufbau der seite ist folgender.

    <!-- obiger html inhalt erstmal uninteressant -->
    
    <article>
             <h3><a href="#">Titel will ich haben</a></h3>
    		         <p>
                     inhalt zwischen den "<p>" tags will ich auch haben
                 </p>
    </article>
    
    <!-- unterer html inhalt erstmal uninteressant -->


    das article-tag wiederholt sich jetzt noch öfter. die genaue anzahl der <article> tags ist unbekannt.

    wie komme ich jetzt am besten an den für mich interessanten inhalt heran?

    ich würde mich über ein paar denkanstöße freuen,

    liebste ostergrüße
    0 Mitglieder finden den Beitrag gut.
  2. #2
    User Pic
    Jan Hall Of Fame
    Registriert seit
    17.01.2007
    Beiträge
    3.646
    Beitragswertungen
    54 Beitragspunkte
    ZitatZitat geschrieben von sinan
    wie komme ich jetzt am besten an den für mich interessanten inhalt heran?
    Uns mitteilen welche Inhalte denn für dich interessant sind wäre ein guter Anfang! zwinker

    Willst du nur das Erste/Letzte article-tag, oder sollen die Inhalte aller article-tags in ein Array geschrieben werden?
    0 Mitglieder finden den Beitrag gut.
  3. #3
    User Pic
    sinan Mitglied
    Registriert seit
    28.10.2007
    Beiträge
    85
    Beitragswertungen
    0 Beitragspunkte
    ich will den inhalt des <h3> haben und was zwischen dem <p> steht für alle <article> tags!
    0 Mitglieder finden den Beitrag gut.
  4. #4
    User Pic
    Jan Hall Of Fame
    Registriert seit
    17.01.2007
    Beiträge
    3.646
    Beitragswertungen
    54 Beitragspunkte
    ups, ganz vergessen zu antworten..
    Das sollte mit der Funktion preg_match_all funktionieren..

    Sorry, hab da gerade keinen Bock drauf. zwinker

    Solltest du es alleine nicht hinbekommen, dann poste mal deinen Versuch - ich schaue die Tage nochmal vorbei.

    Liebe Grüße
    Jan
    0 Mitglieder finden den Beitrag gut.
Geschlossen

Zurück zu HTML, PHP, SQL,...

Optionen: Bei einer Antwort zu diesem Thema eine eMail erhalten