Einen RSS Feed zu lesen, ist so einfach wie das Instanziieren eines
Zend_Feed_Rss
Objekts mit der URL eines Feeds:
$channel = new Zend_Feed_Rss('http://rss.example.com/channelName');
Wenn beim Abrufen des Feeds Fehler auftreten, wird eine
Zend_Feed_Exception
geworfen.
Sobald du ein Feed Objekt hast, kannst du auf jeden Channel-Eigenschaften eines Standard RSS Feeds direkt über das Objekt zugreifen:
echo $channel->title();
Beachte die Syntax der Funktion. Zend_Feed
verwendet die Konvention,
die Eigenschaften als XML Objekt zu behandeln, wenn sie durch die
"Getter" Syntax für Variablen ($obj->property) angefordert werden, und
als String zu behandeln, wenn sie durch die Methodensyntax
($obj->property()) angefordert werden. Dies ermöglicht den Zugriff auf
den kompletten Text jedes individuellen Knotens, während weiterhin der komplette Zugriff
auf alle Kindelemente erlaubt ist.
Wenn Channel-Eigenschaften Attribute beinhalten, sind diese durch die PHP Array Syntax ansprechbar:
echo $channel->category['domain'];
Da XML Attribute keine Kindelemente haben können, ist die Methodensyntax für den Zugriff auf Attributwerte nicht notwendig.
Meistens möchtest Du einen Feed durchlaufen und etwas mit seinen Einträgen machen.
Zend_Feed_Abstract
implementiert das Iterator
Interface von PHP, so dass die Ausgabe aller Artikelüberschriften eines
Channels nur dies erfordert:
foreach ($channel as $item) { echo $item->title() . "\n"; }
Wenn du mit RSS nicht vertraut bist, kommt hier eine Übersicht über die Standardelemente, die du in einem RSS Channel und in einzelnen RSS Elementen (Einträgen) als verfügbar erwarten kannst.
Erforderliche Elemente eines Channels:
-
title - Der Name des Channels
-
link - Die URL einer Website, die dem Channel entspricht
-
description - Ein oder mehr Sätze, die den Channel beschreiben
Allgemeine optionale Elemente eines Channels:
-
pubDate - Das Erscheinungsdatum dieses Informationssatzes, im RFC 822 Datumsformat
-
language - Die Sprache, in der dieser Channel verfasst ist
-
category - Eine oder mehrere Kategorien (durch mehrfache Tags spezifiziert), zu denen der Channel gehört
RSS <item> Elemente haben keine strikt erforderlichen Elemente. Dennoch müssen entweder title oder description vorhanden sein.
Allgemeine Elements eines Eintrags:
-
title - Die Überschrift des Eintrags
-
link - Die URL des Eintrags
-
description - Eine Zusammenfassung des Eintrags
-
author - Die E-Mail Adresse des Autoren
-
category - Eine oder mehrere Kategorien, zu denen der Eintrag gehört
-
comments - URL der Kommentare zu diesem Eintrag
-
pubDate - Das Datum, an dem der Eintrag veröffentlicht wurde, im RFC 822 Datumsformat
In deinem Code kannst du hiermit immer überprüfen, ob ein Element nicht leer ist:
if ($item->propname()) { // ... fahre fort. }
Wenn du stattdessen $item->propname verwendest, wirst du immer ein leeres
Objekt erhalten, das mit TRUE
evaluiert, so dass deine Prüfung
fehlschlagen würde.
Für weitere Informationen ist die offizielle RSS 2.0 Specification hier verfügbar: http://blogs.law.harvard.edu/tech/rss