Wikipedia XML Dump parsen

markus_1

Angesehenes Mitglied
Ich habe mir den XML Dump von Wikipedia besorgt und möchte jetzt aus dem kompletten File (fast 2 GB) nur einige Seiten extrahieren.

Ideal wäre es, wenn ich die Seiten relativ einfach nach Thema auswählen könnte und dann entweder in Wikimedia importiere oder direkt html-Seiten daraus machen kann.

Bitte um Praxis-Tipps, wie das am besten geht!

DANKE!

Markus
 
Zurück
Oben