Eine kurze technische Frage: Sollte ich das mit mechanize hinkriegen, lädt mechanize dann mit voller Bandbreite? Nutzt es meine gesamte Kapazität?
Wie lade ich die Internetseite/archiv imslp.org komplett herunter?
(Themenstarter)
Anmeldungsdatum: Beiträge: Zähle... |
|
Anmeldungsdatum: Beiträge: 11179 Wohnort: München |
Mechanize bzw. Python arbeitet nicht selbstständig, sondern du musst definieren, wann es welche Aktionen durchführen soll (daher nennt man das eine Programmiersprache). Ein möglicher Ansatz um an die Noten eines bestimmten Komponisten zu kommen wäre als erstes die Kategorie zu ermitteln, die für ihn erstellt wurde, dann kannst du dir die Seiten für die Kategorie holen und dann die Seiten auf Links für PDF-Dateien untersuchen, den Links bis zur PDF-Datei zu folgen und sie herunterladen und als Datei abspeichern. Die API-Beschreibung für solche Abfragen (https://www.mediawiki.org/wiki/API:Lists) liefert dem interessierten Leser die nötigen Parameter und dann muss man sich halt noch einen Algorithmus überlegen, der das automatisiert abarbeiten kann. |