ubuntuusers.de

Für diese Funktion musst du eingeloggt sein.

Probleme mit wget

Status: Ungelöst | Ubuntu-Version: Ubuntu 10.04 (Lucid Lynx)
Antworten |

-Mischka-

Anmeldungsdatum:
12. August 2006

Beiträge: 39

Wohnort: Dortmund

Hi, ich möchte gerne eine Web-Seite downloaden. Aber die ist mit Ajax gebaut. Wie kriege ich wget dazu, dass er die Skripte, ausführt, und dann den Quelltext runterlädt. Wenn ich in Firefox auf "Seitenquelltext anzeigen" klicke, sind die DIV-Container gefüllt, aber wenn ich dieselbe Datei per wget download, sind die DIV-Container alle leer.

Dicker1

Avatar von Dicker1

Anmeldungsdatum:
24. September 2008

Beiträge: 1708

Wohnort: /home

http://www.tutorials.de/php/252100-wget-downloadscript.html
http://linuxreviews.org/quicktips/wget/
http://bytes.com/topic/javascript/answers/543880-how-execute-linux-command-wget-within-javascript-code

Soo dan hab ich gefunden hoffentlich ist was dabei das dir hilft. Leider bin ich dem englischen nicht soo mächtig um es dir einzugrenzen ☹

FaulFels

Avatar von FaulFels

Anmeldungsdatum:
15. August 2006

Beiträge: Zähle...

Wohnort: Köln

Hallo -Mischka-,

hast du dir schonmal WebHTTrack angeschaut?

Damit könnte dein Vorhaben evtl. klappen.

Gruß,

FaulFels

dominator

Avatar von dominator

Anmeldungsdatum:
18. März 2008

Beiträge: 90

Wohnort: Meistens im Bierparadies Oberfranken

-Mischka- schrieb:

Hi, ich möchte gerne eine Web-Seite downloaden. Aber die ist mit Ajax gebaut. Wie kriege ich wget dazu, dass er die Skripte, ausführt, und dann den Quelltext runterlädt. Wenn ich in Firefox auf "Seitenquelltext anzeigen" klicke, sind die DIV-Container gefüllt, aber wenn ich dieselbe Datei per wget download, sind die DIV-Container alle leer.

Naja evtl wertet die Seite ja den Browser-Typ aus. Dann würde die Option

wget -U "Firefox 3.6.3" .......

helfen 😎

-Mischka-

(Themenstarter)

Anmeldungsdatum:
12. August 2006

Beiträge: 39

Wohnort: Dortmund

Den Browsertyp gebe ich mit an. Das Ding ist, dass ich nur den Quellcode, nicht die ganzen Quelldateien brauche. Httrack läd viel zu viel runter... So viel brauch ich gar nicht. Bsp: Auf der Seite steht:

<html>
<head>
<title>Ich bin der Titel</title>
</head>
<body>
<img src="pfad zu einem Bild" />
<div id="inhalt">
<script language="text/javascript">
document.getElementById('inhalt').innerHTML = http://www.google.de;
</script>
</body>
</html>

Dann möchte ich den aktuellen Quellcode unterladen, also z.B.:

<html>
<head>
<title>Ich bin der Titel</title>
</head>
<body>
<img src="pfad zu einem Bild" />
<div id="inhalt">
Hier kein Javascript, sondern der google-Quellcode...
</body>
</html>

Ich will nicht die ganzen Quelldateien, wie z.B. das Bild selbst runtergeladen haben!

Hello_World

Anmeldungsdatum:
13. Juni 2006

Beiträge: 3620

Mit wget geht das nicht, da dazu eben der vorhandene JavaScript-Code interpretiert werden muss, und wget hat keinen Interpreter dafür.

-Mischka-

(Themenstarter)

Anmeldungsdatum:
12. August 2006

Beiträge: 39

Wohnort: Dortmund

gut, kenn jemand ein Konsolenprogramm, dass einen Link interpretiert, und mir das Ergebnis schickt? Dieses Programm sollte tunlichst auch in der Lage sein, sich als Firefox auszugeben.

Antworten |