Butterkoenig
Anmeldungsdatum: 6. Juli 2009
Beiträge: 41
Wohnort: Lauf a. d. Pegnitz
|
Liebes Forum, ich hätte gerne ein Bash-Skript, das mir täglich morgens früh um 6 Uhr meine regionale Tageszeitung herunterläd und auf meinem NAS speichert.
Ausführen soll es mein VU+-Linux Receiver, der die gängigen Programme curl, wget usw. versteht. Meine bisherige Suche hat irgendwie ergeben, dass ich mich mit curl auf der Website anmelden kann:
| curl --user Butterkoenig:Passwort http://www.zeitung.de/pdf -v
|
Ausgabe ist:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | * About to connect() to www.zeitung.de port 80 (#0)
* Trying xx.xx.xx.xx...
* connected
* Connected to www.zeitung.de (xx.xx.xx.xx) port 80 (#0)
* Server auth using Basic with user 'Butterkoenig'
> GET /pdf HTTP/1.1
> Authorization: Basic TXVlbGxlckxhdTpCZXJnc3RyYXNzZQ==
> User-Agent: curl/7.24.0 (mipsel-oe-linux-gnu) libcurl/7.24.0 GnuTLS/2.12.17 zlib/1.2.6
> Host: www.zeitung.de
> Accept: */*
>
* HTTP 1.0, assume close after body
< HTTP/1.0 301 Moved Permanently
< Date: Mon, 27 Jan 2014 17:11:47 GMT
< Content-Length: 0
< Location: http://e-paper.zeitung.de.de/ee/xx/pdf/
< X-Cache: MISS from accel2.nbi.de
< Connection: close
<
* Closing connection #0
|
Hat demnach das Login geklappt? Ich verstehe es schon so? Andererseits würde ich dann mit wget die PDF herunterladen. Die Links sind täglich bis auf das Datum gleich, würde ich demnach in dem Skript zusammensetzen, außer man kann auch Link Adressen von der Seite herunterladen?
Wenn ich jetzt allerdings
| wget 'http://e-paper.zeitung.de/ee/xx/pdf/?page=download_full&device=pdf&expiry=443B3978&date=20140127&edition=7&token=&edna
me=Heimat%20Zeitung'
|
ausführe, läd er mir auch nur komisches Geschnipsel, weil er Fragezeichen/UND-Zeichen irgendwie in dem String nicht mag. Hat jemand eine Idee, wie ich das Bewerkstelligen kann, dass ich täglich morgens zum Frühstück meine Zeitung als PDF habe ☺ Ich habe die Webadressen mal unkenntlich gemacht - falls sich jemand die Loginseite ansehen möchte, kriegt er per PN gerne den Link Herzliche Grüße
|
track
Anmeldungsdatum: 26. Juni 2008
Beiträge: 7174
Wohnort: Wolfen (S-A)
|
Normalerweise müsste der Download mit curl ja so schon klappen: curl --user Butterkoenig:Passwort http://www.zeitung.de/pdf -v > meinezeitung.pdf allerdings scheint er irgendetwas bei Deiner Adresse nicht zu mögen: < Content-Length: 0
< Location: http://e-paper.zeitung.de.de/ee/xx/pdf/
(Zeilen 15 und 16) Wie läuft der Download denn im normalen Browser ab ? - bekommst Du da sofort nach dem einloggen den Pdf, oder musst Du da noch irgendwo drauf klicken ? (wenn ja: wo drauf ? → Linkadresse) LG, track
|
redknight
Moderator & Supporter
Anmeldungsdatum: 30. Oktober 2008
Beiträge: 21736
Wohnort: Lorchhausen im schönen Rheingau
|
301 - Moved Permanently ist schon relativ deutlich 😉 Location: http://e-paper.zeitung.de.de/ee/xx/pdf/ sollte das Ziel sein
|
Butterkoenig
(Themenstarter)
Anmeldungsdatum: 6. Juli 2009
Beiträge: 41
Wohnort: Lauf a. d. Pegnitz
|
Guten Morgen, schon mal herzlichen Dank für eure Antworten. Ich glaub ich hab die Situation nicht so genau beschrieben. Hab's auch mal mit Bildern verdeutlicht. Zuerst komm ich auf die Login Page (in der Tat hat der Link nicht gestimmt, der wird auf eine andere Adresse übersetzt), wo ich nur Benutzername und Passwort eingeben muss. Anschließend komm ich auf die Tagesübersicht, in der die jeweiligen Tagesausgaben einen eindeutigen Link haben wie zum Beispiel
| http://e-paper.zeitung.de/ee/xx/pdf/?page=download_full&device=pdf&expiry=443B3978&date=20140127&edition=7&token=&edna
me=Heimat%20Zeitung
|
Vielleicht hat auch jemand eine ganz andere Idee? Viele Grüße & einen schönen Tag!
- Bilder
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12832
|
Komisch ist, dass Du anscheinen keinen Session-Cookie bekommst. Von daher würde ich vermuten, dass der Login nicht geklappt hat. Ich sehe auch auf http://www.zeitung.de/ nichts, wo man sich einloggen kann. Wie funktioniert denn der Zugang, wenn Du es mit dem Browser machst? Ciao robert
|
Butterkoenig
(Themenstarter)
Anmeldungsdatum: 6. Juli 2009
Beiträge: 41
Wohnort: Lauf a. d. Pegnitz
|
rklm schrieb: Ich sehe auch auf http://www.zeitung.de/ nichts, wo man sich einloggen kann. Wie funktioniert denn der Zugang, wenn Du es mit dem Browser machst?
Ich habe das nur in www.zeitung.de abgeändert, das ist nicht die Originaladresse. Die richtige Adresse bekommst du per PN von mir! rklm schrieb: Wie funktioniert denn der Zugang, wenn Du es mit dem Browser machst?
Das siehst du in den beiden Screenshots die ich angehängt habe, es geht nämlich nicht über ein Popup-Fenster Viele Grüße
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12832
|
Butterkoenig schrieb: rklm schrieb: Ich sehe auch auf http://www.zeitung.de/ nichts, wo man sich einloggen kann. Wie funktioniert denn der Zugang, wenn Du es mit dem Browser machst?
Ich habe das nur in www.zeitung.de abgeändert, das ist nicht die Originaladresse. Die richtige Adresse bekommst du per PN von mir!
Siehe PN. Ansonsten kannst Du so etwas auch mit Ruby und Mechanize machen. Da hast Du dann gleich einen passenden HTML-Parser dabei etc. Ciao robert
|
Butterkoenig
(Themenstarter)
Anmeldungsdatum: 6. Juli 2009
Beiträge: 41
Wohnort: Lauf a. d. Pegnitz
|
So, dank der Hilfe von Robert fehlt jetzt nur noch der finale Schritt mit dem Download ☺ Bis jetzt sieht es so aus
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 | #!/bin/sh
set -e
dir="/tmp/${USER}"
#mkdir "$dir"
cookies="${dir}/${0##*/}-$$"
trap 'rm -f "$cookies"' 0
expire=$(curl -s -c "$cookies" 'http://e-paper.XXX.de/ee/xx/pdf/?pSetup=nn2&page=downloadPdf&device=pdf' | sed -ne 's#^.*expiry=\([^"&]*\).*$#\1#p')
# now login
curl -s -b "$cookies" -F 'username=XXX' -F 'password=XXX' "http://e-paper.XXX.de/ee/xx/pdf/?page=downloadPdf&device=pdf&expiry=${expire}"
echo $expire # nur als test...
# download
curl -s -b "$cookies" "http://e-paper.XXX.de/ee/xx/pdf/?page=download_full&device=pdf&expiry=${expire}4&date=20140128&edition=7&token=&edname=XXX%20Zeitung" >tageszeitung.pdf
|
Bis einschließlich des Logins funktioniert es - siehe der Ausgabe. Das ist dann normalerweise die Seite im Browser, wo man auf den jeweiligen Tag klickt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41 | <body>
<div class="wrapper">
<p class="p-wrapper">
<a class="logout" href="?page=logout&device=pdf" >Log out</a>
<a class="backnew" href="?expiry=443C8B8F">Zur�ck</a>
</p>
<h1>XXX Zeitung</h1>
<h3>Ausgaben im PDF-Format</h3>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140128&token= ">Dienstag, 28 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140127&token= ">Montag, 27 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140125&token= ">Samstag, 25 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140124&token= ">Freitag, 24 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140123&token= ">Donnerstag, 23 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140122&token= ">Mittwoch, 22 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140121&token= ">Dienstag, 21 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140120&token= ">Montag, 20 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140118&token= ">Samstag, 18 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140117&token= ">Freitag, 17 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140116&token= ">Donnerstag, 16 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140115&token= ">Mittwoch, 15 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140114&token= ">Dienstag, 14 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140113&token= ">Montag, 13 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140111&token= ">Samstag, 11 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140110&token= ">Freitag, 10 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140109&token= ">Donnerstag, 9 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140108&token= ">Mittwoch, 8 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140106&token= ">Montag, 6 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140104&token= ">Samstag, 4 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140103&token= ">Freitag, 3 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20140102&token= ">Donnerstag, 2 Januar 2014</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20131231&token= ">Dienstag, 31 Dezember 2013</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20131230&token= ">Montag, 30 Dezember 2013</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20131228&token= ">Samstag, 28 Dezember 2013</a></p>
<p class="link"><a href="?page=selectEditionPdf&device=pdf&expiry=443C8B8F&date=20131227&token= ">Freitag, 27 Dezember 2013</a></p>
<p class="p-wrapper">
<a class="logout" href="page=logout&device=pdf" >Log out</a>
<a class="backnew" href="?expiry=443C8B8F">Zur�ck</a>
</p>
</div>
</body>
</html>
|
Sobald aber die letzte Zeile des Skripts ausgeführt wird ist er anscheinend nicht mehr eingeloggt - bzw. es wird as "novalidate action" bezeichnet, siehe
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39 | <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta name="HandheldFriendly" content="True" />
<meta name="viewport" content="width=device-width, initial-scale=1.0" />
<title>Bitte melden Sie sich an</title>
<style type="text/css">@import "/eebrowser/frame/develop.6525.marco/ebook/web_pages/otherStyle.css";</style>
</head>
<body>
<form method="POST" novalidate action="?page=download_full&device=pdf&expiry=443C8CE44&date=20140128&edition=7&token=&edname=XXX%20Zeitung">
<div class="wrapper">
<h3>E-Reader Versionen</h3>
<table>
<tr>
<td>Benutzername</td>
<td><input type="email" autocorrect="off" autocapitalize="off" name="username" value=""></td>
</tr>
<tr>
<td>Passwort</td>
<td><input type="password" name="password" value=""></td>
</tr>
<tr>
<td> </td>
<td><input type="submit" value="Log-in"></td>
</tr>
</table>
</div>
<input type="hidden" name="pSetup" value="nn2" />
<input type="hidden" name="time" value="1390927149" />
<input type="hidden" name="token" value="" />
<input type="hidden" name="challenge" value="c39b24b27ba8f23a461ad94c7618005a" />
<input type="hidden" name="protError" value="4" />
</form>
</body>
</html>
|
Muss ich noch etwas beachten, weil der Link ja schließlich auch nicht direkt auf die pdf zeigt, sondern nochmal umgelenkt wird? Viele Grüße
Dominik
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12832
|
Butterkoenig schrieb:
Bis jetzt sieht es so aus
| #!/bin/sh
set -e
dir="/tmp/${USER}"
#mkdir "$dir"
|
Sorry, die Zeile sollte so aussehen:
Dann sollte es an der Stelle auch keine Fehler mehr geben.
Bis einschließlich des Logins funktioniert es - siehe der Ausgabe.
Welche Ausgabe meinst Du genau?
Das ist dann normalerweise die Seite im Browser, wo man auf den jeweiligen Tag klickt
Bekommst Du diese Seite denn mit curl ?
Sobald aber die letzte Zeile des Skripts ausgeführt wird ist er anscheinend nicht mehr eingeloggt - bzw. es wird as "novalidate action" bezeichnet, siehe
Nein, das ist keine "novalidate action". Das ist ein leeres Attribut "novalidate" (siehe hier) und ein Attribute "action", das die URL angibt, die beim Submit gesendet wird.
| <input type="hidden" name="pSetup" value="nn2" />
<input type="hidden" name="time" value="1390927149" />
<input type="hidden" name="token" value="" />
<input type="hidden" name="challenge" value="c39b24b27ba8f23a461ad94c7618005a" />
<input type="hidden" name="protError" value="4" />
</form>
</body>
</html>
|
Muss ich noch etwas beachten, weil der Link ja schließlich auch nicht direkt auf die pdf zeigt, sondern nochmal umgelenkt wird?
Möglicherweise muss man beim Login die verstecken Felder noch füllen. Die sind mir vorher nicht aufgefallen. Ciao robert
|
Butterkoenig
(Themenstarter)
Anmeldungsdatum: 6. Juli 2009
Beiträge: 41
Wohnort: Lauf a. d. Pegnitz
|
Hab's geschafft ☺ Google hat mir geholfen - das Stichwort "action" war's! 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | #!/bin/sh
# Init
set -e
dir="/tmp/${USER}"
mkdir -p "$dir"
cookies="${dir}/${0##*/}-$$"
trap 'rm -f "$cookies"' 0 # anschließend cookies löschen
# "expire"-String extrahieren
expire=$(curl -s -c "$cookies" 'http://e-paper.XXX.de/ee/xx/pdf/?pSetup=nn2&page=downloadPdf&device=pdf' | sed -ne 's#^.*expiry=\([^"&]*\).*$#\1#p')
# Login
curl -s -k --cookie-jar $cookies --cookie $cookies -A "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; en-US; rv:1.9.1) Gecko/20090624 Firefox/3.5" -F 'username=xxx' -F 'password=xxx' \
"http://e-paper.XXX.de/ee/xx/pdf/?page=downloadPdf&device=pdf&expiry=${expire}"
# Download
datum=$(date +%Y%m%d)
curl -s -k --cookie-jar $cookies --cookie $cookies -A "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; en-US; rv:1.9.1) Gecko/20090624 Firefox/3.5" \
"http://e-paper.XXX.de/ee/xx/pdf/?page=download_full&device=pdf&expiry=${expire}4&date=${datum}&edition=7&token=&edname=XXX%20Zeitung" > ${dir}XXX-Zeitung_${datum}.pdf
|
Herzliche Grüße & vielen Dank!!
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12832
|
Butterkoenig schrieb: Hab's geschafft ☺ Google hat mir geholfen - das Stichwort "action" war's!
Fein! Ah, ja, ich hatte die Option zum Lesen der Cookies vergessen. Du solltest aber trotzdem die Variable $cookies richtig quoten. Das ist robuster. Und wo Du so viele Optionen mitgeben musst, bietet es sich an, das in einer Shell-Funktion zu verpacken. Das ist dann modularer. 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26 | #!/bin/sh
# Init
set -e
dir="/tmp/${USER}"
mkdir -p "$dir"
cookies="${dir}/${0##*/}-$$"
echo '' >|"$cookies" # create or truncate cookie file
trap 'rm -f "$cookies"' 0 # anschließend cookies löschen
# functions
crl() {
curl -s -k --cookie "$cookies" --cookie-jar "$cookies" \
-A 'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; en-US; rv:1.9.1) Gecko/20090624 Firefox/3.5' "$@"
}
# "expire"-String extrahieren
expire=$(crl 'http://e-paper.XXX.de/ee/xx/pdf/?pSetup=nn2&page=downloadPdf&device=pdf' | sed -ne 's#^.*expiry=\([^"&]*\).*$#\1#p')
# Login
crl -F 'username=xxx' -F 'password=xxx' \
"http://e-paper.XXX.de/ee/xx/pdf/?page=downloadPdf&device=pdf&expiry=${expire}"
# Download
datum=$(date '+%Y%m%d')
crl "http://e-paper.XXX.de/ee/xx/pdf/?page=download_full&device=pdf&expiry=${expire}4&date=${datum}&edition=7&token=&edname=XXX%20Zeitung" > "${dir}XXX-Zeitung_${datum}.pdf"
|
Ciao robert
|
hekates_hammer
Anmeldungsdatum: 20. November 2008
Beiträge: Zähle...
Wohnort: Düsseldorf
|
Hallo,
der Thread ist zwar schon etwas älter, aber Tageszeitungen gibt es ja immer noch. Daher möchte ich ein ein kleines Script zur Verfügung stellen, mit dem man eine bekannte, konfessionell angehauchte, rheinische Tageszeitung per shell als PDF herunterladen kann. Das kannst Du dann auf Dein NAS packen und als Dienst einrichten. Dann kommt der elektronische Zeitungsbote ohne sämtliches Zutun.
Damit das Script läuft, bitte vorher noch mit | sudo apt-get install html-xml-utils
|
hxnormalize und hxselect installieren. 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77 | #!/bin/sh
# Init
set -e
dir="/tmp/${USER}"
mkdir -p "$dir"
cookies="${dir}/${0##*/}-$$"
echo '' >|"$cookies" # create or truncate cookie file
trap 'rm -f "$cookies"' 0 # anschließend cookies löschen
datum=$(date '+%Y%m%d')
ePaper_pdf_file="rp_online_${datum}.pdf"
# wenn ePaper schon auf der Platte liegt, einfach mit evince oeffnen
if [ -e $ePaper_pdf_file ]
then
aplay epaper.wav
evince -f $ePaper_pdf_file
else
echo "Hallo! Dein Zeitungsbote ist unterwegs ..."
# functions
crl() {
curl -s -k --cookie cookies.txt --cookie-jar cookies.txt \
-A 'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.5; en-US; rv:1.9.1) Gecko/20090624 Firefox/3.5' "$@"
}
# "expire"-String extrahieren
expire=$(crl "http://epaper.rp-online.de/digiPaper/servlet/authentificateformservlet" | sed -ne 's#^.*expiry=\([^"&]*\).*$#\1#p')
# Login
crl -F 'user=DEIN_USERNAME' -F 'password=DEIN_PASSWORT' \
"http://epaper.rp-online.de/digiPaper/servlet/authentificatewithjaasservlet?user=DEIN_USERNAME&password=DEIN_PASSWORT&submit.x=54&submit.y=12&constructframeset=false" > "authentificatewithjaasservlet.htm"
# Seite herunterladen auf der die aktuelle AusgabeNr zu finden ist
crl -F 'user=DEIN_USERNAME' -F 'password=DEIN_PASSWORT' \
"http://epaper.rp-online.de/digiPaper/servlet/idstoreservlet?synchronize=true&urlforward=selectpageservlet?publisher=0&object=0&release=0&autoselect=true" > "selectpageservlet.htm"
# AusgabeNr extrahieren
releaseNo=$(hxnormalize -xed selectpageservlet.htm | hxselect -s '\n' 'input' | sed "s/.* value=\"\(.*\)\".*/\1"/ |sed "s/.*setRelease(\(.*\)[^0-9]/\1"/ |tr "," "\n" | sed -n '3 p')
wait;
echo "Bereite den Download der Ausgabe $releaseNo vor. Noch ein wenig Geduld, bitte!"
# download PDF generating website no2
crl -F 'user=DEIN_USERNAME' -F 'password=DEIN_PASSWORT' \
"http://epaper.rp-online.de/digiPaper/servlet/pdfwizardservlet?release=$releaseNo" > "pdfwizardservlet.htm"
# generate URL
#alle pdfseiten
hxnormalize -xed pdfwizardservlet.htm | hxselect -s '\n' 'input' |sed "s/.* value=\"\(.*\)\".*/\1"/ |sed -n '/submit/,/submit/p'| sed -re '/^[^0-9]/d' | sed -e 's/../pdfpage=&/' >all_pdfpages.txt
wait;
#alle resorts
hxnormalize -xed pdfwizardservlet.htm | hxselect -s '\n' 'input' |sed "s/.* value=\"\(.*\)\".*/\1"/ |sed -n '/^[^0-9]/,/submit/p' |sed -re '/^[^0-9]/d'|sed -e 's/../chkRessort=&/'|sed 's/, /%2C+/g' |sed 's/ //g' >all_resorts.txt
wait;
curl_url=$(cat all_resorts.txt all_pdfpages.txt |tr "\n" "&" | sed 's/, /%2C+/g' |sed 's/ //g')
wait;
# nur zu Testzwecken einschalten
# echo $curl_url
# Download
echo "Lade die aktuelle Ausgabe von heute herunter. Das kann etwas dauern."
crl "http://epaper.rp-online.de/digiPaper/servlet/pdfservlet.pdf?filename=digiPaper.pdf&chkAllPages=on&+$curl_url" > "$ePaper_pdf_file"
echo "Epaper heruntergeladen. Öffne zum lesen ..."
# clean up
rm "authentificatewithjaasservlet.htm"
rm "selectpageservlet.htm"
rm "pdfwizardservlet.htm"
rm "cookies.txt"
rm "all_pdfpages.txt"
rm "all_resorts.txt"
# aplay epaper.wav
evince -f $ePaper_pdf_file
fi
|
Wie man sieht, sollte man im selben Verzeichnis eine Datei namens "epaper.wav" anlegen. Der Inhalt dieser Audiodatei wird dann abgespielt, z.B. "Schatz, die Zeitung ist da!". Direkt im Anschluss öffnet Evince die PDF-Datei zum Lesen. Das sollte man in der NAS-Version natürlich abschalten. Die Zugangsdaten (alle Vorkommen von "DEIN_USERNAME" und "DEIN_PASSWORT" müssen natürlich dementsprechend angepasst werden.
|