ubuntuusers.de

Mit Curl und Bildvorschau zu Captcha-geschützer Seite

Status: Gelöst | Ubuntu-Version: Nicht spezifiziert
Antworten |

Xell

Avatar von Xell

Anmeldungsdatum:
17. Oktober 2005

Beiträge: 360

N'abend allerseits!

Folgendes: jDownloader ist zwar gut und schön, aber leider in igittigitt-java. Eine rudimentäre Alternative zu scripten wäre wohl nicht allzu schwierig, bis auf einen Punkt: Die Rapidshare-Links auf der Seite serienjunkies.org sind Captcha-geschützt. Die relevante Teil der Source sieht nun immer so aus:

<FORM ACTION="/12345foobar54321/name_der_seite.html" METHOD="post" NAME="INPF" ID="postit" STYLE="display:inline;">
<INPUT TYPE="HIDDEN" NAME="s" VALUE="2f31c92e18b7c780b3ef7f20da8da484">
<TABLE BORDER="0" CELLSPACING="0" CELLPADDING="5">
     <TR>
          <TD VALIGN="TOP" id="cwid"><div title="Seite neu laden / Reload" onClick="window.location.reload()" id="preload" href="#"></div></TD>
          <TD><IMG SRC="/secure/c4f735b7f94a373754aaa06c2925f47b.png" WIDTH="100" HEIGHT="60" ALT="" style="border:1px solid #ccc;"></TD>
          <TD><INPUT TYPE="TEXT" CLASS="TEXT" MAXLENGTH="3" SIZE="3" NAME="c" ID="CINPUT" VALUE=""></TD>
          <TD><INPUT TYPE="SUBMIT" CLASS="BUTTON" NAME="action" VALUE="Download"></TD>

     </TR>
</TABLE>

Diesen Text kriege ich auch mit curl, und ich kann mir z.B. mit Feh das Captcha, in diesem Fall http ://serienjunkies.org/secure/c4f735b7f94a373754aaa06c2925f47b.png, anzeigen Lassen. Die Variable s (2f31c92e18b7c780b3ef7f20da8da484) wird wohl so etwas wie ein session-String sein, damit der Server die Anfragen zuordnen kann. Aber wenn ich nun, angenommen das Captcha ist 6FD , folgendes mache:

curl "http://download.serienjunkies.org/12345foobar54321/name_der_seite.html" -d "c=6FD&s=2f31c92e18b7c780b3ef7f20da8da484"

Dann ist die Antwortseite genauso wie vorher - immer noch nicht die Links, an die in rankommen will.

Hat jemand eine Idee dazu?

Xell

Xell

(Themenstarter)
Avatar von Xell

Anmeldungsdatum:
17. Oktober 2005

Beiträge: 360

Nachtrag: Es geht! Warum weiß ich nicht, habe das ganze in Python gescriptet und - Zack!

schmie

Anmeldungsdatum:
2. Oktober 2007

Beiträge: 52

Wohnort: Losheim Am See, Deutschland

Hi, klingt interessant, poste doch mal Deine Source in Python. Wie machst Du Reconnects?

Viele Grüße,Schmiddi

Xell

(Themenstarter)
Avatar von Xell

Anmeldungsdatum:
17. Oktober 2005

Beiträge: 360

Klar, gerne. Es ist noch nichts Großes, und der Aktionsradius beschränkt sich auf: du gibts einen Link von serienjunkies.org an, das Programm zeigt dir das Captcha, du gibst es ein und das Programm spuckt dir alle zugehörigen Downloadlinks aus. Ist ziemlich wild gescriptet und urspünglich wollte ich mehr draus machen, bis ich gemerkt habe dass das ganze ein Rattenschwanz von Problemen nach sich zieht, und das verm. ein ganz schön großes Programm wäre. Obwohl ein konsolen-downloader für 1-click-hoster nicht zu verachten wäre.

http://paste.ubuntuusers.de/396658/

alternativdenker

Anmeldungsdatum:
1. Juni 2009

Beiträge: 45

Sowas in Perl (wg. WWW::Mechanize) und in schön wäre schon ziemlich toll!

Gute Idee. *notier*

Xell

(Themenstarter)
Avatar von Xell

Anmeldungsdatum:
17. Oktober 2005

Beiträge: 360

In Perl gibts ja auch schon tuxload ☺ aber mir geht's ja auch eher um diese nervigen Linkseiten, und tuxload frisst nur direkte links soviel ich weiß.

alternativdenker

Anmeldungsdatum:
1. Juni 2009

Beiträge: 45

Man könnte ja ein Plugin dafür schreiben... 😮

PC-Freak

Anmeldungsdatum:
30. November 2005

Beiträge: 5

Hab genau den gleichen Ansatz verfolgt wie der Threadersteller und bin aufs gleiche Problem gestoßen, bis ich jetzt endlich die Lösung gefunden habe:

1
2
3
4
5
s='s='
c='&c='
action='&action=Download'
postdata=${s}${hiddeninput}${c}${captcha}${action}
curl -o downloadseite.txt $captchaseiteurl -d $postdata 

vorher hatte ich statt der variable $postdata strings und variablen vermischt, womit die shell nicht umgehen konnte :S

Antworten |