ubuntuusers.de

mailadressen aus Webseiten sammeln

Status: Gelöst | Ubuntu-Version: Ubuntu 10.04 (Lucid Lynx)
Antworten |

joe.schraube

Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

Ich bin kein Spamer auch bei guten und Idealistische Dingen kann mal der Wunsch entstehen ein paar hundert mailadressen aus dem Netz fischen zu wollen.

Wie kann man so was anstellen ? Gibt es ein Prog was nützlich ist ?

Meine Überlegungen sind : einen roboter wie sie googel oder die " Bösen " Spamer benutzen bekomme ich nicht. (http://de.wikipedia.org/wiki/Webcrawler)

Ich könnte ein Prog eine Liste von URLs hinwerfen und sagen schreibe den Htmlcode in eine Liste und filtere anschließend alles mit bla@bla.de raus.

weniger automatisiert : ich hab ein Prog das es mir per rechtsklick erlaubt mailadressen zu speichern ohne das ich jedesmal Strg C und Strg V drücken muß.

Kann man in den Arbeitsspeicher hinzufügen ohne zu überschreiben ? mit einer Tastenkombie einem kleinem Programm ?

tahr09

Anmeldungsdatum:
5. Januar 2011

Beiträge: 946

Ich bin kein Spamer auch bei guten und Idealistische Dingen kann mal der Wunsch entstehen ein paar hundert mailadressen aus dem Netz fischen zu wollen.

Naja..Wenn nicht Spam, was willst du dann mit 100en von E-Mail Adressen von fremden Personen?

Wie kann man so was anstellen ? Gibt es ein Prog was nützlich ist ?

Wie du schon selbst erkannt hast:

Ich könnte ein Prog eine Liste von URLs hinwerfen und sagen schreibe den Htmlcode in eine Liste und filtere anschließend alles mit bla@bla.de raus.

Du könntest hierfür ein kleines Script schreiben, sofern du ein wenig Bash-Kenntnisse hast.

Das gehört dann aber eher nach Shell und Programmieren, wobei ich bezweifle, dass dir jemand hilft ein solches Programm zu schreiben.

lg

joe.schraube

(Themenstarter)
Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

hab eben noch etwas herumtelefoniert und erfahren dass ich sogar jemanden in der Bekanntschaft habe der u.a. damit sein Geld verdient. Ein Datensatz kostet zwischen 0,20 und 0,50 Cent und damit bin ich als nicht komerzielles Projekt schon mal raus.

Ich will eine Platform anbieten auf der Handwerker nicht zahlende Kunden indizieren können. Ich bin seit 10 Jahren selbständiger Handwerker und habe schon etliche Prozesse führen müssen wegen Leuten die aus Prinzip nicht zahlen oder nach Monaten 70% anbieten. Oft Firmen die sich eine Anwalt festangestellt haben und die das generell so durchzihen. Der erste Impuls ist oft : Einen in die Fresse ..... doch das wird teuer. Jetzt geht der Frust über solche Arschlöcher in Produktive Kanäle und füllt meine Abende. Die Fa XXXXXX z.B: schulde mir noch 17.000 € die ich nicht schaffe einzuklagen, juristische Tricks, Täuschung, Lügen. Das die Fa XXXXXX überhaupt noch Freiberufliche Solarbauer bekommt liegt daran, dass die nicht wissen das XXXXXX schon über 100.000€ an Subunternehmer nicht gezahlt hat. Dieses Nichtwissen ist nicht mehr Zeitgemäß.

Begründung warum ich zu den Guten gehöre ENDE

<<<<<<<<

jener Bekannter hat mir iMacros for Firefox genannt als einfache hilfe das schaue ich mir jetzt an.

Moderiert von MarkusH.:

Firmennamen und Informationen, die eine genauere Eingrenzung des Geschäftsführers liefern, entfernt.

apollo13 Team-Icon

mondrakete
Avatar von apollo13

Anmeldungsdatum:
29. August 2005

Beiträge: 1521

joe.schraube schrieb:

Die Fa XXXXXXXX z.B: schulde mir noch 17.000 € die ich nicht schaffe einzuklagen, juristische Tricks, Täuschung, Lügen. Das die Fa XXXXXXXX überhaupt noch Freiberufliche Solarbauer bekommt liegt daran, dass die nicht wissen das XXXXXXXX schon über 100.000€ an Subunternehmer nicht gezahlt hat. Dieses Nichtwissen ist nicht mehr Zeitgemäß.

Dir ist klar, dass du dieser Firma damit direkt und öffentlich Täuschung vorwirfst und du dafür schnell ne Klage kassieren kannst?

EDIT:// Erklärt btw trotzdem noch nicht was du mit den Adressen machen willst…

Moderiert von MarkusH.:

Informationen, die eine genauere Eingrenzung des Geschäftsführers liefern, entfernt.

joe.schraube

(Themenstarter)
Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

ja klar diese Fragen sind ja kerngeschäft der Seite. XXXXXX hätte nach Presserecht was für das Netz greift jetzt das recht einer gegendartellung wenn sie das möchten und könnten eine Unterlassungsklage gegen meine Aussagen ansträngen. Zuviel wirbel um ihre Geschäftspraxis ist ihnen aber auch nicht recht was das sehr unwahrscheinlich macht.

DA sie hier rein posten dürfen ist dem genüge getan

Bewertungsseiten entwickeln sich gerade schnell die juristische Klärung was wie gesagt werden darf entwickelt sich mit.

die Adressen sind Adressen an die ich eine Vorstellung der Seite senden will

Moderiert von MarkusH.:

Firmennamen entfernt.

Keba Team-Icon

Ehemalige
Avatar von Keba

Anmeldungsdatum:
24. Juli 2007

Beiträge: 3802

Hallo,

Du willst also im Prinzip an mehrere hundert Adressen „Falls du Handwerker bist, nicht bei Firma XY arbeiten!“ schicken? Bzw. von einer Seite schicken lassen? Oder verstehe ich den Plan dahinter falsch?

Grüße, Keba

joe.schraube

(Themenstarter)
Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

nein das würde ich spam nennen, zerbrecht euch mal nicht meinen Kopf.

Wenn Menschen ihre mail in den Gelben seiten im Klartext angeben wollen sie auch Post bekommen und ich verkaufe weder Viagra noch verkaufe ich überhaupt etwas die Seite wird kostenlos.

was hilft beim einsammeln von Mailadressen wenn man unterhalb von prof E-Mail-Harvestern bleiben will.

joe.schraube

(Themenstarter)
Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

so..... bin jetzt für 1 Jahr in Indien und werde das black-sheep Projekt vorann bringen. Es geht um gelebte Transparenz im Netz und um ein Angebot der Vernetzung gegen die zunehmende Ausbeutung von selbständigen.

Also möchte mir jemand mit Bash-kentnissen helfen ? Oder einen Kontakt vermitteln ? Eine Liste nennen in der ich noch fragen könnte ?

meine Motivation ist hier beschrieben : http://www.webmystik.de/bs-info-to-joe.html ( achtung klingt etwas einfach - ist für meine Indischen Kollegen formuliert ) Das Projekt hier : http://www.webmystik.de/black-sheep.html

Das_Wort

Anmeldungsdatum:
23. Dezember 2009

Beiträge: 5264

Wohnort: /dev/null

joe.schraube schrieb:

Es geht um gelebte Transparenz im Netz und um ein Angebot der Vernetzung gegen die zunehmende Ausbeutung von selbständigen.

Ähm, gelebte Transparenz? Persönliche Daten soll man nicht ohne Grund schützen. Wenn du von gelebt sprichst dann meinst du ein Crawler soll für andere Leute die Transparenz ausleben? Laut Gesetz darf jedes Individuum sein Leben selbst bestimmen. Das gilt auch für das Leben im digitalen Raum und den Umgang mit Daten.

Und wie bereits geschrieben, einen Crawler braucht es für eine Black sheep-Liste nicht. Außer du willst einen Bot bauen der Missbrauch afk bei Handwerkern registriert, was ich mir schlecht vorstellen kann.

Was das Adressen sammeln damit zu tun hat erschließt sich mir nicht. Außerdem ist ein Bewertungsportal das persönliche Daten von Personen ohne deren Einverständnis… nun sagen wir einfach für solch ein Projekt sollte man sich mit diversen deutschen Gesetzen genauer beschäftigen und sich auf Gerichtsverfahren einstellen.

Bzgl. der Datensätze zu kleinen Cent Beträgen:

Die Qualität der Datensätze ist so minderwertig dass diese sich nur für stupides, weit gestreutes Senden von SPAM eignen. Gute Datensätze sind um einiges teurer (mehrere Euro) mit jeweils definierten Zielgruppen. Persönliche Adressen (joe.mustermann@großes-deutsches-unternehmen.de) haben auch einen anderen Stellenwert als grobe Kontaktadressen.

Dass du keinen Crawler findest ist… ähm. bezeichnend. Denn im Web auf jeder größeren Hostingplattform finden sich dutzende die sich einfach nutzen lassen. Komplexere Webcrawler die verschleierte Adressen erkennen sind schon seltener.

Eine schnelle Suche von mir gibt mir über 200 Webcrawler in allen erdenklichen Programmiersprachen. Über die Qualität sagt das zwar nichts aus, aber mind. 50 davon sind gut Nutzbar und vielleicht 5 sogar sehr effizient.

joe.schraube

(Themenstarter)
Avatar von joe.schraube

Anmeldungsdatum:
24. Januar 2010

Beiträge: 506

Wohnort: Dresden

ach wie unschön wenn Kommunikation so derbe an einander vorbei geht. Aber deutlich mein Fehler. Es geht mir nur ( ! ) um die Gelben Seiten und nicht darum Menschen zu überlisten die ihre mail nicht ohne Grund in als hans at bla.de hinterlassen haben. Grafiken sollen auch schon erkannt werden nein das Spiel wolte ich nicht betreiben.( das du dir meine Links nicht angesehen hast hat auch nicht gerade geholfen zu verstehen was ich mit Transparenz meine).

Insofern der lange politische Text : ja unterschrieben alles gut, so ist das. Bei den Gelbenseiten ist das anders da schreib ich meine Mailadresse rein wenn ich Post wünsche.

Deswegen interessieren micht auch nicht die über 200 Webcrawler sondern nur ein Skipt für die gelben seiten. Das habe ich in meiner Googel recherche nur für Windof für 120,- € gefunden und nöö deswegen eine Virtualbox mit Winddof hatte ich keiene Lust. Also wenn du das so schnell überblickst ( Eine schnelle Suche von mir gibt mir über 200 Webcrawler in allen erdenklichen Programmiersprachen. Über die Qualität sagt das zwar nichts aus, aber mind. 50 davon sind gut Nutzbar und vielleicht 5 sogar sehr effizient. )

sind unter den 5 welche die mir helfen würden ? für die ich kein Windoof brauche ?

Antworten |