Hi,
flomar hat geschrieben:
Da kann ich nun auch nur raten, was du unter gängigen Suchmaschinen meinst, der Dauerbrenner heißt Beagle, aber denn wirst du wohl schon kennen. Ausserdem ist gerade die Google Desktopsuche für Linux erschienen, wenn du also keine Geheimnisse hast, nur zu.
Beagle ist nett für den Desktop PC zu Hause mit ein paar tausend Dateien ... hier geht es um mehrere hundert GB Daten, die sich auf mehrere dutzend Millionen Dateien verteilen (mein letzter Stand, vielleicht ist es auch schon im 3-stelligen Bereich). Auf meinen PC zu Hause (Intel E6600, 4 GB RAM) zeigt das Mono basierende Beagle eine Performance, die für den Desktop PC gerade ausreicht, ein Indexieren von dutzenden Millionen Dateien aller Art bei diesem Tempo aber keinen Sinn macht.
Deswegen habe ich Beagle bisher nur zu Hause, nicht aber auf den echten Daten ausprobiert - es sei denn, es gibt Erfahrungswerte, dass es auch bei einer derartigen Menge in akzeptabler Weise funktioniert?
Google Desktop für Linux ist zu neu, deswegen bisher nicht getestet. Im englischen Google Linux Forum sind aber erste Infos über eine extrem niedrige Performance beim Indexieren zu lesen - deswegen wohl erst einmal noch nicht geeignet für einen Test.
Anfangs hatten wir auch mal Google Desktop für Windows versucht. Das war allerdings absolut untauglich, da es nur einen Bruchteil der Dateien indexiert hat und viele Sachen nicht finden konnten, die definitiv enthalten sind. Auch diese Software ist eigentlich nur für den normalen Desktop PC konzipiert, nicht für die hier vorliegenden Anforderungen.
Strigi kannte ich bisher noch nicht. Allerdings ist die Liste der unterstützten Dateiformate zu kurz als das ein Test in der aktuellen Version Sinn machen würde. Da fehlen einige Formate, die vorhanden sind und zwingend auch suchfähig sein müssen.
Thomas