Kätzchen
Anmeldungsdatum: 1. Mai 2011
Beiträge: 6677
Wohnort: Technische Republik
|
Es wäre Spitze wenn es eine Wikistatistik gäbe. Sozusagen die Top 10 Wikiartikel des Monats (nach Rubriken?) könnten im UWR präsentiert werden. Was haltet ihr davon? Ist das machbar? Das wünsche ich mir zum Geburtstag! Morgen hat der Linux Kernel und das Kätzchen Geburtstag. ☺
|
encbladexp
Ehemaliger
Anmeldungsdatum: 16. Februar 2007
Beiträge: 17447
|
Wie definierst du "Top 10 Artikel"? Welche am meisten aufgerufen wurden? Am meisten bearbeitet? mfg Stefan Betz
|
Kätzchen
(Themenstarter)
Anmeldungsdatum: 1. Mai 2011
Beiträge: 6677
Wohnort: Technische Republik
|
encbladexp schrieb: Wie definierst du "Top 10 Artikel"? Welche am meisten aufgerufen wurden? Am meisten bearbeitet?
Am meisten Aufgerufen würde ich sagen. mfg Kater
|
encbladexp
Ehemaliger
Anmeldungsdatum: 16. Februar 2007
Beiträge: 17447
|
Derartige Informationen haben wir nur relativ eingeschränkt, zwar führen wir aktuell noch eine access.log, auf den neuen Servern wird diese aber wohl nur noch für einen relativ kurzen Zeitraum (wenige Tage, maximal 1-2 Wochen) vorgehalten werden da die enthaltenen Informationen nicht für den Betrieb der Plattform erforderlich sind. Analyse Tools wie piwik oder Google Analytics verwenden wir ebenfalls, aus bekannten Gründen, nicht. Bleibt also nur die Logs der vorhandenen 3 Server zu kombinieren und dort alles was Wiki ist rauszufiltern. Das kann man gerne mal einmalig machen, ist aber mit einem gewissen Zeitaufwand verbunden. mfg Stefan Betz
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12821
|
encbladexp schrieb:
Bleibt also nur die Logs der vorhandenen 3 Server zu kombinieren und dort alles was Wiki ist rauszufiltern. Das kann man gerne mal einmalig machen, ist aber mit einem gewissen Zeitaufwand verbunden.
Wenn ich es in Ruby machen darf und Ihr klärt, was wir haben wollen, melde ich mich freiwillig, den Auswerter zu schreiben. ☺
|
encbladexp
Ehemaliger
Anmeldungsdatum: 16. Februar 2007
Beiträge: 17447
|
rklm schrieb: Wenn ich es in Ruby machen darf und Ihr klärt, was wir haben wollen, melde ich mich freiwillig, den Auswerter zu schreiben. ☺
Das wäre auch möglich, ich könnte dir eine Repräsentative access.log für einen gewissen Zeitraum per Mail zukommen lassen. Wäre nach Wiki gefiltert und Quell IP wäre auch gekickt, Deal? mfg Stefan Betz
|
Kätzchen
(Themenstarter)
Anmeldungsdatum: 1. Mai 2011
Beiträge: 6677
Wohnort: Technische Republik
|
Super rklm, ich freue mich.
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12821
|
encbladexp schrieb: rklm schrieb: Wenn ich es in Ruby machen darf und Ihr klärt, was wir haben wollen, melde ich mich freiwillig, den Auswerter zu schreiben. ☺
Das wäre auch möglich, ich könnte dir eine Repräsentative access.log für einen gewissen Zeitraum per Mail zukommen lassen. Wäre nach Wiki gefiltert und Quell IP wäre auch gekickt, Deal?
Deal. Ich hätte allerdings lieber ein paar repräsentative Zeilen vom Nicht-Wiki mit drin (natürlich auch entsprechend anonymisiert), damit ich testen kann, ob die Filterung im Skript korrekt arbeitet. Jetzt müssen wir nur noch klären, nach was wir auswerten und wie konfigurierbar das sein soll. Ich könnte mir ungefähr solche Optionen vorstellen: Angabe einer Template-Datei, in die dann die Werte eingebaut werden. Da könnte man dann gleich passendes HTML generieren, um es in eine Seite einzubauen. Man könnte natürlich damit auch JSON generieren für eine nette interaktive JavaScript-Tortengraphik... Ich schweife ab. Angabe des relativen Zeitraums (z.B. letzte vier Wochen). vielleicht auch Angabe von Start und Ende (wenn man historische Auswertungen machen will). Wie groß das N in der Top-N-Liste ist (default: 10) Nach was man sortiert, z.B. Lesezugriffe Lesezugriffe verschiedener Benutzer (wenn das sinnvoll geht) Änderungen Volumen der Änderungen (falls das geht) Volumen des Traffic (eher für interne Auswertungen interessant "Welche Seite generiert den meisten Traffic?")
Restliche Parameter sind Dateinamen, die zu lesen sind (alternativ könnte man auch ein Verzeichnis angeben)
Ggf. könnte man auch eine gestaffelte Auswertung machen, also die Top-N von gestern, der letzten Woche und des letzten Monats. Das mal so als erste, grobe Idee. 😬
|
Benno-007
Anmeldungsdatum: 28. August 2007
Beiträge: 29240
Wohnort: Germany
|
Tolle Idee, interessiert mich nämlich auch sehr.
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12821
|
Benno-007 schrieb: Tolle Idee, interessiert mich nämlich auch sehr.
Update: das Skript steht soweit (auch mit Ausgabe im Wiki-Format), aber wir müssen noch etwas am Logging ändern, damit wir die Einträge für das Wiki sauber herausfilter können. Das bedeutet dann vermutlich auch, dass wir wohl keine Statistiken in die Vergangenheit machen können. Immerhin können wir dann jetzt damit anfangen. ☺ Wir melden uns wieder, wenn es Neuigkeiten gibt. Bis neulich robert
|
noisefloor
Ehemaliger
Anmeldungsdatum: 6. Juni 2006
Beiträge: 29038
Wohnort: WW
|
Hallo, also früher™ war das so, dass die Top 10 Seiten die Startseite und die populären Übersichtsseiten wie Downloads, Multimedia etc. waren. Mal sehen, ob das heute anders ist 😉 Aber schön, dass es ein Auswerteskript gibt. Gruß, noisefloor
|
Kätzchen
(Themenstarter)
Anmeldungsdatum: 1. Mai 2011
Beiträge: 6677
Wohnort: Technische Republik
|
rklm schrieb: Wir melden uns wieder, wenn es Neuigkeiten gibt. Bis neulich
Wie sieht es aus? Bis bald hoffentlich!
|
rklm
Projektleitung
Anmeldungsdatum: 16. Oktober 2011
Beiträge: 12821
|
Kätzchen schrieb: rklm schrieb: Wir melden uns wieder, wenn es Neuigkeiten gibt. Bis neulich
Wie sieht es aus?
Ächz. encbladexp hatte das mal testweise laufen lassen, aber aus irgendeinem™ Grund haben wir das nicht weiter verfolgt. Ich erinnere mich nicht mehr genau, aber es war vermutlich einer oder mehrere von
"wir müssen noch etwas am Logging ändern, damit wir die Einträge für das Wiki sauber herausfilter können" PostgreSQL-Umstellung OSS Release Arbeit wichtiger
Bis bald hoffentlich!
😬
|
encbladexp
Ehemaliger
Anmeldungsdatum: 16. Februar 2007
Beiträge: 17447
|
PostgreSQL ist ja erledigt 😉 mfg Stefan
|