Eine Idee: Rekonstruktion des alten Fanpage-Forums (Allgemeines Forum)

bigbug21, Stuttgart, Freitag, 23.05.2008, 22:04 (vor 5815 Tagen)

Guten Abend, liebe Forumanen,

nachdem das ICE-Fanpage-Forum übermorgen offline gehen wird, gehen bekanntermaßen zum zweiten Mal zahlreiche spannende Diskussionen, Gedankenaustausche, Meinungen und auch Dispute für uns und auch die Nachwelt verloren. (Bereits vor etwa zwei Jahren wurde ja mit dem Wechsel des Forumanbieters Wissen vernichtet).

Mich lässt dabei das Bestreben nicht mehr los, einen Beitrag zum Erhalt dieses Wissens zu leisten. Kurzum: Könnten wir unsere alte virtuelle Heimat irgendwann zumindest einmal in weiten Stücken wieder rekonstruieren?

Bereits seit einigen Monaten, seit der ersten Löschankündigung, haben Skripte sowohl die Fanpage als auch das Forum regelmäßig gespiegelt. Sicher bin ich dabei auch nicht der einzige, von daher wird das Wissen für den Moment zumindest auf einigen privaten Festplatten liegen.

Nun dürfte es rechtlich schwierig sein, das Forum einfach so irgendwo wieder online zu stellen. Ein denkbarer Weg scheint mir jedoch, mit der Zustimmung der einzelnen Autoren deren Beiträge wieder zu veröffentlichen. Das ist sicher ein saum****iger Aufwand, der mehr als einen Tag Softwareentwicklung erfordern wird, aber unmöglich dürfte das nicht sein.

Ich habe am Montag einen Termin bei einer Rechtsgelehrten, um die urheberrechtlichen Fragen in dieser Sache genauer zu ergründen. Ab Mitte August, wenn meine Prüfungen für dieses Semester gelaufen sind, sollte dann auch Zeit sein, die notwendige Software zu schreiben, um zumindest einen Teil des angesammelten Wissens zu rekonstruieren und wieder öffentlich zugänglich zu machen.

Dies als Wasserstandsmeldung. Über Kommentare und Hilfe (kann hier jemand Perl?!) würde ich mich freuen.

Viele Grüße aus Dresden
Peter

--
unterwegs für freie Eisenbahn-Geodaten

Eine Idee: Rekonstruktion des alten Fanpage-Forums

ICE-T-Fan, Freitag, 23.05.2008, 22:22 (vor 5815 Tagen) @ bigbug21

Ich spiegele derzeit das Forum der Fanpage mit dem Offline Explorer, aber die zehntausende HTML-Seiten im Puffer überfordern das Programm, sodass es schon mehrmals abgestürzt ist und ich wieder bei 0 anfangen musste.

Ich kann daher nicht mehr garantieren alle Beiträge bis Sonntag auf meienr privaten Festplatte zu bekommen.

@ICE-T-Fan

bigbug21, Stuttgart, Freitag, 23.05.2008, 22:26 (vor 5815 Tagen) @ ICE-T-Fan

Hast du zufällig Linux auf dem Rechner? Zumindest für das Forum kann ich dir ein Perlskript schicken, das systematisch alle Beitragsnummern durchprobiert und die Beiträge mit den entsprechenden Nummern auf der Festplatte ablegt.

Viele Grüße
Peter

--
unterwegs für freie Eisenbahn-Geodaten

@ICE-T-Fan

ICE-T-Fan, Freitag, 23.05.2008, 22:33 (vor 5815 Tagen) @ bigbug21

Ich habe derzeit nur noch meinen Laptop und da ist nur Windows XP drauf, auf Linux lassen sich gewisse Treiber für WLAN und Chipsatz nicht odentlich installieren.

Ich kann natürlich mit z.B. "FlashGet" einen Batchdownloadauftrag erstellen der systematisch alle Zahlen durchprobiert, jedoch würde ich da auch viele Seiten ohne Inhalt miterzeugen. Der Offline Explorer lädt das Forum in einem Stück indem er systematisch alle Links durchgeht, sodass das Forum als funktionsfähiges Ganzes in reienr html-Form vorhanden ist.

Da ich aber nur DSL 1500 habe und zudem der OE nach einigen Stunden Arbeit 100% CPU-Last benötigt, ist die Chance alles zu erwischen derzeit nicht so toll.

Zumindestens habe ich in jedem Fall die ersten 10.000 Beiträge und die letzten 10.000 Beiträge.

@ICE-T-Fan

bigbug21, Stuttgart, Freitag, 23.05.2008, 22:42 (vor 5815 Tagen) @ ICE-T-Fan

Hallo ICE-T-Fan,

Ich habe derzeit nur noch meinen Laptop und da ist nur Windows XP drauf, auf Linux lassen sich gewisse Treiber für WLAN und Chipsatz nicht odentlich installieren.

Oh, das ist schade.

Ich kann natürlich mit z.B. "FlashGet" einen Batchdownloadauftrag erstellen der systematisch alle Zahlen durchprobiert, jedoch würde ich da auch viele Seiten ohne Inhalt miterzeugen.

Ich habe das so gelöst, dass alle Seiten unterhalb einer gewissen Größe automatisch verworfen werden. Ist ein ziemlich Gefrickel, läuft aber erstaunlich gut.,..

Der Offline Explorer lädt das Forum in einem Stück indem er systematisch alle Links durchgeht, sodass das Forum als funktionsfähiges Ganzes in reienr html-Form vorhanden ist.

Alles klar. Ansonsten können wir uns noch per Privatnachricht abstimmen. Das bestehende Forum umfasst 3572 Threads mit einer Gesamtgröße von rund 37 MB. Als ZIP komprimiert sind's dann gut 25 MB. Die rund 3200 Benutzerprofilseiten (davon inzwischen, die meisten Spam-Einträge) gehen extra.

Viele Grüße
Peter

--
unterwegs für freie Eisenbahn-Geodaten

@ICE-T-Fan

ICE-T-Fan, Freitag, 23.05.2008, 22:52 (vor 5815 Tagen) @ bigbug21

Bei mir macht das Ganze mittlerweile 2 GB aus ;)

Es sind nach letzter Zählung sowas um die 90.000 html-Seiten.
Mehrfache Downloads aufgrund von zusätzlichen Variablen in den mehrfach verlinkten Seiten nicht miteingerechnet.
Das ergibt sich halt wohl aus der Tatsache, dass der OE die Baumstruktur herunterlädt und jeder Beitrag eine neue html-Seite ist.
Außerdem ändern sich kleinere Dinge wie zusätzliche Variablen innerhalb der Links wenn man "nächste Beiträge" und "vorhergehende Beiträge" anklickt.

Schätzungsweise 4-5 GB wird der gesamte Download ausmachen.
Wenn ich Glück habe passt es auf eine DVD.

Der OE macht auch gleichzeitig automatisch eine Offline-Kovertierung der Links, sodass das Forum auch von Festplatte oder DVD im Browser aufgerufen werden kann, als würde man sich das online-Forum ansehen.
Bis auf Login, Suchfunktion und Links zu anderne Domain müssten alle Links innerhalb des Forum ganz normal funktionieren.

Halt eine echte Offline-Kopie.

@ICE-T-Fan

Maverick, Freitag, 23.05.2008, 23:09 (vor 5815 Tagen) @ bigbug21

Alles klar. Ansonsten können wir uns noch per Privatnachricht abstimmen. Das bestehende Forum umfasst 3572 Threads mit einer Gesamtgröße von rund 37 MB. Als ZIP komprimiert sind's dann gut 25 MB. Die rund 3200 Benutzerprofilseiten (davon inzwischen, die meisten Spam-Einträge) gehen extra.


Bist du dir da sicher? Ich habe vor etwa 20 Minunten angefangen, das alte Forum auf meine Platte zu ziehen habe aktuell schon 350 MB an Forendateien!

@ICE-T-Fan

bigbug21, Stuttgart, Freitag, 23.05.2008, 23:17 (vor 5815 Tagen) @ Maverick

Hallo Maverick,

Alles klar. Ansonsten können wir uns noch per Privatnachricht abstimmen. Das bestehende Forum umfasst 3572 Threads mit einer Gesamtgröße von rund 37 MB. Als ZIP komprimiert sind's dann gut 25 MB. Die rund 3200 Benutzerprofilseiten (davon inzwischen, die meisten Spam-Einträge) gehen extra.


Bist du dir da sicher? Ich habe vor etwa 20 Minunten angefangen, das alte Forum auf meine Platte zu ziehen habe aktuell schon 350 MB an Forendateien!

Ich habe zu anfangs auch einmal versucht, einfach das Forum zu spiegeln. In zigtausenden Links lief sich aber auch das eigentlich sonst sehr robuste "w3mir" damals tot. Ich habe dann ein Perl-Skript geschrieben, was für Nummern ab eins diese URL aufruft: http://www.ice-fanpage.de/forum/read.php?f=3&i=<NUMMER>&t=<NUMMER>

Rückgaben von unter 3.500 Byte Größe (= leerer Beitrag, da ungültige Nummer) werden automatisch verworfen, der Rest erhält den Namen 'Beitrag_<NUMMER>.html'. Das entsprechende Perl-Skript stelle ich auf Wunsch gerne zur Verfügung.

Viele Grüße
Peter

--
unterwegs für freie Eisenbahn-Geodaten

@ICE-T-Fan

ICE-T-Fan, Freitag, 23.05.2008, 23:26 (vor 5815 Tagen) @ bigbug21

Hallo Maverick,

Alles klar. Ansonsten können wir uns noch per Privatnachricht abstimmen. Das bestehende Forum umfasst 3572 Threads mit einer Gesamtgröße von rund 37 MB. Als ZIP komprimiert sind's dann gut 25 MB. Die rund 3200 Benutzerprofilseiten (davon inzwischen, die meisten Spam-Einträge) gehen extra.


Bist du dir da sicher? Ich habe vor etwa 20 Minunten angefangen, das alte Forum auf meine Platte zu ziehen habe aktuell schon 350 MB an Forendateien!


Ich habe zu anfangs auch einmal versucht, einfach das Forum zu spiegeln. In zigtausenden Links lief sich aber auch das eigentlich sonst sehr robuste "w3mir" damals tot. Ich habe dann ein Perl-Skript geschrieben, was für Nummern ab eins diese URL aufruft: http://www.ice-fanpage.de/forum/read.php?f=3&i=<NUMMER>&t=<NUMMER>

Rückgaben von unter 3.500 Byte Größe (= leerer Beitrag, da ungültige Nummer) werden automatisch verworfen, der Rest erhält den Namen 'Beitrag_<NUMMER>.html'. Das entsprechende Perl-Skript stelle ich auf Wunsch gerne zur Verfügung.

Viele Grüße
Peter

Kein Wunder das bei dir der Download so klein ist, für den Fall das du Nummer=Nummer gesetzt hast.

Die Nummer hinter dem i gibt die Beitragsnummer an und die Nummer hinter dem t die Thread-Nummer, also die Nummer des ersten Beitrags im Thread. Diese sind nicht identisch.

z.B. http:///www.ice-fanpage.de/forum/read.php@f=3&amp;i=5418&amp;t=5414
Das wäre z.B. die erste Antwort auf den Thread mit dem Startbeitrag mit der Nummer 5414.
Die 5418 resultieren daraus, dass zwischen Threaderstellung und Antwort bereits an anderer Stelle 3 neue Beiträge geschrieben wurden.

Dieses Verfahren würde nur in der normalen Anzeigestruktur aber nicht in der Baumstruktur funktionieren. Die Baumstruktur ist aber glaube die Standard-Struktur bei Aufruf eines beliebigen Links im Forum.

Um die Baumstruktur auszublenden muss man noch einen Paramter setzen:
http://www.ice-fanpage.de/forum/read.php?f=3&amp;i=5414&amp;t=5414&amp;v=f
(&v=f)

@ICE-T-Fan

bigbug21, Stuttgart, Samstag, 24.05.2008, 10:55 (vor 5815 Tagen) @ ICE-T-Fan

Hallo ICE-T-Fan,

[...]
Um die Baumstruktur auszublenden muss man noch einen Paramter setzen:
http://www.ice-fanpage.de/forum/read.php?f=3&amp;i=5414&amp;t=5414&amp;v=f
(&v=f)

Oh, du hast Recht! Ich habe das Skript gerade entsprechend angepasst und lasse den Download nun noch einmal von vorn laufen.

Vielen Dank!

... und beste Grüße aus Dresden
Peter

--
unterwegs für freie Eisenbahn-Geodaten

@ICE-T-Fan

Maverick, Freitag, 23.05.2008, 23:43 (vor 5815 Tagen) @ bigbug21

Ich habe zu anfangs auch einmal versucht, einfach das Forum zu spiegeln. In zigtausenden Links lief sich aber auch das eigentlich sonst sehr robuste "w3mir" damals tot. Ich habe dann ein Perl-Skript geschrieben, was für Nummern ab eins diese URL aufruft: http://www.ice-fanpage.de/forum/read.php?f=3&i=<NUMMER>&t=<NUMMER>

Rückgaben von unter 3.500 Byte Größe (= leerer Beitrag, da ungültige Nummer) werden automatisch verworfen, der Rest erhält den Namen 'Beitrag_<NUMMER>.html'. Das entsprechende Perl-Skript stelle ich auf Wunsch gerne zur Verfügung.


Interessant!

Das "einfach spiegeln" habe ich eben abgebrochen. Würde viel zu lange dauern und das Programm würde sich sicher irgendwann totrennen, auch MAC's stürzen ab.

Ich wünsche dir viel Glück damit, alle Beiträge des alten Forums zu "retten".

Eine Idee: Rekonstruktion des alten Fanpage-Forums

Lennart, Samstag, 24.05.2008, 00:12 (vor 5815 Tagen) @ bigbug21

Ich muss euch allen mal ein riesiges Lob aussprechen für die Mühe, die ihr euch macht, um unser Wissen zu sichern. Es ist toll, zu sehen, mit wieviel Kompetenz hier schnell Schadensbegrenzung vorgenommen wird.
Viel Erfolg, hoffentlich könnt ihr alles sichern!

Eine Idee: Rekonstruktion des alten Fanpage-Forums

Dan_P, St. Ilgen/Sandhausen, Samstag, 24.05.2008, 18:42 (vor 5815 Tagen) @ bigbug21

Ist es nicht naheliegender, Dennis um eine Backup-Datei zu bitten, die sehr wahrscheinlich als SQL-Script daher kommt? Das wäre jedenfalls sicher deutlich weniger Traffic- und Speicher-intensiv als das Abrufen jedes einzelnen Artikels per Script und wget.

Als Neuling kann ich kaum darum bitten, aber gibt es im neuen Forenteam niemanden, der das anleiern könnte?

--
bye, Dan

[image]

Meine Fotos im Netz - http://www.dans-photos.net/

Eine Idee: Rekonstruktion des alten Fanpage-Forums

Manitou, Sonntag, 25.05.2008, 00:58 (vor 5814 Tagen) @ Dan_P

Es gibt einen Web-Archiv-Dienst, der alle Webseiten mit historischen Zuständen zur Verfügung stellt. Den Namen kenne ich jedoch nicht.
Wer kann das Archiv finden um den letzten, dort archivierten Stand des ICE-Forums zu verlinken bzw. feststellen, auf welcher rechtlichen Grundlage die arbeiten, um das Archiv des alten Forums legal wieder öffentlich zu machen.

Eine Idee: Rekonstruktion des alten Fanpage-Forums

bigbug21, Stuttgart, Sonntag, 25.05.2008, 07:05 (vor 5814 Tagen) @ Manitou

Es gibt einen Web-Archiv-Dienst, der alle Webseiten mit historischen Zuständen zur Verfügung stellt. Den Namen kenne ich jedoch nicht.
Wer kann das Archiv finden um den letzten, dort archivierten Stand des ICE-Forums zu verlinken bzw. feststellen, auf welcher rechtlichen Grundlage die arbeiten, um das Archiv des alten Forums legal wieder öffentlich zu machen.

Meinst du http://web.archive.org?

Das Problem mit dem Dienst ist, dass der letzte Stand des Forums Monate zurückliegt und wohl auch nicht jeder einzelne Beitrag gespeichert wurde.

Viele Grüße
Peter

--
unterwegs für freie Eisenbahn-Geodaten

Eine Idee: Rekonstruktion des alten Fanpage-Forums

Manitou, Montag, 26.05.2008, 00:16 (vor 5813 Tagen) @ bigbug21

Es geht nicht nur um den dort gespeicherten Stand. Einerseits könnte man <web.archive.org> die gesicherten letzten Daten anbieten. Andererseits könnte der Betreiber Auskunft zur Rechtslage für das veröffentlichen von gesicherten alten Foren geben.
Eine (eventuell nicht ganz legale) Variante wäre es, das alte Forum im Ausland zu hosten.

Eine Idee: Rekonstruktion des alten Fanpage-Forums

ICE-T-Fan, Sonntag, 25.05.2008, 01:15 (vor 5814 Tagen) @ bigbug21

Ich brenne alles das, soweit ich eben gekommen bin (ca 65% der Struktur und ca 50% der Beiträge) auf DVD.
Wenn es jemand von euch haben möchte, müssen wir mal ein Treffen ausmachen.

Für einen Teil der Beiträge hab ich die Baumstruktur, sodass sich für die ältestens und neuesten Beiträge die Zuordnung wiederherstellen lassen sollte.

Eine Idee: Rekonstruktion des alten Fanpage-Forums

Fabi, Stuttgart, Sonntag, 25.05.2008, 13:28 (vor 5814 Tagen) @ bigbug21

Ich kann noch mit 4210 Google-Ergebnissen dienen. Klickt man dort beim jeweiligen Ergebnis auf "Im Cache", findet man den gewünschten Beitrag.

=> http://www.google.de/search?hl=de&q=site%3Awww.ice-fanpage.de%2Fforum+&meta=

Fügt man dann noch Stichworte ein, findet man alle möglichen Themen dazu, wenn man dann weitere Beiträge eines Themas lesen will, kann man ja schauen, wie das Thema heißt und danach suchen.

=> Suche nach "DB-Lounge"

=> Suche nach Thementitel "Serviceinitiative 1. Klasse"

Also, da sich selbst die letzten beiden Themen bei Google finden lassen, gehe ich davon aus, dass man fast alle Themen, die man sucht, finden wird.

Fabi

Eine Idee: Rekonstruktion des alten Fanpage-Forums

FloSch, München, Sonntag, 25.05.2008, 13:40 (vor 5814 Tagen) @ Fabi

Also, da sich selbst die letzten beiden Themen bei Google finden lassen, gehe ich davon aus, dass man fast alle Themen, die man sucht, finden wird.

Da muss man sich nur beeilen, da Google den Cache von Seiten, die es nicht mehr gibt, schließlich auch löscht.

--
[image]

Links funktionieren nicht mehr

Matze86, München, Sonntag, 25.05.2008, 19:08 (vor 5814 Tagen) @ Fabi

Dennis hat wohl schon alles gelöscht.

Links funktionieren nicht mehr

Fabi, Stuttgart, Sonntag, 25.05.2008, 19:34 (vor 5813 Tagen) @ Matze86

Wie jetzt? Soweit ich sehe liegt der Google-Cache nicht auf Dennis' Server. :-)

Fabi

RSS-Feed dieser Diskussion
powered by my little forum