[opengeodb] Wiki: Eigentor Google
hunter
hunter at geohunting.de
Sam Sep 1 13:14:59 CEST 2007
Hi,
fand diesen Thread per Zufall im Spamordner heute.
Ich hoffe meine Antwort hilft noch, sonst einfach ignorieren und nicht
diskutieren.
die Robots.txt ist hier völlig egal, weil es robots gibt (ich habe
selbst schon solche geschrieben)
die tatsächlich den Verzeichnissbaum über jeden Link den sie finden
können 'durchgehen' ohne
den robots.txt auch nur anzufassen. Es gibt auch böse robots, die
absichtlich die denies durchscannen.
(tzz, die welt ist so böse) der Apache überwacht hier nichts. Es gibt
auch kein Gesetz das die robots.txt
zur Bibel macht.
Der einzige Weg ist, die Leserechte der betreffenden Files für die Welt
auf 0 zu setzen.
Das CMS wird ausgeführt unter den rechten des Apacheusers oder der
Web-Gruppe
nur diese Scripte dürfen nach Prüfung der Rechte des aktuellen Users die
Inhalte
ausliefern. Die Unixrechte für ein solchen File wären also z.B. 770
(Owner und Gruppe,
die scripte! dürfen alles, von draußen und die Welt darf nichts.
Das heist auch, dass z.B. ein geschütztes Bild nur durch die PHP oder
PERL -routine 'geliefert' wird,
im script steht der Funktionsaufruf der entsprechenen Routine nicht der
Link auf das Bild.
Marktübliche CMS (z.B. Postnuke mit dem Module PhotoShare haben so etwas
fertig.
Die Bildausgabe sieht dann so aus im Browserquelltext, wenn der Besucher
sich den anschaut:
index.php?module=photoshare&type=show&func=viewimage&iid=56
In diesem Zusammenhang ist 'Bild' natürlich nur ein Platzhalter für alle
anderen Inhaltstypen wie
Texte, links, Downloads, Datenbankzugriffe etc.
Ich kenne keinen anderen Weg um Daten sonst zu schützen, außer, sie
nicht auf einen Server zu spielen.
;-)
Grüße
Wolfgang Uhr schrieb:
> Hallo
>
> Bei der Gelegenheit denke mal nach über die Zeilen
>
> <meta name="robots" content="index,follow">
> <meta name="revisit-after" content="14 days">
>
> und was du damit sagst.
>
> Die zweite Zeile kannst du vergessen, die bringt gar nichts.
>
> Mein erster Ansatz wäre eine Änderung:
> <meta name="robots" content="noindex,nofollow">
>
> Herzliche Grüße
> Wolfgang Uhr
>
>
> Martin Trautmann schrieb:
>
>> Hallo,
>>
>> leider habe ich den Wiki-Ansatz wohl zu einfach gestrickt: Fehleintraege und Loeschung koennen durch einen einfachen URL ausgeloest werden.
>>
>> Seit Google http://fa-technik.adfc.de/Codierung/opengeodb.pl fand, wurden einige Aenderungen dort durch den googlebot wieder rueckgaengig gemacht.
>>
>> Wie soll ich das verhindern?
>>
>> Auf die Schnelle kann ich durch den passenden robots-Eintrag Google wieder bitten, draussen zu bleiben. Aber schon die naechste Suchmaschine kann das wieder ausloesen.
>>
>> - Bilderratespielchen: Soll ich ein Captcha einbauen, wo die Ziffern und Buchstaben aus einer verhunzten Grafik ausgelesen oder Rechenspielchen "2+2=" geloest werden muessen?
>>
>> - Login: duerfen nur angemeldete Besucher die Inhalte aendern?
>>
>> - Angabe einer E-Mail-Adresse: duerfen nur Besucher bei Angabe einer E-Mail-Adresse die Inhalte aendern? Soll diese sogar ueber E-Mail-Bestaetigung und Web-URL in dieser Mail Eingang finden?
>>
>> Im Moment tendiere ich zum Login: Anlegen darf jeder, aendern vielleicht auch. Zuruecksetzen und Loeschen duerfen nur angemeldete Besucher.
>>
>> Schoenen Gruss
>> Martin
>>
>
>