[opengeodb] Nochmal zu Prosa-Namen wie "Brandis bei Wurzen"(war: Inkonsistenzen der Download-Daten)
Martin Trautmann
traut at gmx.de
Son Mar 30 13:51:39 CEST 2008
Frank Glück wrote:
>> Wie siehts beim Schachdorf und bei der Schöfferstadt aus? Oder anders
>> gefragt: Gibt es auch Fälle von _nicht-amtlichen_ Präfixen? Wenn ja -
>> welchen Schluss sollten wir daraus ziehen? Meines Erachtens müsste dies doch
>> dann einfach auf _zwei_ zusätzliche Metainfo-Felder hinauslaufen: Eines für
>> den nicht-amtlichen Präfix und eines für den nicht-amtlichen Suffix. Aber
>> letzlich müsste sich natürlich jede Überlegung in Richtung einer Änderung
>> der Datenstruktur ohnehin am Verhältnis von Aufwand und Nutzen orientieren.
>> Ich weiß ja auch nicht, inwieweit das bisher in Deinen eigenen Daten schon
>> sauber voneinander getrennt ist, so dass es sich halbwegs automatisiert
>> "korrigieren" ließe.
>
> ... gibts wohl gar keine Meinungen? Oder haltet Ihr den Vorschlag einer
> Aufsplittung des Namens in "nicht-amtlicher Vorsatz", "amtlicher Name" und
> "nicht-amtlicher Zusatz" wirklich für so indiskutabel?
Ja, ist für mich völlig indiskutabel - wenn, dann würde ich eher nur
Kurzform und vollständige Langform haben, nicht aber ein Puzzle aus
Prefix und Suffix.
> Ich möchte noch einen
> weiteren naheliegenden Grund dafür anbringen: Da die einzelne nicht-amtliche
> Zusammenführung der eigentlichen Ortsbezeichnung mit redaktionellen
> Erweiterungen sich in anderen Datenbanken kaum einmal in dieser Form
> wiederfinden wird, macht dies auch etwaige Abgleiche mit beim Nutzer etwa
> schon vorhandenen ortsbezogenen Datensätzen äußerst schwierig.
Wie gesagt, "Brandis bei Wurzen" ->
http://www.google.com/search?q=brandis-bei-wurzen -> 12400 Treffer
Brandis b. Wurzen -> 3860 Treffer
gegenüber 43900 mal "04821 Brandis" und
1 140 000 mal Brandis alleine - was auch diverse Firmen und Personen
umfasst.
"kaum einmal" möchte ich also verneinen. Abgleiche mit vorhandenen
Datensätzen erfordern aber immer wieder manuelle Iterationen. Mit
Brandis alleine würdest du zwar einfacher, dafür aber womöglich falscher
abgleichen.
Für den Abgleich taugt ja der Sortname in der Regel aus...
Schönen Gruß
Martin