[opengeodb] Nochmal zu Prosa-Namen wie "Brandis bei Wurzen"(war: Inkonsistenzen der Download-Daten)

Martin Trautmann traut at gmx.de
Son Mar 30 13:51:39 CEST 2008


Frank Glück wrote:

>> Wie siehts beim Schachdorf und bei der Schöfferstadt aus? Oder anders
>> gefragt: Gibt es auch Fälle von _nicht-amtlichen_ Präfixen? Wenn ja -
>> welchen Schluss sollten wir daraus ziehen? Meines Erachtens müsste dies doch
>> dann einfach auf _zwei_ zusätzliche Metainfo-Felder hinauslaufen: Eines für
>> den nicht-amtlichen Präfix und eines für den nicht-amtlichen Suffix. Aber
>> letzlich müsste sich natürlich jede Überlegung in Richtung einer Änderung
>> der Datenstruktur ohnehin am Verhältnis von Aufwand und Nutzen orientieren.
>> Ich weiß ja auch nicht, inwieweit das bisher in Deinen eigenen Daten schon
>> sauber voneinander getrennt ist, so dass es sich halbwegs automatisiert
>> "korrigieren" ließe.
>
> ... gibts wohl gar keine Meinungen? Oder haltet Ihr den Vorschlag einer
> Aufsplittung des Namens in "nicht-amtlicher Vorsatz", "amtlicher Name" und
> "nicht-amtlicher Zusatz" wirklich für so indiskutabel?

Ja, ist für mich völlig indiskutabel - wenn, dann würde ich eher nur 
Kurzform und vollständige Langform haben, nicht aber ein Puzzle aus 
Prefix und Suffix.

> Ich möchte noch einen
> weiteren naheliegenden Grund dafür anbringen: Da die einzelne nicht-amtliche
> Zusammenführung der eigentlichen Ortsbezeichnung mit redaktionellen
> Erweiterungen sich in anderen Datenbanken kaum einmal in dieser Form
> wiederfinden wird, macht dies auch etwaige Abgleiche mit beim Nutzer etwa
> schon vorhandenen ortsbezogenen Datensätzen äußerst schwierig.

Wie gesagt, "Brandis bei Wurzen" -> 
http://www.google.com/search?q=brandis-bei-wurzen -> 12400 Treffer

Brandis b. Wurzen -> 3860 Treffer

gegenüber 43900 mal "04821 Brandis" und
1 140 000 mal Brandis alleine - was auch diverse Firmen und Personen 
umfasst.

"kaum einmal" möchte ich also verneinen. Abgleiche mit vorhandenen 
Datensätzen erfordern aber immer wieder manuelle Iterationen. Mit 
Brandis alleine würdest du zwar einfacher, dafür aber womöglich falscher 
abgleichen.

Für den Abgleich taugt ja der Sortname in der Regel aus...

Schönen Gruß
Martin