[opengeodb] ASCII-Schreibweise: upper/lower, mit/ohne Trennzeichen, kurz/lang (500100002)

Martin Trautmann traut at gmx.de
Mit Jan 23 13:55:19 CET 2008


Ingmar Lötzsch wrote:
> Egal, was rauskommt, ich empfehle etwas festzulegen, was auf einfachste
> Weise von einem Computer berechenbar ist - am besten ausschließlich mit
> SQL - und möglichst wenig Ausnahmen macht.
>
> - keine Buchstaben weglassen, etwa sss->  SS
> - keine Buchstaben hinzufügen, etwa St. ->  SANKT

Ja und nein - ein Dreh- und Angelpunkt ist, ob man den sortname 
überhaupt mitgeben muss. Ich würde sagen: nein.

Ich gehe aber davon aus, dass man den sortname mitgeben kann - gerade in 
den Fällen, wo er nicht durch eine ganz einfache Regeln reproduziert 
werden kann wie

Zeichensatz -> Großschrift
Umlaute -> ausschreiben
Bindestriche, Leerzeichen -> Löschen

In allen komplizierteren Fällen ist der Sortname im export dump 
enthalten, nur in den einfachen sollte er automatisch generiert werden.

Bei der Neuerstellung von Einträgen wird ein solcher sortname 
automatisch angelegt. Jeder hat die Freiheit, diesen nachzubessern. Auch 
solche Änderungen sind natürlich zulässig und mitzugeben.

> Beim letzten Beispiel handelt es sich entweder um eine Abkürzung des
> offiziellen Namens - dann sollte dieser unabgekürzt gespeichert werden,
> etwa "Sankt" statt "St." - oder die offizielle Bezeichnung ist "St.
> ...". Dann wäre es wünschenswert, wenn man es bei St. ->  ST belassen könnte.

Da unklar ist, ob und wann es offiziell ist, tendiere ich zum generellen 
ausschreiben, sprich Umwandlung in die Form, in der es auch 
ausgesprochen wird. Ich habe noch nie 
"ess-te-Bindestrich-Georg-Bindestrich-schtra-sse" gehört und würde das 
als Sortname "SANKTGEORGSTRASSE" verwenden wollen.


> Es könnte sein, dass manche Gemeinden die Abkürzung als offizielle
> Bezeichnung festlegen, andere nicht.

Kannst du das den Daten selbst ansehen? Ortsnamen sind immerhin halbwegs 
bekannt und offiziell - aber schon bei den Zusätzen wird es beliebig 
willkürlich. Heisst es "Xyz / Westerwald", "Xyz im Westerwald", "Xyz am 
Westerwald", "Xyz (Westerwald)", "Xyz/WW", "Xyz WW." oder wie? Und das 
sind nur einige der Variationen  um ein einziges Wort herum.

Von den Straßen her habe ich einen rechtt großen Erfahrungsschatz, was 
offiziell beliebig falsch gehen kann. Solche Leute wie Gerhard/t 
Hauptmann haben es der Stadt noch zusätzlich schwer gemacht ;-)

Was ist dann die Referenz? Der Stadtplan der Stadt, der 
Gemeindebeschluss zur (fehlerhaften) Benennung, die korrekte Schreibweise?

Nur mal als Hausnummer: Ich habe mehr als 100 000 Ortseinträge. Bei 
einem Drittel davon habe ich lange Namensvarianten. Bei 1895 habe ich 
weitere Namensvarianten, z.B. gerade nach Namensänderungen wie Zugewinn 
des Status als Bad:

Lobenstein, Thüringen
Lobenstein, Moorbad
Bad Lobenstein
Lobenstein

> Dann könnte man die Forderung
> aufstellen, dass so sortiert wird, als würde überall dieselbe Varainte
> verwendet. Das ist durchaus plausibel, birgt aber die Gefahr, dass die
> Zahl dieser Ausnahmen anwächst und irgendwann unübersichtlich wird.

So läuft's derzeit aber, wenn du mal sortname und name vergleichen 
möchtest. Bei manchen Einträgen bin ich mir nicht wirklich sicher - 
kannst du auf Anhieb beantworten, wie Hann. Münden ausgesprochen wird?

Schönen Gruß
Martin