[opengeodb] (Landkreis) Rhein-Kreis Neuss zweimal vorhanden?
Martin Trautmann
traut at gmx.de
Sam Mar 29 06:41:43 CET 2008
Frank Glück wrote:
> Hallo zusammen,
>
> bin gerade zufällig in der geodb_textdata auf nicht weniger als drei
> Datensätze des Landkreises Rhein-Kreis Neuss mit unterschiedlichen text_val
> Werten gestoßen, wohlgemerkt allesamt mit der loc_id 195.
>
> Die Datensätze mit den text_val Werten "Landkreis Neuss" und "Landkreis
> Rhein-Kreis Neuss" lösen sich in zeitlicher Nachfolge ordnungsgemäß ab:
> Ersterer galt nur von 1975-01-01 bis 2003-06-30 und letzterer gilt seit
> 2003-07-01. Zusätzlich gibt es aber auch noch den Datensatz mit text_val =
> "Rhein-Kreis Neuss", also ohne "Landkreis", aber auch ohne zeitliche
> Gültigkeitsangabe.
Nummer eins und zwei kommen aus den Extra-Daten.
Nummer drei stammt aus den Basis-Daten, wo kein begin/end vorliegt.
Eine Möglichkeit zur Behebung des Problems wäre, extra.sql herzunehmen,
alle Types aus den Basisdaten durchzugehen und alles mit Enddatum in der
Zukunft erst zu löschen - in dem Fall also besser ein "Lösche Typ
500100000 von locid 195" (evtl ergänzt mit begin null, end 3000-01-01),
weil die Schreibweise Rhein-Kreis Neuss aus den Basisdaten abweicht von
der Schreibweise Landkreis Rhein-Kreis Neuss aus den Extradaten.
> Mal vorausgesetzt, es handelt sich bei letzterem um eine Dublette des seit
> 1.7.2003 gültigen Datensatzes, welche Schreibweise ist denn dann aber
> "richtig"? Die mit oder die ohne zusätzliche Bezeichnung "Landkreis"? Und
> lässt sich daraus nicht auch eine Regel für gleich gelagerte Fälle ableiten,
> um eine Normalisierung durchführen zu können?
Ich habe in den Basisdaten den Landkreis entfernt, weil er als
Typ-Bezeichnung den Landkreis mitbringt (hm, tatsächlich firmiert er nur
als Kreis: http://fa-technik.adfc.de/code/opengeodb.pl?locid=195;c=DE)
und LandKREIS Rhein-KREIS Neuss doppelt ggemoppelt ist.
Die Abfrage
>
> SELECT *
> FROM `geodb_textdata`
> WHERE `text_val` LIKE 'Landkreis%'
> LIMIT 0 , 500
>
> ergab immerhin insgesamt 50 solcher Fälle, was mich vermuten lässt, dass
> eine einheitliche Regel hier bisher nicht existiert.
Prüfe bitte mal nach, ob alle von denen mit Datum vorliegen - denn das
scheinen alles Daten aus extra.sql zu sein, die ich unverändert belassen
habe. Die einheitliche Regel ist, dass ich die Kreisbezeichnung aus dem
Namen herausgenommen habe.
Einzige Ausnahme, gerade wo es kein Kreis ist:
#23300 Rosenheim (Landkreis Altenkirchen)
Nicht released sind die anderen drei:
Harz (Landkreis Goslar), gemfr. Gebiet
Harz (Landkreis Osterode am Harz), gemfr. Gebiet
Solling (Landkreis Northeim), gemfr. Gebiet
> Gibt es dafür einen
> wirklichen Grund? Falls nicht: Da es ja auch nicht wenige Fälle gibt, die
> das Wort "Kreis" bereits im Namen selbst führen, wäre ich dafür, allen
> übrigen Fällen in Deutschland eben auch tatsächlich den "Landkreis"
> voranzustellen, der ihnen gebührt. Und ja, da es hierbei ausschließlich um
> Landkreise im eigentlichen Wortsinne geht (oder gibt es doch auch hier
> Besonderheiten?), würde ich das also durchaus pragmatischer sehen als bei
> anderen Locale-Typen, wo ich für eine Reinhaltung der amtlichen
> Bezeichnungen plädiere. ;-)
Die Bezeichnung als Landkreis ist IMHO redundant und wurde deshalb
entfernt, weil diese Markierung im neueren Typ 400300000 hinzukam - und
weil auch an den fünf Stellen des AGS wie auch an der hinzugekommenen
Ebene 5 die Einstufung als Kreis deutlich genug ist.
Schönen Gruß
Martin