Was ist Frankreich?

Eine dumme Frage, oder? Man kann es auf einer Karte zeigen, es ist der Ursprungsort von Croissants und man kann sogar dorthin in den Urlaub fahren und überprüfen, dass es ein realer Ort ist.

Aber im Kontext der Auswertung von Daten, die sich auf Frankreich (und einige andere Länder) beziehen, gibt es ein paar Dinge zu beachten.

Sprache vs. Land Link to heading

Je nach organisatorischer Struktur kann es sinnvoll sein, Einheiten und Abteilungen nach Sprache zu gruppieren. Das ergibt viel Sinn für das Personalwesen. So könnte das Team, das für die Verwaltung von Frankreich zuständig ist, auch für die französischsprachigen Teile Belgiens und der Schweiz verantwortlich sein.

Jetzt höre ich schon das Klatschen von Stirnrunzeln und Sie, liebe Leser, sagen: “Warum benutzen Sie nicht einfach fr-BE, fr-CH und fr-FR?”. Lassen Sie mich so antworten:

  1. Ich benutze es, wann immer ich kann.
  2. Sogar große Player wie der Google Play Store und der Apple App Store halten sich nicht an diese Konvention, wobei der eine Bewertungen nach Land und der andere nach Sprache zählt. Dies macht es sehr schwierig, Anstrengungen und Erfolge zwischen den geografischen Standorten und den damit verbundenen organisatorischen Bemühungen zuzuordnen.

Wenn es eine französische Flagge hat, ist es dann Frankreich? Link to heading

Es gibt einige französische Überseegebiete wie Saint Martinique und Guadeloupe, die in gewisser Weise zu Frankreich gehören. Sie tragen jedoch nicht den Ländercode von Frankreich und ihre Einordnung unter Frankreich erfordert Vorwissen über diese Beziehung.

Änderung von Ländernamen Link to heading

Ländernamen ändern sich. Verlassen Sie sich nicht darauf, dass sie gleich bleiben. Warum ist das überhaupt wichtig? Einige Quellen (mit einem kritischen Seitenblick auf Firebase Analytics) verwenden Ländernamen anstelle von ISO-Codes, was bedeutet, dass Sie die Ländernamen mit den Ländercodes abgleichen müssen. Auch können sich Ihre Datenquellen zu unterschiedlichen Zeiten ändern. Auch können einige Quellen, die die Ländernamen aus politischen oder einfach selbstbestimmten PR-Gründen nicht technisch ändern, dennoch wahllos die Art und Weise ändern, wie der gleiche Name geschrieben wird, z.B. indem sie an einem Tag “United States of America” verwenden und am nächsten Tag “America, United States of”. Offensichtlich kann je nach Datenquelle, wenn sie den Namen eines Landes anstelle seines ISO-Codes verwendet, jede andere Sprache als Englisch verwendet werden.

Wie lässt sich dieses Problem lösen? Link to heading

Eine unvollständige Lösung für diese Probleme ist eine Übersetzungstabelle, in der eine Spalte eine Variation des Landesnamens und eine andere Spalte den ISO2-Code für dieses Land enthält. Listen Sie einfach alle verschiedenen Variationen aller Ländernamen in der Tabelle auf. Achten Sie besonders darauf, dass jede Variation nur einmal vorkommt.

Das Erstellen dieser Liste ist jedoch leichter gesagt als getan. Um ehrlich zu sein, habe ich noch keine wirklich gute Lösung gefunden, wie man eine solche Tabelle erstellen kann, und muss zugeben, dass ich diese Tabelle manuell über einen Zeitraum von zwei Tagen erstellt habe.

Dann habe ich einen Prozess etabliert, um sicherzustellen, dass neue Datenquellen - und möglicherweise neue kreative Schreibweisen eines winzigen Landes - ordnungsgemäß dedupliziert werden und es eine Levensthein-Distanzübereinstimmung mit allen anderen aufgezeichneten Variationen gibt, um die Notwendigkeit von Recherchen zu beseitigen.

Es gibt offensichtlich andere Länder, bei denen ähnliche oder gleiche Probleme berücksichtigt werden müssen. Ohne politisch zu sein und in der Tat postkoloniale Konflikte zu ignorieren, könnte es sinnvoll sein, Ihre Märkte entsprechend ähnlichen kulturellen und sprachlichen Umgebungen zu definieren.