Kodowanie Krajów ISO / CPC - różnice i problemy

Catalogue of Palaearctic Coleoptera
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Kodowanie Krajów ISO / CPC - różnice i problemy

Post autor: Jacek Kurzawa »

Podczas pracy nad kodami krajów zauważyłem, że różnice między kodami krajów w CPC: viewtopic.php?f=50&t=20939

a przyjętymi standardami ISO 3166: https://pl.wikipedia.org/wiki/ISO_3166-1

Są OLBRZYMIE !!!!

CPC

E Europe
AB Azerbaijan
AL Albania
AN Andorra
AR Armenia
AU Austria
AZ Azores
.......


Porównanie ISO i CPC, tylko pierwsze kraje, na A:

ISO/CPC

AD Andora / AN Andorra
AM Armenia / AR Armenia
AT Austria / AU Austria
AZ Azerbejdżan / AB Azerbaijan
PT Açores / AZ Azores

Czy ktoś orientuje się, co było podstawą przyjęcia symboli krajów przez autorów CPC?

Uporządkowanie tej symboliki nastręcza sporo trudności. Pomimo tego bałaganu uda mi się zaprowadzić porządek w bazie danych dzięki ID i przypisanym kodom wg róznych systemów. Będą więc kody wg CPC, ISO, nazwy polskie, angielskie, historyczne (np CCCP, DDR).

Czy ktoś ma doświadczenie w porządkowaniu kodowania krajów świata?
Awatar użytkownika
Krzysiek Jonko
Posty: 325
Rejestracja: środa, 7 kwietnia 2004, 10:23
Lokalizacja: Łódź
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Krzysiek Jonko »

Aktualnie obowiązuje norma ISO http://en.wikipedia.org/wiki/ISO_3166-1_alpha-2
Też miałem z tym trochę problemów, ale sam trzymam się tego standardu.
Awatar użytkownika
Krzysiek Jonko
Posty: 325
Rejestracja: środa, 7 kwietnia 2004, 10:23
Lokalizacja: Łódź
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Krzysiek Jonko »

Zadam być może głupie pytanie - ale nie bardzo wiem co to jest CPC?
Awatar użytkownika
palipa
Posty: 1142
Rejestracja: czwartek, 2 lipca 2009, 15:22
UTM: CF 34
Lokalizacja: Poland, Gdynia CF34

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: palipa »

Krzysiu bo jesteś motylarzem to dlatego
bo CPC to Catalogue of Palaearctic Coleoptera
:hi:
Paweł
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Najprościej ujmując jest to spis gatunków wraz z synonimiką i rozmieszczeniem. Kazdy takson oprócz dokładnej synonimiki ma określone rozmieszczenie za pomocą skrótów (kodów) krajów i regionów. I te oznaczenia właśnie tak dalece różnicące sie od przyjętych standardów ISO, że jesli je porównamy, to okazuje się, że róznic jest więcej niż podobieństw.

Strony wydawcy (nowy) CPC: http://www.brill.com/publications/catal ... coleoptera

search.php?keywords=CPC&terms=all&autho ... mit=Szukaj

http://www.zin.ru/Animalia/Coleoptera/rus/palecat.htm
Awatar użytkownika
João M da Costa
Posty: 1000
Rejestracja: środa, 20 października 2010, 10:49
Lokalizacja: Between the end of the world and paradise
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: João M da Costa »

J.M. pisze:Czy słusznie jest zrównywać Portugalię z Azorami?
Pewnie że tak, język jest podobny :) ale
J.M. pisze:Czy ISO nie jest bardziej pod administracyjne zagadnienia podciągane, podczas gdy oznaczenia krajów w CPC mają zastosowania bardziej biologiczne?
biologiczne to zupełne inną bajka ... inną fauna, flora, klimat ... wiec jeśli CPC zastosuje biologiczne spraw powinna być stosowane ... i Madeira to jeszcze zupełna inną bajeczka ...

Edit: jakiś tego tematu mi uciekł ...
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Jacek Kurzawa pisze:PT        Açores  /  AZ  Azores
Czy słusznie jest zrównywać Portugalię z Azorami?
Zupełnie nie na temat. Oczekuję poważnej dyskusji na temat kodów, szkoda czasu na robienie sobie jaj.
Azory to Azory a Portugalia to Portugalia. Tego oczywiście nie wolno ze sobą mylić. To dwa różne obiekty, mające taką cechę, że administracyjnie Azory należą do Portugalii. Problemów jest przy tym juz kilka - rózna pisownia, co utrudnia doszukiwanie się nazw w tabelach jak i rozumienie, czym jest Portugalia - czy krajem leżącym tylko na płw.Iberyjskim czy krajem wraz ze wszystkimi wyspami do niego należącymi. ISO nie uwzględnia Azorów jako oddzielnej jednostki dlatego Azory mają symbol PT, ale zastanawianie się czy Azory i Portugalia są tym samym to tak jak zastawianie się czy JK i JK (Ja i Jacek Kalisiak) to te same osoby, bo mają te same inicjały...

Jest duzo takich sytuacji, gdzie wyspa należy do danego kraju a gatunki wystepujące na tej wyspie są liście gatunków tego kraju, co wcale nie oznacza że wystepują na częsci lądowej. Dlatego też wybierając PT (załóżmy Portugalia) wybieramy gatunki należące i do Portugalii czesci lądowej jak i do wysp. Podobnie jest z Japonią, Rosją i Sakhalinem czy nawet Sycylią - gatunki tam wystepujące są na liscie IT mają też swoje oznaczenie ITI.
W CPC mamy UK dla Ukrainy i UKC dla Krymu (tez Ukraina). Ale mnie nie o to chodziło. PRoblem jest w samych róznicach kodów między CPC a ISO.ISO jako powszechnie obowiązujące powinno być - jak mi się wydaje - przyjęte w CPC, tymczasem autorzy nie wiem czemu zastosowali swoje oznaczenia krajów.
Teraz ja, żeby stworzyć jedną tabelę krajów muszę połaczyć oznaczenia ISO z CPC. Z tym jest masa pracy a bałagan wystepujący z oznaczeniami daje sie pewnie kazdemu mniej lub bardziej we znaki. Niedawno jeszcze Danilevskiemu BG myliła się z BU, uzywał notorycznie zamiennie raz BU raz BG.

Żeby uzmysłowić tą różnicę zadam pytanie - jakie kody (ISO, CPC) mają kraje Armenia, Azerbejdzan i Bułgaria?

Dlaczego w CPC nie użyto standardu ISO 3166?
Awatar użytkownika
João M da Costa
Posty: 1000
Rejestracja: środa, 20 października 2010, 10:49
Lokalizacja: Between the end of the world and paradise
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: João M da Costa »

Jacek Kurzawa pisze:
PT        Açores  /  AZ  Azores
Czy słusznie jest zrównywać Portugalię z Azorami?
Zupełnie nie na temat. Oczekuję poważnej dyskusji na temat kodów, szkoda czasu na robienie sobie jaj.
Chyba z tego się zaczyna dyskusji... według ISO Acores to PT i według CPC Acores to AZ lepiej jest CPC ... ISO nie odróżnij biologiczne rzecz i chyba w entomologia jest o co chodzi czy nie?
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Nie, nie chodzi o to. Z Azorami to był przykład, bo są na A i akurat weszły na początek. Róznic w kodowaniu krajów jest bardzo dużo np Bułgaria, Armenia - tu nie ma tego problemu co z Azorami. To nie chodzi o administracyjny podział czy biologie, ten wątek jest poświęcony zupełnie innemu problemowi :no:
Jacek Kurzawa pisze: Czy ktoś orientuje się, co było podstawą przyjęcia symboli krajów przez autorów CPC?

Czy ktoś ma doświadczenie w porządkowaniu kodowania krajów świata?

Dlaczego w CPC nie użyto standardu ISO?
Awatar użytkownika
João M da Costa
Posty: 1000
Rejestracja: środa, 20 października 2010, 10:49
Lokalizacja: Between the end of the world and paradise
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: João M da Costa »

A mnie też nie mi chodziło o Azores ale o fakt które ISO podobno nie odróżnię Biologie a CPC odróżni. O inny kraj ja nie wiem ale np. o Acores wiem, ISO: Azores - PT według mnie wielki błedy
CPC: Azores - AZ dobrze, ale oczywiście o sprawie związane z biologie - entomologie, ponieważ jeśli chodzi granicy administracyjne/polityczne itp. no to ISO jest lepsze.

Już Pan wie, może Pan usunąć mój komentarze, jeśli nie pasują do tematu.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Porównanie kodów ISO i CPC wygląda tak:

46 kodów różni się
38 kodów jest takich samych

Jak widać ponad połowa kodów CPC nie pokrywa się z przyjętym standardem ISO.

Załączam fragment tabeli, która zawiera wszystkie kody ISO i CPC.
Załączniki
ISO-CPC.gif
Pokaż obraz w oryginalnym rozmiarze (57.12 KiB)
Rafał Ruta
Posty: 250
Rejestracja: poniedziałek, 12 kwietnia 2004, 11:26
Lokalizacja: Wrocław
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Rafał Ruta »

Przepraszam, ale na czym polega problem?
Równie dobrze można kraje zakodować za pomocą pisma klinowego jeśli tylko będzie to odpowiednio objaśnione. A w każdym tomie CPC są mapki i wykazy stosowanych skrótów.
Wątek trąca lekką (?) paranoją.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Uważasz więc, że unifkacja kodów jest zbędna i każdy może sobie kodować kraje jak chce. Nie ma więc problemu, jesli w jakiejś kolejnej pracy jakiś autor X napisze własne kody. Ok, mysląc w ten sposób problemu rzeczywiscie NIE MA.
Rafał Ruta pisze:Przepraszam, ale na czym polega problem?
...
Wątek trąca lekką (?) paranoją.
To jest tak, jak się nie rozumie problemu.

Skoro jednak uzyłes słowa "paranoja", to może wyjaśnię, dlaczego tak zależy mi na unifikacji kodów. Korzystając z róznych źródeł, opracowań zbiorczych list rozmieszczeń gatunków jestem zmuszony operować kodami państw. Do wyszukiwania używa się kodów (to chyba jest zrozumiałe?) a w przypadku różnego kodowania jest problem. To zmusza mnie do znalezienia kodów i pisowni wszystkich wymienianych krajów i regionów wymienianych w publikacjach. System ISO wydaje się być przyjęty po to, by zaprowadzić porządek w kodowaniu krajów.

Oczywiście problemu ze znalezieniem odpowiednich kodów krajów i regionów nie ma. Na potrzeby bazodanowe za wszystko odpowiada klucz ID, do którego mozna przypisać wiele wartości. W tej chwili kwerendy posługują się kodami krajów w celu wyszukania odpowiednich wartości, wkrótce bedą posługiwały się juz tylko "ID kraju".

Chciałem zwrócić tym wątkiem uwagę na zupełny brak standardów i rozbieżności między CPC, warto o tym wiedzieć. Do niedawna myslałem, że jest jakiś ogólny standard, ale okazuje się, że standard może i jest, ale nie jest stosowany. Mam wrażenie, że chyba tylko ja na to zwróciłem uwagę?
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Z innej strony: buduję bazę obejmującą gatunki z całego świata. Stoję przed dylematem, jakie kodowanie krajów przyjąć? Jakie wybrać oznaczenie np. dla Bułgarii: BG czy BU? Czy może dowolny symbol/znaczek wg sugestii Rafała Ruty? Czy naprawdę nikt do tej pory nie spotkał się z tym problemem? :wlosy:

Czy autorzy CPC nie pomysleli o standardach? Może po prostu nie trzeba się tym wcale przejmować?

To może jeszcze pytanie do tych osób, które publikując coś używają kodów krajów. Jaki system wybieracie: ISO, CPC, jeszcze inny, swój? W tym zakresie panuje całkowita dowolność?
Awatar użytkownika
Robert Zoralski
Posty: 775
Rejestracja: wtorek, 10 kwietnia 2007, 23:29
Specjalność: Syrphidae
Lokalizacja: Reda
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Robert Zoralski »

Wydaje mi się, że autorzy CPC nie zdecydowali sie przyjąć standardu ISO, ponieważ takie obszary (nie kraje) geograficznie jak właśnie Azory, Carnary Islands, Spitzbergen, Faeroe Islands czy wyszczególnione różne obszary Rosji i Chin wydały im się istotne w opracowaniu (być może chodzi też o kody używane we wcześniejszych opracowaniach) i poprzyznawali kody według własnego uznania - wszystkie te obszary nie są ujęte w standardach ISO. Spodziewałbym się konsekwentnie wyszczególnienia Krety, Sycylii itd, ale tego akurat nie zrobili.

Z podobnego powodu posługujemy się u nas w entomologii krainami geograficznymi a nie województwami.

Jest jak jest. Jacek, dla Twoich celów to nie ma innej rady jak dokonać wyboru - albo posługiwać się do własnych celów standardem ISO (ze względu na to, że potem to można zintegrować z czymkolwiek innym) albo CPC. Mapowania dobrze nie zrobisz, bo są przypadki, że kraj ISO ma kilka różnych symboli w CPC (np: Rosja, Chiny, Portugalia+Azory) i odwrotnie (np: Jugosławia z Serbią i Carnogórą to różne kraje pod jednym symbolem w CPC). To oznacza, że jeśli chcesz mieć mocno uniwersalnie to będziesz musiał na poziomie _gatunku_ trzymać dwie listy krajów w którym wystepują. Jedną z kodami CPC, drugą z ISO. :(

Pozdrawiam
Robert
Awatar użytkownika
Robert Zoralski
Posty: 775
Rejestracja: wtorek, 10 kwietnia 2007, 23:29
Specjalność: Syrphidae
Lokalizacja: Reda
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Robert Zoralski »

P.S. Oczywiście jest bardziej szczegółowy standard - ISO-3166-2 (jest to rozszerzenie ISO-3166-1).

Dla Polski akurat wygląd tak i tak jest dla każdego kraju z pierwszej listy:
http://pl.wikipedia.org/wiki/ISO_3166-2:PL

Tylko to jest znowu zbyt duże rozdrobnienie dla takich celów jak entomologiczne.

Robert
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Robert Zoralski pisze:Wydaje mi się, że autorzy CPC nie zdecydowali sie przyjąć standardu ISO, ponieważ takie obszary (nie kraje) geograficznie jak właśnie Azory, Carnary Islands, Spitzbergen, Faeroe Islands czy wyszczególnione różne obszary Rosji i Chin wydały im się istotne w opracowaniu (być może chodzi też o kody używane we wcześniejszych opracowaniach) i poprzyznawali kody według własnego uznania - wszystkie te obszary nie są ujęte w standardach ISO. Spodziewałbym się konsekwentnie wyszczególnienia Krety, Sycylii itd, ale tego akurat nie zrobili.

Pozdrawiam
Robert
Standard ISO nie jest tak uszczegółowiony jak CPC, więc pojawiła się potrzeba utworzenia kodów dla mniejszych jednostek terytorialnych. W CPC jest zresztą mowa o poziomach szczegółowości. Ale tu nie chodzi o to, tylko o przyjęcie symboli krajów zgodnie z obowiązującymi standardami. One obowiązują :w jaimś zakresie", warto może temu się przyjrzeć (nie sprawdzałem).

Na stronie https://pl.wikipedia.org/wiki/ISO_3166- ... ISO_3166-1 na dole mozna znaleć wiele poprawek pod nazwą"Informator". Ostatnią jest zmiana nazwy Hungary:
PDF: http://www.iso.org/iso/iso_3166-1_nl_vi ... ungary.pdf

Do tego każdy kraj posiada swój numer kodowy i swoją nazwę tzw. "Local short name(s)". To wszystko jest do ogarnięcia, zestawienia wszystkiego w jednej tabeli.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Robert Zoralski pisze:Mapowania dobrze nie zrobisz, bo są przypadki, że kraj ISO ma kilka różnych symboli w CPC (np: Rosja, Chiny, Portugalia+Azory) i odwrotnie (np: Jugosławia z Serbią i Czarnogórą to różne kraje pod jednym symbolem w CPC). To oznacza, że jeśli chcesz mieć mocno uniwersalnie to będziesz musiał na poziomie _gatunku_ trzymać dwie listy krajów w którym wystepują. Jedną z kodami CPC, drugą z ISO.
Zamierzam zrobić, porządnie.
Piszesz:
bo są przypadki, że kraj ISO ma kilka różnych symboli w CPC
tak, bo to wynika z ogólnego podziału ISO, który nie uwzględnia drobniejszych terytoriów (a może uwzglęnia, tylko nie dotarłem do takiej tabeli). Ale to nie jest problem, te regiony bedą miały swoje ID i swój symbol (i to nie będzie pismo klinowe). Jak można zauważyć, jest wiele numerów kodowych nie ujętych w Kompletnej liście Państw
https://pl.wikipedia.org/wiki/ISO_3166- ... ISO_3166-1
bo mniejsze terytoria należą do tych państw. I pewnie mają już nadane swoje ID, trzeba je tylko odnaleźć.

Każdy obiekt ma swoj unikalny ID, kolumne ISO i CPC, w której mogą być dowolne wartości. Mamy jeszcze kolumnę numeryczną, bo i taki kod jest przypisany krajowi wg normy (bo już myslałem, że nadam swoje, ale nie - jest porządek!). Jesli mamy przypadek że Sudan został podzielony na Sudan Południowy SS i Sudan SD http://www.iso.org/iso/nl_vi-10_south_sudan.pdf to jest właśnie taki przypadek, kiedy poprzedni podział obejmuje dwa nowe. Unifikacja symboli jest potrzebna nie z nudów, tylko z konieczności posługiwania się listami, które przygotowywały podmioty wg swojego widzimisię. Komputer wymusza uporządkowanie tego, to jest konieczność nie fanaberia.
Awatar użytkownika
Grzegorz Banasiak
Posty: 4470
Rejestracja: poniedziałek, 2 lutego 2004, 23:27
UTM: DC45
Lokalizacja: Skierniewice
Podziękował(-a): 2 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Grzegorz Banasiak »

Rafał Ruta pisze:Przepraszam, ale na czym polega problem?
Równie dobrze można kraje zakodować za pomocą pisma klinowego jeśli tylko będzie to odpowiednio objaśnione. A w każdym tomie CPC są mapki i wykazy stosowanych skrótów.
Wątek trąca lekką (?) paranoją.
Podzielam zdanie Kolegi. Moim zdaniem dużo lepszym pomysłem jest opracowanie własnych kodów (cyfry, litery, mieszane...) na potrzeby konkretnej bazy danych. Unifikacja ma sens jedynie w wypadku łączenia wielu baz, w różnych miejscach świata. Wtedy rzeczywiście istnieje konieczność unifikacji ale też na potrzeby konkretnego projektu. Zgodność z ISO nie ma tu najmniejszego lub wręcz zerowe znaczenie. Z drugiej strony popadanie w pułapkę (lansowaną w książkach, głównie przez teoretyków informatycznych) relacyjności generuje błędy logiczne w aplikacjach.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

No właśnie Grzegorzu łączę kilka baz JUŻ ISTNIEJĄCYCH z różnym kodowaniem państw (światowe, CPC i inne). Najpierw muszę więc to wszystko sprowadzić do wspólnego mianownika, co jest dośc skomplikowane, bo mamy różny poziom szczegółowości, stare i nowe terytoria a także różne języki (i błędy pisowni). Dlatego lepiej jest zrobić sobie jedną tabelę zawierającą wszystkie terytoria a potem w niej sobie tworzyć kolumny własne. Do tej kolejności jestem zmuszony.
Grzegorz Banasiak pisze:Z drugiej strony popadanie w pułapkę (lansowaną w książkach, głównie przez teoretyków informatycznych) relacyjności generuje błędy logiczne w aplikacjach.
No i takie myślenie leży u podstaw istnienia wielu systemów kodowania. Każdy wymyśla pod siebie, ale gdy się potem publikuje to puszcza się te swoje "wymysły" w świat.
I dlatego samochody mają ponalepiane jakieś literki wg standardu X, sportowcy na koszulkach w Y, entolomolodzy w Z a świat pracuje na ISO.
Ja nie optuję za ISO, tylko za uporządkowaniem kodowania, przecież to nie jest jakieś arcytrudne?

Jedna tabela nie powoduje żadnych relacji i nie ma obaw, że coś tam się rozleci.
Awatar użytkownika
Grzegorz Banasiak
Posty: 4470
Rejestracja: poniedziałek, 2 lutego 2004, 23:27
UTM: DC45
Lokalizacja: Skierniewice
Podziękował(-a): 2 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Grzegorz Banasiak »

Jacek, rozmiar tego projektu przeraża nawet mnie, programującego od 25 lat !
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Nie wierzę! Ale ta tabela jest juz na ukończeniu, robię ją około 30 godzin jeszcze jakieś 10 i bedzie gotowa w 4 jezykach. To nie jest takie skomplikowane. Jest tylko sporo pułapek i miejsc w których należy poczytać i sie zastanowić. Mamy mieszankę polityki, czasoprzestrzeni i twórczości wielu osób. Bałagan radosnych entomologów dopełnia kolorytu.
Marek Hołowiński
Posty: 5054
Rejestracja: wtorek, 4 grudnia 2007, 13:09
UTM: FB68
Specjalność: Sesiidae
Lokalizacja: Hańsk
Podziękowano: 2 times

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Marek Hołowiński »

A ja czytam i nie bardzo rozumiem po co Ci Jacku to potrzebne. Przecież granice państw, czy innych form podziału administracyjnego są sztuczne. Zbyt szybko ulegają zmianom.
Już bardziej bym widział odniesienie list gatunków do regionów geograficznych, ale i tu granice są bardzo rozmyte z szerokimi strefami przejściowymi.
A tak w ogóle do czego to ma służyć?
Awatar użytkownika
Robert Zoralski
Posty: 775
Rejestracja: wtorek, 10 kwietnia 2007, 23:29
Specjalność: Syrphidae
Lokalizacja: Reda
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Robert Zoralski »

Jak dla mnie autorzy CPC nie mieli pojęcia o kodach ISO i przydzielili nazwy geograficzne jak chcieli, byle kod dwuliterowy był zbliżony do nazwy kraju (tak przy okazji ISO powstało w taki właśnie sposób, tyle, że zrobiła to konkretna instytucja). To co jest w CPC nie przypomina żadnego ze znanych mi standardów.

Ja na Twoim miejscu (trochę uszczegółowię swoją myśl - w których miejscach przejście na kody ISO może być kłopotliwe):
1. używałbym kodów ISO (bo to standard) wszędzie gdzie to jest oczywiste, tzn. dla większości krajów - wystarczy zamapować 1:1 (chyba to miałeś w planach) i używać poprawnych dwuliterowych kodów ISO zamiast symboli krajów CPC. Przykład: Bułgaria to BG (wg ISO) i takiego kodu bym użył w jakimkolwiek systemie, nawet w excelu.
2. problem z symbolami CPC których nie ma w ISO (np: wspomniane Azory) - tu można samodzielnie przydzielić kody ISO (jak tylko chcesz) z puli AA, QM do QZ, XA do XZ i ZZ. Jest gwarancja, że nigdy w przyszłości nie zostaną przydzielone żadnym nowym krajom w ISO. Można też zrobić inaczej i po prostu włączyć te obszary do ich krajów macierzystych, czyli np: Azory do Portugalii objąć jednym kodem PT.
3. problem z symbolami CPC które obejmują kilka krajów (kodów ISO) - i to jest tym prawdziwym kłopotem. Nie patrzyłem czy jest więcej takich przypadków. Bo nie można tak po prostu przypisać gatunku do wszystkich tych krajów (kodów ISO) bo nie wiadomo czy we wszystkich tych krajach występuje. Tak teraz patrzę, że wspomniana przeze mnie Jugosławia kłopotem nie jest bo to teraz po prostu nazywa się Serbia i Czarnogóra, ale taki "Katar (incl. United Arab Emirates)" czyli 2 kraje oznaczone w CPC jednym symbolem QA już jest kłopot.

Robert
Awatar użytkownika
GrzegorzGG
Posty: 2636
Rejestracja: sobota, 5 maja 2012, 21:49
UTM: CA51
Specjalność: Heteroptera
Lokalizacja: Bielsko-Biała
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: GrzegorzGG »

Rafał Ruta pisze:Przepraszam, ale na czym polega problem?
Równie dobrze można kraje zakodować za pomocą pisma klinowego jeśli tylko będzie to odpowiednio objaśnione. A w każdym tomie CPC są mapki i wykazy stosowanych skrótów.
Wątek trąca lekką (?) paranoją.

Pozwolę sobie na wtrącenie. Ja widzę problem w sytuacji, w której publikacja zawiera kod dajmy na to XY, a ów kod znaczy w zależności od standardu kraj K1 lub K2. Nie wiem czy istnieją takie kody dające podobną rozbieżność, ale jest dość spora niedogodność przy interpretacji danego kody z samej publikacji. Wówczas publikacja musi zawierać jakąś mapkę lub indeks znaczeń kodów regionów/państw.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Marku, robię bazę danych, potrzebuję określić kody dla wszystkich regionów. Ponieważ są różne "szkoły" szukam najlepszego rozwiązania.

Robert, doskonale mnie rozumiesz.
Robert Zoralski pisze:Jak dla mnie autorzy CPC nie mieli pojęcia o kodach ISO i przydzielili nazwy geograficzne jak chcieli, byle kod dwuliterowy był zbliżony do nazwy kraju (tak przy okazji ISO powstało w taki właśnie sposób, tyle, że zrobiła to konkretna instytucja).
Tak, i to zrobiono duzo wcześniej. Nie ma widocznie żadnego obowiązku uzywania standardów, jak to pisał Rafał Ruta, można pismem klinowym.
1. Tak
2. Też tak myślę, ale najpierw, zanim zacznę wymyslać kody państw poszukam czy już to nie zostało wymyślone. Docelowo będę używał ID panstw a kody wyświetlą się jakie bądź, np CPC, ISO, KFP czy "moje"... Nazwy: angielskie, polskie, regionalne (tzw. endonimy) - to podstawa.
3.
problem z symbolami CPC które obejmują kilka krajów (kodów ISO) - i to jest tym prawdziwym kłopotem.
Problemu nie ma. CPC jest dobrze uszczegółowione i tu nie ma miejsca na dwuznaczności. Podaj przykład, bo ja takiego nie widzę. Kody CPC masz tutaj:
viewtopic.php?f=50&t=20939

Chyba że masz na mysli takie kraje, które w CPC mają jeden kod a w ISO kilka. Prawdę mówiąc nie widzę takiego przypadku. Zresztą zawsze podaje się to co jest wiadomo, bez własnych interpretacji. Jeśli do bazy -załóżmy - włączę podział z CPC to z automatu muszą pojawić się wszystkie regiony z CPC, np sześć regionów Indii czy podział Chin na 8 regionów (żeby nie utracić informacji o regionie). Dany region będzie przypisany do kraju i w ten sposób rozwiąże sie podział kraju (administracyjnie) na mniejsze jednostki.

Acha, chyba chodziło Ci w zamyśle o Jugosławię. No to nie ma problemu.

Na zakonczenie kilka linków, które pomagają usystematyzować nazwy państw i regionów.
i tu można znaleźć linki do wielu publikacji w pdf-ach
https://pl.wikipedia.org/wiki/Komisja_S ... j_Polskiej

a tu mamy zeszyty do pobrania: http://ksng.gugik.gov.pl/wydawnictwa_ngs.php

Grzegorz - właściwie teoretycznie w każdej pracy bedą podane skróty, jesli jednak ktoś wyrywkowo będzie się posługiwał jakąś checklistą - no to może mieć spory kłopot, masz trochę racji. A jesli jeszcze będzie miał przyzwyczajenia wynikające z operowania standardowymi kodami państw to może mieć duzy osobisty problem, bo zawsze będzie się mylił przy kodach, które występują zarówno w ISO jak i w CPC np GE, DE, IR czy nawet UK.
Awatar użytkownika
Robert Zoralski
Posty: 775
Rejestracja: wtorek, 10 kwietnia 2007, 23:29
Specjalność: Syrphidae
Lokalizacja: Reda
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Robert Zoralski »

Podaj przykład, bo ja takiego nie widzę.
Kilka jest:
France (incl. Corsica, Monaco) -> dwa osobne kraje: Francja i Monako
Italy (incl. Sardinia, Sicily, San Marino) -> dwa osobne kraje: Włochy i San Marino
Qatar (incI. United Arab Emirates) -> dwa osobne kraje: Katar i Zjednoczone Emiraty Arabskie /choc tu namieszane - na liscie jest Arab Emirates)
Serbia and Montenegro -> dwa osobne kraje Serbia i Czarnogóra /choc tu namieszane - na liscie CPC jest tez samo Montenegro; do tego w pierwszym tomie CPC uzyty zostaljest jeszcze inny kod YU - nie masz go Jacku na liscie /
China: Southeastern Territory (incl.Macao, Hongkong) -> trzy osobne kraje: Chiny, Hong Kong i Makau

W sumie jakos i to pewnie da sie ominac.

Pozdrawiam
Robert
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Autorzy CPC odniesli sie we wstępie do podziału Jugosławii (ja w spisie podałem YU, jest w CPC6 na str 14). Rzeczywiscie dołożyli (zdublowali) Montenegro, w Cerambycidae to jest tylko 5 gatunków. Być może w innych tomach miało to jakieś większe znaczenie.

Przypadki, gdzie w CPC ujęto pod jednym symbolem kilka mniejszych regionów jest tym samym co w przypadku gdy ISO jednym symbolem okresla kilka mniejszych regionów (pisalismy o Portugalii i Azorach czy Hiszpanii i Wyspach Kanaryjskich. Tu wystarczające jest nadanie ID tym najmniejszym jednostkom i podpięcie ich pod regiony większe (operacja w bazie). W każdej chwili możemy móc (mieć możliwość, okazję lub chcieć) uszczegółowić dane, więc te "jednostki" mogą się przydać.

Skoro autorzy CPC nie podają, czy dany rekord pochodzi z Francji czy z Monaco, to musimy przyjąć że nie wiemy. w ten sposób liczba gatunków w Monako jest taka sama jak we Francji, wg CPC - innego rozwiązania nie ma. Nie ma pdstaw do wykluczenia gatunku z Francji ani z Monako. Jesli jakiś gatunek będzie tylko w jednym z tych państw, powinien on zostać uszczegółowiony.

No dobrze, a co z Sycylią Kretą? Tu jest prosto. CPC nie daje takich informacji, ale znajdę je w innym źródle (Danilevsky, inne). Tak więc w mojej bazie są takie jednostki jak Sycylia, Kreta.

CPC nie daje nam odpowiedzi, co jest na Sycyli czy na Krecie, czego nie ma na części lądowej (Włoch czy Grecji). Wg CPC wyswietli mi się to co wiadomo: IT lub GR. Jesli jednak uszczegółowię informację ze źródła 2 (Danilevsky), wtedy gat. z ITI czy GRC wyjdzie wtedy, gdy o to spytam (bazę). Jesli nie wprowadzę takich informacji, bedę miał to co wprowadzę czyli CPC.


Z Chinami jest podobnie - o ile wiadomo, z której jednostki był podany gatunek, to ta informacja jest podana. Jesli wiemy, ze gat jest w China: Southeastern Territory (incl.Macao, Hongkong) to wiemy tylko tyle, nic wiecej o tym, czy on jest w Macao czy Honkongu. W bazie powinny sie jednak te kraje jako jednostki znaleźć i w razie dysponowania dokładnymi danymi będzie mozna je uszczegółowić.

Problem jednak jest, bo bazy nie myslą, i jesli dane nie będą uszczegółowione to baza bedzie tak wyrzucała dane, ze wszystkie gatunki z Grecji wyskoczą dla Krety - albo żaden, jesli sie nic nie wprowadzi. Jest wiele takich miejsc, gdzie trzeba uważać, dlatego z taką uwagą projektuję tabele regionów, żeby potem nie powychodziły głupoty.
Awatar użytkownika
Wujek Adam [†]
Posty: 3305
Rejestracja: środa, 30 maja 2007, 20:17
UTM: DC98
Specjalność: Cerambycidae
Lokalizacja: Warszawa

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Wujek Adam [†] »

Tworzenie tego typu kodyfikacji jest tylko jedną z prób ogarnięcia i poszufladkowania rzeczywistości. ;-)
Próbą - w przypadku kodów ISO, o podłożu politycznym, a nie przyrodniczym, i stąd zaliczanie danych rejonów zgodnie z ich aktualną przynależnością państwową, bez zwracania większej uwagi na ich odrębność biogeograficzną, jak to ma miejsce np. w przypadku hiszpańskich Azorów. Tymczasem autorzy PCP wychodzą z innych założeń, a ich klasyfikacja ma coś innego na celu, i stąd właśnie wynikają nieuniknione rozbieżności.

Naszą prywatną sprawą jest którym z tych instrumentów się posłużymy? Oba są niedoskonałe, lecz do celów przyrodniczych, przynajmniej w moim odbiorze, stosowniejszy wydaje się PCP.
PCP po przeróbkach! ;-)
Na mój gust znacznie czytelniejsze i konkretniejsze byłoby wprowadzenie dodatkowej symboliki odnoszącej się np. do wysp. I tak:
ITS - to byłaby włoska Sycylia,
FRC - francuska Korsyka,
GRR - grecki Rodos,
ESA - hiszpańskie Azory,
i tak dalej.

Rozumiem Jacku, że Ty chcesz sięgnąć po gotowe narzędzie, a nawet narzędzia. Lecz w tym przypadku nie wepchniesz "dużego dżeka" do gniazdka USB, ani nie stworzysz dobrze działającej "przelotki", i najprawdopodobniej będziesz musiał posługiwać się oboma systemami równorzędnie, zaniechawszy prób godzenia ich na siłę, bo po prostu pogodzić się ich nie da!

A jeszcze inną sprawą jest ulepszenie PCP, lub ewentualnie stworzenie własnego systemu, który spełniałby Twoje (a zapewne nie tylko Twoje) oczekiwania w interesującym Cię względzie. :birra:
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Wujek Adam pisze: Na mój gust znacznie czytelniejsze i konkretniejsze byłoby wprowadzenie dodatkowej symboliki odnoszącej się np. do wysp. I tak:
ITS - to byłaby włoska Sycylia,
FRC - francuska Korsyka,
GRR - grecki Rodos,
ESA - hiszpańskie Azory,
i tak dalej.
Dyskusja jest wielowątkowa. Moje pytania pozostały bez odpowiedzi ale liczę, że chociaż na część z nich ktoś będzie potrafił ich udzielić.

Co ja zrobię w tej sytuacji to jest zupełnie inna historia, jesli okaże się, że regiony kodów nie mają to je po prostu wymyślę i będę używał. Akurat w przypadku Europy nie trzeba ich wymyślać od nowa, bo uzywam ich od dawna stosując rozmieszczenie Cerambycidae ze stron M.Danilevskiego. Kody takie pojawiły się już w 1997 roku (Althoff, Danilevsky), więc jest propozycja, są stosowane: http://www.cerambycidae.net/europe.pdf

Sycylia to ITI, Corsica FRC. Kodów Rodos i poszczególnych wysp z Wysp Kanaryjskich nie kojarzę, jeszcze nie szukałem.

PS. CPC nie PCP.
Awatar użytkownika
Wujek Adam [†]
Posty: 3305
Rejestracja: środa, 30 maja 2007, 20:17
UTM: DC98
Specjalność: Cerambycidae
Lokalizacja: Warszawa

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Wujek Adam [†] »

Jacek Kurzawa pisze:(...)
PS. CPC nie PCP.
:D
Oczywiście! Popełniłem czeski błąd.

Wychodzi chyba na to, że ze swymi pytaniami powinieneś się zwrócić do kogoś innego niż tutejsi Userzy, i że chyba nikt tu się nie zajmuje i nie przejmuje tym tematem na takiej płaszczyźnie jak Ty.

Ps. A dlaczego Sycylia w CPC ma kod "ITI" a nie ITS, to kompletnie nie rozumiem, podobnie jak i nazwanie Bułgarii "BU" :wlosy:
Lecz na tego rodzaju pytania satysfakcjonujących odpowiedzi mogą udzielić zapewne jedynie twórcy tych kodów.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Jesli się wie, że autorzy CPC mogą tworzyć kody dowolnie to wtedy przyjmuje się je bez pytań, tak samo jak akceptuje istniejący bałagan, który zdaje się nikomu zupełnie nie przeszkadzać. Z drugiej strony widzę instytucje zajmujące się ustalanie norm, sama Unia raczy nas masą ustaleń, które musimy zaakceptować. Dziwi mnie brak staranności w dążeniu do wypracowania standardów, ale może to wynika z mojego przekonania, że do standardów należy dążyć. Temat wydaje mi się ciekawy, chociaż jak przeczuwam - dla niektorych czytelników może być zupełnie niezrozumiały albo własnie postrzegany jako popadanie w paranoję :mysl:
No cóż, Panowie, pochyleni nad mikroskopami, dla wielu ludzi z tego świata jestescie całkowicie "nierozumiani" (by nie rzec dosadniej). Kwestia tylko innej perspektywy. Dlatego niech każdy zajmuje się swoimi "problemami", które dla niego są problemem. Dla mnie kodowanie powoli staje się jasne, problem będzie rozwiązany.
A potem będzie jakiś następny... :laugh: :ses :read:
Awatar użytkownika
Wujek Adam [†]
Posty: 3305
Rejestracja: środa, 30 maja 2007, 20:17
UTM: DC98
Specjalność: Cerambycidae
Lokalizacja: Warszawa

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Wujek Adam [†] »

A to już są peryferyjne, pozawątkowe dywagacje. ;)
Bałagan i chaos rządzą światem, i to nie tylko unijnym!
Gdzie są standardy dotyczące opisywania nowych taksonów?
Gdzie są normy jasno i precyzyjnie określające co i komu wolno, a czego nie, a propos gatunków chronionych?

Rób Jacku swoje i opieraj się na własnych standardach.
I miej świadomość, że w tym względzie częstokroć będziesz kompletnie niezrozumiały. ;-)

I jeszcze o CPC:
Wiem, że masz dobry kontakt z twórcami tej kodyfikacji. Nie możesz ich zapytać czym się kierowali wymyślając własne skróty, które w wielu przypadkach w nieuzasadniony sposób, a ponadto wbrew logice i konsekwencji, odbiegają od kodyfikacji ISO?
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Spytam, taki mam zamiar. Może tu jest jakaś logika.
Awatar użytkownika
Wujek Adam [†]
Posty: 3305
Rejestracja: środa, 30 maja 2007, 20:17
UTM: DC98
Specjalność: Cerambycidae
Lokalizacja: Warszawa

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Wujek Adam [†] »

I to będzie chyba najlepszym krokiem, bo nie ma jak pytanie u źródeł. :tak:

Może w ten sposób na coś wpłyniesz i coś ulepszysz?
Spowodujesz dyskusje, a może refleksje i konkretne działanie?
Oby!
Trzymam w tym względzie za Ciebie kciuki! :ok:
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Rafał Ruta pisze:Przepraszam, ale na czym polega problem?
Równie dobrze można kraje zakodować za pomocą pisma klinowego jeśli tylko będzie to odpowiednio objaśnione. A w każdym tomie CPC są mapki i wykazy stosowanych skrótów.
Wątek trąca lekką (?) paranoją.
Właśnie ukazało się nowe wcielenie CPC8w którym autorzy dostrzegają ten problem (jednak jest, to nie tylko mój wymysł!) i piszą o nim tak:
Geographic distribution
We have decided to follow, for the moment, the system used in the last two volumes of the CPC. It is
perhaps unfortunate that the editors of this work decided to develop their own acronym system, when there
were at least two widely accepted international standards that could have been used with advantage
: the
ISO 3166 Alpha-2 Code (https://www.iso.org/obp/ui/#search/code//), and the TDWG World
Geographical Scheme for Recording Plant Distributions (http://www.tdwg.org/standards/109), which,
despite its name, is perfectly applicable to animals.
Jak widać - szkoda, że użyli własnego systemu..... kolizyjnego z szeroko używanym ISO.

Strona z kodami krajów ISO jest ciekawa https://www.iso.org/obp/ui/#search/code//

Jak już pisałem wcześniej, różnice które wynikają z frywolnego przyjęcia kodów krajów przez autorów CPC są brzemienne w skutkach. W zastosowaniu w bazie danych poradziłem sobie z tym problemem jakoś. Roboty przez to było dużo, kilka dni. Korzyść taka, że moja baza wyszukuje po wszelkich nazwach, kodach fragmentach nazw, połaczyłem bazy CPC ze światowymi. I po to mam tabelkę. Teraz jeszcze pomyslę o dołożeniu cyfr wg strony https://www.iso.org/obp/ui/#search/code// - bazy danych tak lubią.

Oczywiscie nie ma problemu, gdy się uzywa tylko jednego źródła i pracuje tylko na nim w oderwaniu od reszty, wtedy symbolika może byc nawet pismem klinowym, jak komu wygodnie.
Ja (stety/niestety) używam równolegle CPC6 (Excel, Access) i bazy światowej TITAN (którą posiadam w ACCESS w oryginale) a ponieważ pochodzą z różnych źródeł są niekompatybilne ze sobą pod wieloma względami.

PS. Tematu nie chcę drążyć, bo właściwie wszystko chyba na ten temat zostało tu napisane. Ot, widząc komentarz w CPC przypomniał mi się ten wątek, co prawda sprzed trzech lat, ale akurat tą moją tabelkę (kodowanie krajów) obrabiałem w tym tygodniu.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Róznice w Kodach Krajów ISO / CPC

Post autor: Jacek Kurzawa »

Po 3 latach czytam i z perspektywy czasu widzę, że może da się to jakoś łatwo wytłumaczyć, spróbuję.
Rafał Ruta pisze:Przepraszam, ale na czym polega problem?
Równie dobrze można kraje zakodować za pomocą pisma klinowego jeśli tylko będzie to odpowiednio objaśnione. A w każdym tomie CPC są mapki i wykazy stosowanych skrótów.
Wątek trąca lekką (?) paranoją.
Marek Hołowiński pisze:A ja czytam i nie bardzo rozumiem po co Ci Jacku to potrzebne. Przecież granice państw, czy innych form podziału administracyjnego są sztuczne. Zbyt szybko ulegają zmianom.
A tak w ogóle do czego to ma służyć?
Już tłumaczę krótko: Rafał, jeśli korzystamy tylko z jednego źródła (czyli np. z CPC) to masz rację – symbolika i podziały są opisane w każdej pracy i problemu nie powinno być z przyswojeniem sobie danych symboli, skrotów, nazw itd. Mnie chodziło tu o scalenie danych pochodzących z dwóch różnych systemów. Dwóch–różnych baz danych, o czym za chwilę. W odpowiedzi do Marka – chodzi o pracę nad materią już zastaną. Ogromnym problemem jest spinanie ze sobą dwóch dużych zasobów bazodanowych w oparciu o niejeden (!) klucz – bo tu jest kolejny problem, niewidoczny z perspektywy użytkownika problem. Są bowiem nie tylko dwa różne systemy kodowania państw ale także dwie różne regionalizacje z różnym poziomem szczegółowości. Dwie bazy danych wymagały ode mnie takich zabiegów, by stały się ze sobą kompatybilne. To było zadanie informatyczne i to dość karkołomne, wymagające dużego nakładu pracy. Dla przykładu: Krym może mieć kilka różnych symboli w zależności od systemu kodowania a także należeć do dwóch państw w zależności od systemu politycznego i leżeć w dwóch róznych regionach w zależnosci od przyjętego systemu zoogeograficznego. Inny przykład: Cypr może mieć dwa symbole i należeć do dwóch różnych regionów. A jeszcze gorzej jeśli to jest wyspa a niam są dwa państwa które mają rózne symbole w różnych systemach i jeszcze do tego jedno z nich leży na dwóch kontynentach i w dwóch regionach…. A to tylko jedna wyspa.

Relacyjne bazy danych mają to do siebie, że aby się "widziały wzajemnie" czyli współpracowały ze sobą to muszą mieć wspólne pola-klucze wg ktorego zepną sobie dane. W tym przypadku jest to dość skomplikowane zadanie, bo dwie bzy są wlasciwie kompletnie różne. I na domiar wszystkiego bardzo zasobne. Ilość wierszy samych Lamiinae to ponad 100 000, kilkadzisiąt kolumn... z tym sobie nie radzą stosunkowo silne komutery a nawet cale programy. Spróbujcie otworzyć Excela i wkleić do niego tabelkę z ponad 100 000 wierszy....

Ale po co to wszystko?
Celem była agregacja danych w taki sposób, aby z różnych perspektyw perspektyw można było posługiwać się połączonymi bazami danych A i B. Z powodu dużej ilości państw, regionów, języków pisowni państw (uwzględniłem) pracy było dużo ale jak dla mnie warto było, bo uzyskałem narzędzie w postaci połączonej bazy gatunków świata z CPC. Gdyby pracować na dwóch bazach osobno tego problemu by nie było.
Niestety, czas płynie, bazy się dezaktualizują i brak czasu nie pozwala mi ciągłe aktualizacje. Liczyłem się z tym, więc nie mam z tym problemu, że mam takie narzędzie. Baza Titan (G.Tavakiljan, któremu poświecono najnowszy CPC2020) i CPC w bazie danych był moim celem, osiągnąłem go w 2017 r. i wielokrotnie przysłużył mi się w różnych sytuacjach.

Dzisiaj problem nadal istnieje. Titan jest dostępny tylko (i aż!) OnLine a CPC w PDF (który można kupić, ale wysłalem go wielu osobom w ramach współpracy nad dostepem do literatury). Te dwie bazy informacji zawierają ogromną ilość danych pochodzących z pracy wielu ludzi.
Można z tego zrobić diwe bazy danych... 8)
A jak się zrobi dwie to można je chcieć ze sobą spiąć i mieć jedną.... czyż nie?

Mam nadzieję, że teraz problem stał się bardziej zrozumiały.

A przy okazji wyszły i dlatego o nich wsponiałem na początku wątku takie drobniejsze problemy, z którymi teraz będzie borykał się Krzysiek Jonko przy okazji rozbudowy lepidoptera.eu. (mógłby tego nie robić?) Informatycy mają jednak "pod górkę", aby użytkownik mogł łatwo pracować. W tym wszystkim jest jeszcze problem ze środowiskiem (php, mapy, sql, wersje, aktualizacje, ciągłe aktualizacje środowiska, ciągle aktualizacje danych). Szkoda gadać... robota czeka :papa:
ODPOWIEDZ
  • Podobne tematy
    Odpowiedzi
    Odsłony
    Ostatni post

Wróć do „CPC”