Mapy występowania gatunków w BioMap - wątpliwości

Projekty zbiorowe - faunistyka, bazy danych. Współpraca.
Awatar użytkownika
Piotr Tykarski
Posty: 371
Rejestracja: sobota, 26 kwietnia 2008, 01:04
Lokalizacja: Warszawa
Kontakt:

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Piotr Tykarski »

Jacek Kurzawa pisze:Z tego przykładu widać że rekord jest jeden a reszta -  cytacje, uszczegółowienia i dopiski są przypięte do tego pierwszego i jedynego rekordu, którym jest okaz(y) w miejscu i dacie z jakimś leg.).

Gdyby tak było, można byłoby podpinać wiele informacji, ale do jednego rekordu. Teraz jest wiele rekordów, które funkcjonują samodzielnie, jako okazy, cytacje, obserwacje i wszystko co tylko się zmieści jak "rekord". To jest moim zdaniem jedna z przyczyn kłopotów.
I chyba od tego trzeba było zacząć, bo być może dotychczasowe nieporozumienia częściowo wynikły z braku uzgodnionych definicji. Hasło "rekord" jest swego rodzaju uproszczeniem i skrótem myślowym. W sensie informatycznym każda tabela bazy składa się z rekordów - każdy wiersz tabeli jest rekordem. W przypadku baz przyrodniczych rekordem nazywam zapis danych (ang. "record") o wystąpieniu gatunku w czasie i przestrzeni, do którego dochodzą metadane. Nie ma wygodnego odpowiednika polskiego - mamy do wyboru "wpis", "zapis" (te kojarzą się z papierem) albo "stwierdzenie gatunku" czy "stwierdzenie" - trochę zbyt długie. "Rekord" dla nieobytych z terminologią kojarzy się ze sportem (etymologia ta sama - "zapis" osiągnięcia).

Triada gatunek-miejsce-czas to rekord sensu KSIB, a właściwie sensu GBIF, bo z tamtych kręgów się to wzięło. Rekord nie musi być związany z okazem dowodowym; obserwacja też jest rekordem. Właściwie to każdy rekord jest obserwacją, tyle że niektóre mają materiał dokumentacyjny w postaci okazu (lepiej) albo zdjęcia (gorzej). Żeby to ogarnąć, jednym z podstawowych atrybutów rekordu jest pole "typ rekordu", gdzie przechowuje się tą informację (najczęściej "okaz" albo "obserwacja").

Cytacja to nie rekord, a jego powiązanie z bibliografią. Wielokrotne cytowanie rekordu niczego nie powiela - to tylko świadectwo zainteresowania rekordem. Może trochę ułatwią sprawę schematy dostępne przez panel główny MB - http://baza.biomap.pl/pl/help/main - to nie jest co prawda struktura bazy, a tylko relacje między kategoriami danych widocznymi jako "perspektywy".

Okaz też nie jest tożsamy z rekordem - to materiał dowodowy. Rekord najbliższy jest etykiecie, a raczej etykietom podpiętym pod okaz.

W większości dużych baz zbierających dane z różnych źródeł pojawiają się problemy z duplikacją rekordów. To oczywiste, że jeśli w bazie wiele danych odnosi się do tego samego stwierdzenia gatunku w czasie i przestrzeni, to de facto jest to ten sam rekord i powtórki trzeba wyeliminować. Cały czas to robimy w BioMap i ostatecznie takich duplikatów nie będzie.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Jacek Kurzawa »

Jacek Kurzawa pisze:Inna sprawa - przykład:
http://baza.biomap.pl/pl/list/record/re ... rudae/cf/y

Jak widać tu rekordem jest okaz - nie obserwacja. Odnoszę wrażenie, że co innego pisze Piotr a co innego robią uczestnicy programu Biomap.

http://baza.biomap.pl/pl/list/record/re ... icola/cf/y - wiele powtórzeń - odnoszą się do pojedynczych okazów.

Bardzo dobrze widać to tutaj: http://baza.biomap.pl/pl/list/record/re ... ropus/cf/y
Piotr Tykarski pisze:Triada gatunek-miejsce-czas to rekord sensu KSIB, a właściwie sensu GBIF, bo z tamtych kręgów się to wzięło. Rekord nie musi być związany z okazem dowodowym; obserwacja też jest rekordem. Właściwie to każdy rekord jest obserwacją, tyle że niektóre mają materiał dokumentacyjny w postaci okazu (lepiej) albo zdjęcia (gorzej). Żeby to ogarnąć, jednym z podstawowych atrybutów rekordu jest pole "typ rekordu", gdzie przechowuje się tą informację (najczęściej "okaz" albo "obserwacja").
W dalszym ciągu mam problem ze zrozumieniem tej ilości wpisów w Biomap. Podałem przykład Ropalopus macropus. Czy to co jest w tej chwili to jest to co ma być i to jest dobrze, czy to będzie poprawiane? Ja tu widzę obserwację do każdego okazu z osobna czyli upraszczając okaz jest nośnikiem obserwacji (informacji). Czy te rekordy są uszczegółowione w Biomap (i ukryte) czy w tej chwili możesz sprawdzić, o jakie stanowiska i daty chodzi?
W pracy Gutowskiego nie ma żadnej informacji o: ilości okazów (!), miejscach czy datach, więc taka ilość rekordów musiała powstać w wyniku kontaktu z kolekcją, z przepisania informacji spod okazów lub dodania tylu rekordów do bazy, ile w kolekcji było okazów. Jeśli dane spod okazów są i są ukryte to dobrze, ale jeśli ich nie ma, to zostanie tak jak jest, bo jakoś nie wyobrażam sobie teraz uszczegóławiania rekordów poprzez docieranie do kolekcji i wpisywanie danych z jakichś okazów.
Załączniki
macropuslist.png
Pokaż obraz w oryginalnym rozmiarze (20.94 KiB)
macropusnapodstliteratury.png
Pokaż obraz w oryginalnym rozmiarze (19.67 KiB)
Awatar użytkownika
Piotr Tykarski
Posty: 371
Rejestracja: sobota, 26 kwietnia 2008, 01:04
Lokalizacja: Warszawa
Kontakt:

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Piotr Tykarski »

Każdy z przytoczonych przez Ciebie przypadków jest osobny i może mieć inne wyjaśnienie. Dlatego nie będę łączył odpowiedzi na kilka pytań w jednym poście, bo moje odpowiedzi zrodzą kolejne pytania itd. itd. itd. Ponownie sugeruję wydzielanie pytań, bo w końcu nikt nie będzie tego ogarniał.

Dlatego podejmuję w tym momencie tylko temat danych Ropalopus macropus. OK, no to rozdzielmy ten włos...
Jacek Kurzawa pisze:W dalszym ciągu mam problem ze zrozumieniem tej ilości wpisów w Biomap. Podałem przykład Ropalopus macropus. Czy to co jest w tej chwili to jest to co ma być i to jest dobrze
Nie.
Jacek Kurzawa pisze:czy to będzie poprawiane?
Tak. Brak dat (gdyby były, widziałbyś rok) i lokalizacji. Skoro pisałem, że rekord to zespół "gatunek - miejsce - czas", a duplikaty będą eliminowane, to znaczy, że obecny stan jest niewłaściwy i będzie korekta.
Jacek Kurzawa pisze:Ja tu widzę obserwację do każdego okazu z osobna czyli upraszczając okaz jest nośnikiem obserwacji (informacji).
Uprośćmy to na początek jeszcze bardziej: skoro widzisz symbol szpilki, a po wiejściu w rekord wpis "okaz" w polu "typ rekordu", to znaczy że to jest okaz.
Ale ponieważ te dane są dziwne, zajrzałem do źródła i okazało się, że w tabeli źródłowej tego kawałka stoi, że to dane oparte o bibliografię. Poczekajmy, aż sprawa wyjaśni się do końca.
Jacek Kurzawa pisze:Czy te rekordy są uszczegółowione w Biomap [?]
Jeśli masz na myśli daty i stanowiska, to nie.
Jacek Kurzawa pisze: (i ukryte) [?]
Gdyby były ukryte, to nie widziałbyś ich.
Jacek Kurzawa pisze: czy w tej chwili możesz sprawdzić, o jakie stanowiska i daty chodzi?
Brak dat i stanowisk.
Jacek Kurzawa pisze: W pracy Gutowskiego nie ma żadnej informacji o: ilości okazów (!), miejscach czy datach, więc taka ilość rekordów musiała powstać w wyniku kontaktu z kolekcją, z przepisania informacji spod okazów lub dodania tylu rekordów do bazy, ile w kolekcji było okazów.
Nie wiem, skąd się to wzięło. Jakiś czas temu dałem znać kolegom z IBL o problemie braku szczegółów przy części danych od nich i na pewno sprawa się wyjaśni. Trzeba poczekać.
Jacek Kurzawa pisze: Jeśli dane spod okazów są i są ukryte to dobrze,
Wolne żarty. Jaki byłby sens pokazywania okazów bez żadnych danych? Gdyby były ukryte, nie wiedziałbyś, że są w bazie i nie byłoby tej rozmowy. Dane muszą mieć sens. Skoro nie mają, to znaczy że gdzieś jest błąd.
Jacek Kurzawa pisze: ale jeśli ich nie ma, to zostanie tak jak jest, bo jakoś nie wyobrażam sobie teraz uszczegóławiania rekordów poprzez docieranie do kolekcji i wpisywanie danych z jakichś okazów.
A dlaczego nie? Czy znasz jakieś okoliczności, które to uniemożliwiają? Pozwólmy działać ZLN IBL.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Jacek Kurzawa »

To bardzo wiele wyjaśnia. Wygląda na to, że ja (i pewnie wiele osób) zupełnie inaczej postrzegałem to, co Biomap wyświetla od intencji twórców Biomap. Analiza przypadku pokazuje, że właściwie na tym etapie nie ma sensu dalej dyskutować na temat konstrukcji bazy danych czy samego projektu, bo jest on tak daleki od tego, co finalnie ma być, że to co widzimy jest całkowitą zmyłką. Chyba praktycznie każdy gatunek jest do poprawki w tym większość danych, w przybliżeniu zdecydowana większość danych. Na to będzie potrzebny duży zespół roboczy i wiele lat pracy, ale w sumie to się opłaci. Póki co nie ma innej alternatywy, poza tym, że można to samo robić metodami tradycyjnymi, na piechotę. Ale nie ma co odbiegać od tematu.

I kilka odpowiedzi. Dopytywałem o dane ukryte, aby mieć pewność, że widzimy to samo i to, że innych danych nie ma.
Czy to można poprawić? No w sumie można, ale będzie to bardziej wprowadzanie danych od nowa, ale to jakby jest już poza tematem.
Piotr Tykarski pisze:Jaki byłby sens pokazywania okazów bez żadnych danych? Gdyby były ukryte, nie wiedziałbyś, że są w bazie i nie byłoby tej rozmowy.
W Biomap są różne informacje ukryte z różnym poziomem np są kolekcje ale ukryte jest do kogo należą. Gdybym miał myśleć Twoim tokiem rozumowania, to całkiem nie powinno być widać kolekcji, tymczasem widać, ale tylko "trochę"... Nie iwm co jak dokładnie jest widać w Biomap stąd też między innymi ta dyskusja.
Z mojej strony to już koniec pytań. Dziękuję za podjętą dyskusję.
Awatar użytkownika
Jacek Kurzawa
Posty: 9490
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Jacek Kurzawa »

Jestem cały czas jestem Ci winien Marku odpowiedź za wcześniejszą odpowiedź (czytałem, nie odpisałem). Zgadzam się z wieloma rzeczami, gatunki sprawdziłem, przejrzałem, posiedziałem, ale nie było czasu na odpowiedź. A poszły inne ;-)
Okazy sprawdziłem, sprawy przemyślałem, dziękuję.
Marek Wanat pisze: Jeśli przyjąć za instrukcją ze strony Biomapy, że cytujemy BioMap z datą dostępu, to czemu się nie nadają?
Z cytowaniem Biomap byłbym trochę ostrożny z dwóch powodów:
1. informacje są niepełne i nie bardzo wiadomo, czego dotyczą, wymagają sprawdzania. Szczególnie te "nowe". Nie widzę dobrych danych tylko same strzępy, albo błędy, dublety danych literaturowych itp. Ta nowa wiedza jest dla mnie bardzo słabo widoczna, może nie trafiłem na takie dane.
2. Zasady cytowania źródeł internetowych nakładają na źródła kilka obowiązków m.in. stałość adresu, niezmienność danych. W Biomap treść jest dynamiczna i mam wątpliwości, czy można się na nią powoływać. Analogicznie - Forum ma bardziej stałą treść, stałe adresy a nie wiedzieć czemu nie jest w praktyce cytowane. Jednak chyba można, chociaż podstawą do decyzji o zacytowaniu jest, jak mi się zdaje, poziom zaufania do danych zawartych w serwisie, a te dane w Biomap będą zmieniane w większości. Dyskusja o cytowalności była całkiem niedawno tutaj: viewtopic.php?p=199098#p199098

Ale to są zagadnienia na inną dyskusję.
:papa: :uciekam:
Awatar użytkownika
Marek Wanat
Posty: 547
Rejestracja: piątek, 5 października 2007, 10:59
UTM: XS36
Specjalność: ryjkowce
Lokalizacja: Wrocław
Podziękowano: 1 time

Re: Mapy występowania gatunków w BioMap - wątpliwości

Post autor: Marek Wanat »

Ja też cię rozumiem Jacku, chciałbyś aby baza była skonstruowana tak, jak Ty gromadzisz informacje o "okazach" w swojej głowie. Tu jednak wchodzimy głęboko w problem logicznej konstrukcji bazy i jakiś fachowiec znający BioMap musiałby się wypowiedzieć, czy możliwa jest taka przebudowa i kosztem jakich nakładów pracy. Ze mną na ten temat niestety nie podyskutujesz. Tak sobie jednak myślę, że problem nie w tym, w jaki sposób dane są gromadzone, tylko czy można stworzyć narzędzia do ich przetworzenia i pokazania tak jak chcemy.
A co do stwierdzenia i okazu, to spór jest głównie semantyczny, bo logicznie rozumiem swoje "stwierdzenie" prawie dokładnie tak, jak Ty swój "okaz(y)" i bynajmniej nie uznaję wtórnych cytacji jako kolejnych stwierdzeń. Ale akceptuję je jako kolejne rekordy, jeśli wymusza to konstrukcja bazy. Może gdybym dodał: ... w tym samym miejscu i czasie, lepiej byś zrozumiał, ale chodziło mi akurat o to, że takie stwierdzenie może być opisane nie tylko tymi dwoma parametrami, ale o wiele większą ich liczbą.
ODPOWIEDZ

Wróć do „Atlasy rozmieszczenia, Bazy danych - projekty zbiorowe”