I chyba od tego trzeba było zacząć, bo być może dotychczasowe nieporozumienia częściowo wynikły z braku uzgodnionych definicji. Hasło "rekord" jest swego rodzaju uproszczeniem i skrótem myślowym. W sensie informatycznym każda tabela bazy składa się z rekordów - każdy wiersz tabeli jest rekordem. W przypadku baz przyrodniczych rekordem nazywam zapis danych (ang. "record") o wystąpieniu gatunku w czasie i przestrzeni, do którego dochodzą metadane. Nie ma wygodnego odpowiednika polskiego - mamy do wyboru "wpis", "zapis" (te kojarzą się z papierem) albo "stwierdzenie gatunku" czy "stwierdzenie" - trochę zbyt długie. "Rekord" dla nieobytych z terminologią kojarzy się ze sportem (etymologia ta sama - "zapis" osiągnięcia).Jacek Kurzawa pisze:Z tego przykładu widać że rekord jest jeden a reszta - cytacje, uszczegółowienia i dopiski są przypięte do tego pierwszego i jedynego rekordu, którym jest okaz(y) w miejscu i dacie z jakimś leg.).
Gdyby tak było, można byłoby podpinać wiele informacji, ale do jednego rekordu. Teraz jest wiele rekordów, które funkcjonują samodzielnie, jako okazy, cytacje, obserwacje i wszystko co tylko się zmieści jak "rekord". To jest moim zdaniem jedna z przyczyn kłopotów.
Triada gatunek-miejsce-czas to rekord sensu KSIB, a właściwie sensu GBIF, bo z tamtych kręgów się to wzięło. Rekord nie musi być związany z okazem dowodowym; obserwacja też jest rekordem. Właściwie to każdy rekord jest obserwacją, tyle że niektóre mają materiał dokumentacyjny w postaci okazu (lepiej) albo zdjęcia (gorzej). Żeby to ogarnąć, jednym z podstawowych atrybutów rekordu jest pole "typ rekordu", gdzie przechowuje się tą informację (najczęściej "okaz" albo "obserwacja").
Cytacja to nie rekord, a jego powiązanie z bibliografią. Wielokrotne cytowanie rekordu niczego nie powiela - to tylko świadectwo zainteresowania rekordem. Może trochę ułatwią sprawę schematy dostępne przez panel główny MB - http://baza.biomap.pl/pl/help/main - to nie jest co prawda struktura bazy, a tylko relacje między kategoriami danych widocznymi jako "perspektywy".
Okaz też nie jest tożsamy z rekordem - to materiał dowodowy. Rekord najbliższy jest etykiecie, a raczej etykietom podpiętym pod okaz.
W większości dużych baz zbierających dane z różnych źródeł pojawiają się problemy z duplikacją rekordów. To oczywiste, że jeśli w bazie wiele danych odnosi się do tego samego stwierdzenia gatunku w czasie i przestrzeni, to de facto jest to ten sam rekord i powtórki trzeba wyeliminować. Cały czas to robimy w BioMap i ostatecznie takich duplikatów nie będzie.