Lastuvka - The Sesiidae of Europe (2001)

Literatura traktująca o motylach (Lepidoptera)
Awatar użytkownika
Jacek Kalisiak
Posty: 3269
Rejestracja: wtorek, 24 sierpnia 2004, 14:50
Lokalizacja: Łódź
Podziękował(-a): 5 times

Lastuvka - The Sesiidae of Europe (2001)

Post autor: Jacek Kalisiak »

admin
Administrator
Posty: 1596
Rejestracja: środa, 4 lutego 2004, 03:41
Lokalizacja: Tomaszów Maz.
Podziękował(-a): 1 time
Podziękowano: 5 times
Kontakt:

Post autor: admin »

Dzieki. :grin:
Żeby pobrać trzeba wpisać cyfry w polu niżej i dopiero potem pobrać plik ...pdf.html 27,4MB.

Niestety, ludzie nie potrafią skanować... szkoda czasami ....Tablice są dość słabej jakości, a tekst tam jest niemożliwy do przeczytania.
Ponoć "Darowanemu koniowi się w zęby nie zagląda".

Problem lezy nie tyle w samym skanowaniu (zbyt mała rozdzielczość, brak balansu bieli) co w wyborze formatu do zapisu pliku.
Gdyby ktoś mial ochotę odwalić kawał dobrej roboty, to przypomnę, żeby tekst zapisywać do formatu BMP(jesli JPG to bez kompresji) wtedy można mysleć o przekształceniu obrazu tekstu w tekst (txt).
Trzeba tez popracowac nad balansem bieli i zapisywac w odpowiednio duzej rozdzielczosci (szczegolnie przy malym tekscie).

Natomiast obrazy właśnie do JPG, wtedy jest pełna gama odcieni.

W załącznikach te gorsze miejsca.
Załączniki
obraz_z_nadmierna_kompresja.jpg
obraz_z_nadmierna_kompresja.jpg (37.14 KiB) Przejrzano 3669 razy
tekst_nie_powinien-miec kompresji.jpg
tekst_nie_powinien-miec kompresji.jpg (37.04 KiB) Przejrzano 3666 razy
Ostatnio zmieniony sobota, 31 stycznia 2009, 11:42 przez admin, łącznie zmieniany 1 raz.
Awatar użytkownika
Malko
Posty: 2005
Rejestracja: piątek, 19 grudnia 2008, 16:06
Lokalizacja: Tarnów/Radłów/Kraków

Post autor: Malko »

Dzięki :)
Awatar użytkownika
Rafał Celadyn
Posty: 7254
Rejestracja: poniedziałek, 18 czerwca 2007, 17:13
UTM: CA-95
Lokalizacja: Młoszowa
Kontakt:

Post autor: Rafał Celadyn »

Mam od kolegi :wink: ,"zrobioną" tą książkę tylko w jpg-ach(jakość good :wink: ),jak baza zacznie działać to wrzucę :smile: .Pozdrowki Rafał.
Awatar użytkownika
Jacek Kalisiak
Posty: 3269
Rejestracja: wtorek, 24 sierpnia 2004, 14:50
Lokalizacja: Łódź
Podziękował(-a): 5 times

Post autor: Jacek Kalisiak »

Lastuvka - The Sesiidae of Europe (2001)

Scanned PDF, bookmarks, faible quality, size 27.412 MB

Lastuvka, Z. & A. Lastuvka: The Sesiidae of Europe. (Lepidoptera). 2001
24 x 17 cm. 245 pages. 9 colour plates. More than 100 line drawings. Distribution map to all species. Bibliography. Hardback. Stenstrup (Apollo Books). ISBN 87-88757-52-8.
This is a strongly revised edition of the author's An illustrated Key to European Sesiidae, published in 1995. This book was printed in a very limited edition and was soon out of print.

Сообщение было отредактировано ramus - вчера, 20:03
==========
Taki był oryginalny komentarz osoby zamieszczającej tego pdf-a na rosyjskim forum. Książkę zawsze można sobie kupić, a i zdjęć Sessidae w necie pewnie jest dużo. Natomiast pozostała część książki, zawierająca istotne informacje jest dobrze czytelna. No i jest to drugie zrewidowane wydanie :wink:
Awatar użytkownika
Jacek Kalisiak
Posty: 3269
Rejestracja: wtorek, 24 sierpnia 2004, 14:50
Lokalizacja: Łódź
Podziękował(-a): 5 times

Post autor: Jacek Kalisiak »

Awatar użytkownika
Piotr Pawlikiewicz
Posty: 612
Rejestracja: poniedziałek, 11 października 2004, 10:48
UTM: CC71
Lokalizacja: Łask
Kontakt:

Post autor: Piotr Pawlikiewicz »

Jacku a możesz wytłumaczyć jak pobrać z tego drugiego linku.
Awatar użytkownika
Miłosz Mazur
Posty: 2565
Rejestracja: czwartek, 26 stycznia 2006, 11:33
UTM: CA08
Specjalność: Curculionoidea
profil zainteresowan: Muzyka metalowa, fantastyka, gry planszowe
Lokalizacja: Kędzierzyn-Koźle/Opole
Podziękował(-a): 1 time
Kontakt:

Post autor: Miłosz Mazur »

Jacku, skoros taki biegły w rosyjskich stronach to nie wiesz czy tam chodza jakieś rosyjskie klucze do ryjów ??
admin
Administrator
Posty: 1596
Rejestracja: środa, 4 lutego 2004, 03:41
Lokalizacja: Tomaszów Maz.
Podziękował(-a): 1 time
Podziękowano: 5 times
Kontakt:

Post autor: admin »

Piotr Pawlikiewicz pisze:Jacku a możesz wytłumaczyć jak pobrać z tego drugiego linku.
Limit bezplatnych pobrań dla pliku zostal przekroczony. Mozna jednak pobrac ten plik, ale należy wspomóc autora strony swoimi działaniami:
Aby pobrac plik, wystarczy wejsc na stronę z linkami do stron a potem na jedną z tych stron i pobyć na niej ponad 30 sekund (taka forma zarabiania w internecie). Po tym czasie można znów zacząć pobierać plik klikając w kolejne odnosniki.
Awatar użytkownika
Jacek Kalisiak
Posty: 3269
Rejestracja: wtorek, 24 sierpnia 2004, 14:50
Lokalizacja: Łódź
Podziękował(-a): 5 times

Post autor: Jacek Kalisiak »

Dzisiaj niestety nie miałem zupełnie czasu, ale Jacek chyba wszystko wyjaśnił.
Curculio podawałem na forum linki do forum, na którym są wrzucane publikacje.

http://molbiol.ru/forums/index.php?s=31 ... 56&st=1300
http://www.zin.ru/Animalia/Coleoptera/rus/news.htm

i jak mam czas to tam zaglądam ;)

Wiem też, że wielu naszych kolegów ma spore zasoby, acz niechętnie się nimi dzieli. Często jest tak, ja to było ostatnio z kolegą Czechem, że "coś za coś". Może i słusznie, bo o dobrowolny rewanż bywa trudno :mrgreen: :mrgreen: :mrgreen:

Co do ryjów to chodzą klucze do Dalekiego Wschodu i widziałem kilka innych (np. Azja Środkowa?).
Awatar użytkownika
Krzysiek Jonko
Posty: 325
Rejestracja: środa, 7 kwietnia 2004, 10:23
Lokalizacja: Łódź
Kontakt:

Post autor: Krzysiek Jonko »

[Jacek Kurzawa napisał...]
Gdyby ktoś mial ochotę odwalić kawał dobrej roboty, to przypomnę, żeby tekst zapisywać do formatu BMP(jesli JPG to bez kompresji) wtedy można mysleć o przekształceniu obrazu tekstu w tekst (txt).
[koniec cytatu]

Absolutnie NIE POWINNO się używać obrazków BMP do tworzenia plików PDF! Na moje nieszczęście znam się na tym dość dobrze więc pozwolę sobie na małą korektę Jacka.
1) nie BMP tylko TIFF i to kompresowany. Wykorzystanie plików BMP spowoduje, że wynikowy plik PDF będzie niepotrzebnie duży. Pliki TIFF też są bezstratne ale dzięki BEZSTRATNEJ kompresji zajmują znacznie mniej miejsca.
2) Nie istnieje bezstratny format JPG choć przy minimalnej (~zerowej) kompresji utrata jakości jest niezauważalna.
3) tekst skanuje się OCR-em. Niestety zajmuje to trochę więcej czasu bo trzeba tekst przejrzeć w trakcie skanowania ale wynik jest rewelacyjny.

Swego czasu poskanowałem trochę literatury motylkowej w ten sposób i wiem, że to jest to, co tygryski lubią najbardziej. Moje pliki PDF są wielokrotnie mniejsze a wszystkie teksty są IDEALNE, nie ma mowy, że coś jest nieczytelne.
Zwracam jednak uwagę na to, że to nielegalna metoda pozyskiwania literatury. Jedyne MOJE/NASZE usprawiedliwienie to to, że tej literatury po prostu nie ma, a jeśli jest - kosztuje tak astronomiczne pieniądze, że mało kto może sobie na nią pozwolić.
Awatar użytkownika
Jacek Kurzawa
Posty: 9495
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Post autor: Jacek Kurzawa »

Krzysztof, nie zrozumiałeś mnie, ale byc może wiecej osob tak też odebrało.
Pisalem o przygotowaniu pliku do OCR:
Gdyby ktoś mial ochotę odwalić kawał dobrej roboty, to przypomnę, żeby tekst (skanowany) zapisywać do formatu BMP (jesli JPG to bez kompresji) wtedy można mysleć o przekształceniu obrazu tekstu w tekst (txt).

Programy do OCR (do odzyskiwania tekstu z obrazu) takie jak ABBY FineReader czy Recognita wymagają (!), aby plik był BMP. Można więc skanować do bezstratnego jpga, jesli ktos bardzo chce, ale potem takiego jpg trzeba przekonwertowac na bmp. może byc też TIFF. Takie poskanowane teksty (pliki graficzne) otwieramy w FineReader i "odzyskujemy" tekst (.txt).

Jasne jest i o tym piszesz, ze do potrzeb pdfa zbudowanego na obrazkach skanujemy obrazy do malych objetosciowo plikow czyli albo jpg albo tiff.

Tak sie sklada, ze pierwszy skaner kupilem na potrzeby skanowania prac i ksiazek (zarobkowo, studenci potrzebowali miec cale książki w tekscie) wiec na OCR spedzilem setki godzin i zarobilem tez niemale pieniadze. Potem skanowalem owady.

Reasumując:
Najlepszy sposob na dobrego pdfa to rozbic artykul na skanowanie kartek tekstu i tablic. Tablice skanujemy do jak najlepszego formatu jpg lub tiff, a tekst do BMP-importujemy do programu OCR i uzyskujemy czysty tekst. potem skladamy z tego pdfa. Otrzymany plik bedzie wyszukiwal wyrazy i posiadal dobrej jakosc itablice.

Czy teraz dobrze? :razz:

PS. Zgadzam sie z pkt 1. pkt 2 i pkt 3. To wlasnie o tym pukncie 3 pisalem :-) sam tez zauważasz, ze "jest więcej roboty, ale wynik jest rewelacyjny." No i o to chodzi własnie! Zeby tak robić - dluzej, ale dobrze :-)
Awatar użytkownika
Krzysiek Jonko
Posty: 325
Rejestracja: środa, 7 kwietnia 2004, 10:23
Lokalizacja: Łódź
Kontakt:

Post autor: Krzysiek Jonko »

Fine Reader obsługuje zarówno TIFF jak i JPG, nie wiem skąd Ci się wziął ten BMP ;-D
Teraz jak zwykle jestem w delegacji - jak wrócę wrzucę tu jedną niewielką książeczkę zrobioną w ten sposób, żeby było wiadomo o czym mówimy ;-)
Pozdrawiam
Awatar użytkownika
Jacek Kurzawa
Posty: 9495
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Post autor: Jacek Kurzawa »

Krzysiek Jonko pisze:wrócę wrzucę tu jedną niewielką książeczkę zrobioną w ten sposób, żeby było wiadomo o czym mówimy
No ja caly czas o skanowaniu do OCR :-)

Wersja 7.0 FineReader rzeczywiscie juz posiada otwieranie plikow w jpg, ale stara wersja na ktorej kiedys pracowalem tego nie miala (to bylo w 2000 r.) Dlatego skanowalem do bmp. Potem skanowalem go GIF, pliki byly mniejsze a robótka szła dosc szybko.

Zamieszczam fragment skanu pliku dla potrzeb OCR: plik GIF, skanowanie w rozdzielczości 300 dpi.
Poniżej inny tekst zapisany do jpg. Powstałe wokół tekstu chmurki mogą uniemozliwić rozpoznanie tekstu albo spowodować wiele błedów i przekłamań w tekscie.

Jeszcze niżej - skanowana tablica - do jpg.
Załączniki
skan_do_gif_dla_ocr.gif
skan_do_gif_dla_ocr.gif (125 KiB) Przejrzano 3665 razy
tego program ocr moze nie rozczytac.gif
tego program ocr moze nie rozczytac.gif (150.35 KiB) Przejrzano 3667 razy
Wycinek z pliku skanu tablicy drukowanej. Jak widać jakość jest nienajgorsza, a skanowanie odbywalo się rutynowo...
Wycinek z pliku skanu tablicy drukowanej. Jak widać jakość jest nienajgorsza, a skanowanie odbywalo się rutynowo...
fragment tablicy.jpg (147.2 KiB) Przejrzano 3671 razy
Ostatnio zmieniony czwartek, 1 stycznia 1970, 01:00 przez Jacek Kurzawa, łącznie zmieniany 3 razy.
Awatar użytkownika
Antek Kwiczala †
Posty: 5707
Rejestracja: niedziela, 28 sierpnia 2005, 14:29
UTM: CA22
Lokalizacja: Kaczyce

Post autor: Antek Kwiczala † »

Wersja 7.0 FineReader rzeczywiscie juz posiada otwieranie plikow w jpg
Ja mam dosyć starą wersję FineReader 4.0, i ta już też obsługuje pliki jpg. Musiałeś mieć Jacku bardzo starą wersję tego programu. A swoją drogą poprawność odczytu w dużym stopniu zależy od stopnia kompresji. Czym większa kompresja, tym większe błędy.
Awatar użytkownika
Jacek Kurzawa
Posty: 9495
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Post autor: Jacek Kurzawa »

To było bardzo dawno temu... OCR w 2000 i wcześniej... ja musiałem mieć wersję z lat 1997-99... wtedy skaner byl luksusem, a OCR było fantazją w którą nie wszyscy wierzyli.
Miałem dwa programy dobrze działające FineReader i Recognita. Jeden z nich w wersji działającej miał tylko polski język, drugi miał wiele języków. Byc może to Recognita wołała BPM... tak juz bylo, a potem zaprzestałem skanowania do OCR.

Zresztą cała dyskusja akurat nie o była tym tylko o dobrym skanowaniu tekstu. W powyzszym przykładzie z przeziernikami zrobiono dwa duze błedy na raz - tekst jest w jpg z duża kompresją która uniemozliwia odzyskanie tekstu. a tablice kolorowe w gif (tak mi to wygląda) ktory poszatkował przeziernika. Pewnie spowodowane było to potrzebą zrobienia tylko pdfa, jak najmniejszego pliku. I tak pomyślał Krzysztof.

Zwrócilem na to uwagę po to, by inni skanujący zwrócili uwagę na te aspekty, aby ich produkcje były lepsze.
Awatar użytkownika
Grzegorz Banasiak
Posty: 4470
Rejestracja: poniedziałek, 2 lutego 2004, 23:27
UTM: DC45
Lokalizacja: Skierniewice
Podziękował(-a): 3 times
Podziękowano: 1 time
Kontakt:

Post autor: Grzegorz Banasiak »

Dorzucę do tej dyskusji moje trzy grosze.
Jaki jest sens robienia tekstu, kombinowania z formatami, przerabiania, konwertowania ?
Przy obecnym stanie informatyki i sprzętu skanuje się w maksymalnej rozdzielczości bezstratnie każdą kartkę i zapisuje na DVD albo na dysku i finał. Po co to przerabiać na tekst ? Pliki graficzne można wydrukować na kolorowej laserówce (obecnie niedrogie i popularne) i to wszystko.

Nieco innego wymiaru nabiera ta dyskusja jeśli skany mają być rozpowszechniane, wtedy trzeba iść na kompromis jakościowy, ale czy warto ? Zawsze można wysłać płytkę za 50 gr. i mieć najwyższą jakość. Niektóre książki mam w postaci zdjęć robionych aparatem cyfrowym, do bieżącego korzystania wystarcza.

Ja większość książek, które mam/dostaję/ściągam/skanuję od razu drukuję i binduję. To zapewnia pewien komfort korzystania, wolę wersje papierowe niż oglądanie ich na ekranie, zresztą wyświetlacze notebooków przekłamują nieco kolory, wydruki są bardziej realistyczne.
Awatar użytkownika
Jacek Kurzawa
Posty: 9495
Rejestracja: poniedziałek, 2 lutego 2004, 19:35
UTM: DC30
Specjalność: Cerambycidae
profil zainteresowan: Muzyka informatyka makrofotografia
Lokalizacja: Tomaszów Mazowiecki
Podziękował(-a): 4 times
Podziękowano: 1 time
Kontakt:

Post autor: Jacek Kurzawa »

Jaki jest sens skanowania do OCR (odzyskiwania tekstu)? Prosty! Takie prace są przeszukiwalne wg zawartosci. Gdy szukam informacji na temat danego gatunku (rosliny, miejscowści etc) szukamw komputerze po katalogach, wyskakuja mi pliki (html, pdf, txt doc i inne) .... Te zapisane w pdfach z tekstem są, natomiast te graficzne pdfy są odporne i przez to o wiele mniej użyteczne. Takie pliki graficzne wolę oglądać przeglądarką grafiki ACDSee, jest o wiele bardziej uzyteczna.

Tak więc nawet sensowne jest przeskanowanie książki po to, by po procesie ocr mieć ją w wersji tekstowej. Dobrze się szuka informacji Wszystko zależy od tego, jaką metodę pracy przyjmiemy.

Coraz czesciej odczuwam, tak jak Ty, posiadania wersji papierowych. Dobrze się czyta.
I też zacząłem robić fotki aparatem - do szybkiego zarchiwizowania dokumentów wystarcza.
ODPOWIEDZ

Wróć do „Literatura - motyle”