Teksty z angielskich starodruków

Choć wydawałoby się, że klasyczne utwory z XV, XVI, XVII wieków już dawno powinny znaleźć się w sieci, to niestety są to często najtrudniejsze utwory do digitalizacji i opracowania technicznego (np. przeprowadzenia ropoznania tekstu – OCR). Dlatego nie dziwi to jak długo trwały prace Early English Books Online Text Creation Partnership (EEBO-TCP). Konsorcjum opublikowało właśnie 25 000 opracowanych (opisanych kodem XML, z możliwością pełnotekstowego wyszukiwania) tekstów angielsko-języcznych starodruków. Wynik prac został dedykowany na licencji CC0 do domeny publicznej. Dotychczas teksty tych książek dostępne były wyłącznie przez zamkniętą, dostępną jedynie dla kilku uniwersytetów na świecie bazę w ProQuest. W kolekcji znajdują się teksty m.in. Francisa Bacona i Geoffrey’a Chaucera. Do 2020 roku partnerzy projektu planują uwolnić kolejne 40 000. Teksty można przeszukiwać na specjalnej stronie biblioteki uniwersytetu w Michigan (niech nie przerazi Was estetyka strony na miarę końca poprzedniego wieku, naprawdę liczy się tylko zawartość i funkcje, jak w tradycyjnej książce).

[button url=”http://quod.lib.umich.edu/e/eebogroup/” color=”green” type=”null” target=”null”] Bibliteka tekstów z anglojęzycznych starodruków [/button]

Dodaj komentarz

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Close Menu