Teksty z angielskich starodruków

Choć wydawałoby się, że klasyczne utwory z XV, XVI, XVII wieków już dawno powinny znaleźć się w sieci, to niestety są to często najtrudniejsze utwory do digitalizacji i opracowania technicznego (np. przeprowadzenia ropoznania tekstu – OCR). Dlatego nie dziwi to jak długo trwały prace Early English Books Online Text Creation Partnership (EEBO-TCP). Konsorcjum opublikowało właśnie 25 000 opracowanych (opisanych kodem XML, z możliwością pełnotekstowego wyszukiwania) tekstów angielsko-języcznych starodruków. Wynik prac został dedykowany na licencji CC0 do domeny publicznej. Dotychczas teksty tych książek dostępne były wyłącznie przez zamkniętą, dostępną jedynie dla kilku uniwersytetów na świecie bazę w ProQuest. W kolekcji znajdują się teksty m.in. Francisa Bacona i Geoffrey’a Chaucera. Do 2020 roku partnerzy projektu planują uwolnić kolejne 40 000. Teksty można przeszukiwać na specjalnej stronie biblioteki uniwersytetu w Michigan (niech nie przerazi Was estetyka strony na miarę końca poprzedniego wieku, naprawdę liczy się tylko zawartość i funkcje, jak w tradycyjnej książce).

Bibliteka tekstów z anglojęzycznych starodruków

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.