T-PEN :: narzędzie do transkrypcji online

Dziś chciałbym przybliżyć narzędzie do transkrypcji tekstów ze zdigitalizowanych rękopisów, które dostępne są, jak można przeczytać w informacjach zawartych na profilu projektu na Facebooku, w repozytoriach bibliotek z całego niemal świata.

T-PEN (Transcription for Paleographical and Editorial Notation) został stworzony w Center for Digital Theology na Uniwersytecie w Saint Louis. Kierownikiem projektu jest James Ginther (na academia.edu można się zapoznać z jego kilkoma artykułami). Drugą aktywną osobą w projekcie (widoczną m.in. na Twitterze) jest Alison Tara Walker. Ona również posiada profil na academii.
Do głównych zadaniach Centrum Cyfrowej Teologii (bo tak chyba należy przetłumaczyć nazwę tego instytutu) należy opracowanie narzędzi do badań teologicznych oraz nauczania tejże. Obok T-PEN-a grupa z St. Louis postawiła sobie za zadanie także archiwizowanie średniowiecznych artefaktów, mających szczególne znaczenie religijne oraz teologiczne. Dotychczasowe projekty obejmowały tworzenie baz średniowiecznych tekstów (także zintegrowanych z ilustracjami) oraz modele (3DRT) średniowiecznych kościołów.
Na youtube oraz na powitalnej stronie projektu dostępne są dwa kilkunastominutowe wprowadzające filmy. Ich obejrzenie umożliwia zapoznanie się z podstawowymi funkcjami T-PEN.
Na jednym z nich narzędzie prezentuje James Ginther. Na drugim zaś Alison Tara Walker.

[Na kanale tpentool na youtube obecnie filmów znajduje się więcej.]

James Ginther jest człowiekiem bardzo sympatycznym. Chętnie też odpowiada na wszelkie pytania odnośnie projektu. Nurtowała mnie kwestia specjalnych znaków. Jak można zobaczyć na filmie, teoretycznie dostępna jest niewielka ilość liter – w dodatku przydatnej do transkrypcji tekstów staroangielskich. Zapytałem zatem,czy w przyszłości planowane jest poszerzenie tej funkcji o inne czcionki, przydatne w transkrypcji tekstów słowiańskich, greckich, skandynawskich itd.
Oto odpowiedź, jaką otrzymałem:

„Right now, we cover anything in Unicode-8, so all of the above are covered.  This can happen in two ways.  (1) if the user selects their keyboard language, T-PEN accepts that input and stores it as unicode. (2) if they wish to have special characters available, then can create „buttons” for the transcription tool.  The first 10 are „hot key” assignments (CTRL+1 through 0), but all of them are available as a clickable button.”

Inną kwestią problematyczną dla użytkowników może być konieczność korzystania z tzw. prywatnych kolekcji, np, Parker Library. Dostęp do zdigitalizowanych rękopisów jest płatny w przypadku tej kolekcji. Jeśli użytkownik wybierze sobie w T-PEN rękopis z takiej kolekcji, wówczas pojawi się komunikat, że nie jest uprawniony do korzystania z niego. Tak było w moim przypadku. Należy wówczas skierować prośbę bezpośrednio do danej biblioteki. Każdy przypadek traktowany jest indywidualnie, więc prośba o udostępnienie może być rozpatrzona pozytywnie. Przyznaję jednak, że, szczególnie  w przypadku dawnych materiałów, osobiście jestem za całkowicie wolnym dostępem i trochę mnie to mierzi. Jest to jednak rzecz, na którą TPEN-owcy nie mają żadnego wpływu.

Obecnie dostępnych jest ponad 3 tys. rękopisów i liczba ta wciąż rośnie. Zarejestrowanych jest na razie 230 użytkowników.

T-PEN obecny jest także na portalach społecznościowych. Oprócz wspomnianego powyżej Facebooka i kanału na youtube, można śledzić poczynania grupy także na Google+. Istnieje także osobny blog poświęcony temu narzędziu.

James Ginther poinformował mnie także, właśnie wpuszczono wersję T-PEN 2, która różni się nieco od starszej, z której ja korzystałem.

Po pierwsze, możliwe są prywatne ładowania własnych materiałów. Konieczna jest tylko umiejętność stworzenia pliku zip oraz przygotowania serii jpg-ów, które można samodzielnie „załadować” do T-PEN-a. Zostaną one automatycznie określone jako prywatne i nie będą dostępne dla innych użytkowników, a także nie pojawią się w katalogu T-PEN-a. Materiały mogą być przez właściciela danego konta udostępnione maksymalnie pięciu innym użytkownikom.

Po drugie, grupa pod przewodnictwem Jamesa Ginthera obecnie wspiera bardzo projekty crowd-sourcingowe, czy też, jak sam to podkreślił – publiczne.

Po trzecie, samodzielnie można także wyróżnić swoje własne dodatkowe narzędzie (słownik, bazę tekstów itp.), która będzie widoczna za transkrypcją tak, jak słownik abrewiacji (Capelli).

Po czwarte wreszcie, bardzo proste na razie narzędzie do sporządzania adnotacji będzie udoskonalane podczas nadchodzącego lata.

Na koniec jeszcze jedna ważna uwaga. Jeśli jakaś biblioteka w Polsce byłaby zainteresowana udostępnieniem swojej zdigitalizowanej kolekcji w T-PEN, James Ginther prosi o kontakt.

Reklamy
2 comments

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s

%d blogerów lubi to: