Archiwum

Tag Archives: James Ginther

Facebook jest czasem bardzo użyteczny. Ktoś, nawet nie pamiętam kto, podrzucił niedawno link do bloga :: Early Modern Online Bibliography ::, gdzie znajduje się bardzo obszerny opis narzędzia do transkypcji, o którym kiedyś :: dwukrotnie :: pisałem. Czyli ponownie T-PEN.

Gorąco zachęcam do lektury. Autorem tekstu jest James Ginther, jeden z twórców narzędzia.

Z artykułem T-PEN: A New Tool for Transcription of Digitized Manuscripts można zapoznać się :: tutaj ::

Otrzymałem dziś list od Jamesa Ginthera z rozszerzonymi informacjami odnoszącymi się do nowej wersji T-PEN 2.0. Pisałem o tym niedawno.

Za zgodą autora publikuję poniżej dodatkowe informacje, które dzisiaj otrzymałem.

***

On April 30, 2012, we published version 2.0 and it includes the following four new features:

1. Users can now upload their own image set for transcriptions.  These sets must be comprised of jpeg files and have to be zipped together.  This kind of project is automatically designated as private.  The manuscript shelf mark is not listed in T-PEN’s catalog and the project leader can add a maximum of  five additional users to the project.  The images are hosted on T-PEN under the terms of the Fair Use section of the US Millenium Copyright Act.  To upload your images, select the „Advanced’ tab on the landing page and follow the instructions.

2. T-PEN now fully supports crowd-sourcing projects.  These projects can be fully public (so both the project attributes and content can be modified by anyone) or have limited access.  These projects are listed under the „Public Projects” tab on the landing page.  Any project can be designated as public using the options in the Project Management page.  All projects that have been T-PEN use cases at the the Center for Digital Theology will be listed as public projects (content will be readable only).

3. T-PEN has been providing access to support tools for transcribers.  These tools are available on a split screen display. To date we have provided access to various language dictionaries, a dictionary of Latin abbreviations, and the Latin Vulgate Bible.  We know that soon many T-PEN users will want tools for transcribing manuscripts that are not pre-modern Latin.  To that end, T-PEN now permits users to identify a URL for a tool that a user may want to have displayed.  Under the „options” tab on project management, a user can add the name and the URL of the tool and that will be added to the buttons on the Transcription User Interface.   Please note: Users should be aware that this „i-frame” set up does provide full browser functionality.  If you are using a tool which requires authentication in advance (especially if it is via an institutional proxy), we recommend you establish the authentication first in that browser before loading that tool.   You can do this by loading the tool in anther tab and completing the authentication process (login, etc.).  When T-PEN is loaded in the same browser, but different tab, that authenticiation will persist.

4. The final feature is experimental: Glyph matching, a palegraphical analytical tool into T-PEN.  This tool will compare the page you have in the Transcription UI to other pages of that MS.  At present, this tool only compares to pages that are in T-PEN’s image cache, and so the entire manuscript will not be part of the comparison process.  As we develop this tool and increase the speed of the comparative work, full page to manuscript comparison will become available.  At present, T-PEN compares glyph to glyph.  Sometimes that will be individual letters, sometimes that will be ligatures or letters written very close together.  Matches are hightlighted in blue. If you click on them, you will see a list of the matches on other pages.  Clicking on any those thumbnail images will take you to the originating page so you can see that glyph in context.  It is our aim that this tool will facilitate analysis of changes in hand in a manuscript and eventually be way to build data sets that demonstrate common hands in two or more manuscripts.  The tool will be heavily developed over the Summer of 2012.

You can read about future updates to T-PEN, buy clicking on the „Updates” tab on T-PEN’s landing page.

Finally, if you haven’t taken the T-PEN survey before, we would be grateful if you did. You can complete the survey at this URL: https://docs.google.com/spreadsheet/viewform?formkey=dHhpNjRNVnhRWFNublFpUllQeUhjNlE6MQ#gid=0

Dziś chciałbym przybliżyć narzędzie do transkrypcji tekstów ze zdigitalizowanych rękopisów, które dostępne są, jak można przeczytać w informacjach zawartych na profilu projektu na Facebooku, w repozytoriach bibliotek z całego niemal świata.

T-PEN (Transcription for Paleographical and Editorial Notation) został stworzony w Center for Digital Theology na Uniwersytecie w Saint Louis. Kierownikiem projektu jest James Ginther (na academia.edu można się zapoznać z jego kilkoma artykułami). Drugą aktywną osobą w projekcie (widoczną m.in. na Twitterze) jest Alison Tara Walker. Ona również posiada profil na academii.
Do głównych zadaniach Centrum Cyfrowej Teologii (bo tak chyba należy przetłumaczyć nazwę tego instytutu) należy opracowanie narzędzi do badań teologicznych oraz nauczania tejże. Obok T-PEN-a grupa z St. Louis postawiła sobie za zadanie także archiwizowanie średniowiecznych artefaktów, mających szczególne znaczenie religijne oraz teologiczne. Dotychczasowe projekty obejmowały tworzenie baz średniowiecznych tekstów (także zintegrowanych z ilustracjami) oraz modele (3DRT) średniowiecznych kościołów.
Na youtube oraz na powitalnej stronie projektu dostępne są dwa kilkunastominutowe wprowadzające filmy. Ich obejrzenie umożliwia zapoznanie się z podstawowymi funkcjami T-PEN.
Na jednym z nich narzędzie prezentuje James Ginther. Na drugim zaś Alison Tara Walker.

[Na kanale tpentool na youtube obecnie filmów znajduje się więcej.]

James Ginther jest człowiekiem bardzo sympatycznym. Chętnie też odpowiada na wszelkie pytania odnośnie projektu. Nurtowała mnie kwestia specjalnych znaków. Jak można zobaczyć na filmie, teoretycznie dostępna jest niewielka ilość liter – w dodatku przydatnej do transkrypcji tekstów staroangielskich. Zapytałem zatem,czy w przyszłości planowane jest poszerzenie tej funkcji o inne czcionki, przydatne w transkrypcji tekstów słowiańskich, greckich, skandynawskich itd.
Oto odpowiedź, jaką otrzymałem:

„Right now, we cover anything in Unicode-8, so all of the above are covered.  This can happen in two ways.  (1) if the user selects their keyboard language, T-PEN accepts that input and stores it as unicode. (2) if they wish to have special characters available, then can create „buttons” for the transcription tool.  The first 10 are „hot key” assignments (CTRL+1 through 0), but all of them are available as a clickable button.”

Inną kwestią problematyczną dla użytkowników może być konieczność korzystania z tzw. prywatnych kolekcji, np, Parker Library. Dostęp do zdigitalizowanych rękopisów jest płatny w przypadku tej kolekcji. Jeśli użytkownik wybierze sobie w T-PEN rękopis z takiej kolekcji, wówczas pojawi się komunikat, że nie jest uprawniony do korzystania z niego. Tak było w moim przypadku. Należy wówczas skierować prośbę bezpośrednio do danej biblioteki. Każdy przypadek traktowany jest indywidualnie, więc prośba o udostępnienie może być rozpatrzona pozytywnie. Przyznaję jednak, że, szczególnie  w przypadku dawnych materiałów, osobiście jestem za całkowicie wolnym dostępem i trochę mnie to mierzi. Jest to jednak rzecz, na którą TPEN-owcy nie mają żadnego wpływu.

Obecnie dostępnych jest ponad 3 tys. rękopisów i liczba ta wciąż rośnie. Zarejestrowanych jest na razie 230 użytkowników.

T-PEN obecny jest także na portalach społecznościowych. Oprócz wspomnianego powyżej Facebooka i kanału na youtube, można śledzić poczynania grupy także na Google+. Istnieje także osobny blog poświęcony temu narzędziu.

James Ginther poinformował mnie także, właśnie wpuszczono wersję T-PEN 2, która różni się nieco od starszej, z której ja korzystałem.

Po pierwsze, możliwe są prywatne ładowania własnych materiałów. Konieczna jest tylko umiejętność stworzenia pliku zip oraz przygotowania serii jpg-ów, które można samodzielnie „załadować” do T-PEN-a. Zostaną one automatycznie określone jako prywatne i nie będą dostępne dla innych użytkowników, a także nie pojawią się w katalogu T-PEN-a. Materiały mogą być przez właściciela danego konta udostępnione maksymalnie pięciu innym użytkownikom.

Po drugie, grupa pod przewodnictwem Jamesa Ginthera obecnie wspiera bardzo projekty crowd-sourcingowe, czy też, jak sam to podkreślił – publiczne.

Po trzecie, samodzielnie można także wyróżnić swoje własne dodatkowe narzędzie (słownik, bazę tekstów itp.), która będzie widoczna za transkrypcją tak, jak słownik abrewiacji (Capelli).

Po czwarte wreszcie, bardzo proste na razie narzędzie do sporządzania adnotacji będzie udoskonalane podczas nadchodzącego lata.

Na koniec jeszcze jedna ważna uwaga. Jeśli jakaś biblioteka w Polsce byłaby zainteresowana udostępnieniem swojej zdigitalizowanej kolekcji w T-PEN, James Ginther prosi o kontakt.

%d blogerów lubi to: