Wersja 1.1.0
Autor: Tytus Dunin
Metrificale to otwartoźrółowy program na licencji GNU GPL-3.0 stworzony na Wydziale Polonistyki Uniwersytetu Warszawskiego.
Czym jest Metrificale?
Metrificale jest automatycznym analizatorem wersologicznym dla polskojęzycznych wierszy. Program ten analizuje wprowadzony wiersz pod względem rodzaju wiersza, rozkładu akcentów, schematu metrycznego, pozycji średniówki i schematu rymów.
Metrificale przeprowadza anotację metryczną wiersza i wizualizuje ją – nie posiada jednak komponentu odpowiedzialnego za wykrywanie wiersza. Progam zakłada, że wprowadzony tekst jest wierszem.
Jakie ograniczenia ma Metrificale?
Metrificale w tej wersji działa najlepiej z wierszami sylabotonicznymi o jednolitym, stałym rozkładzie akcentów. Wynika to z przyjętej metody analizy opisanej poniżej. Program obsługuje również wiersze sylabiczne, natomiast analiza niektórych miejsc (przede wszystkim ciągów monosylab, które nie są atoniczne) może być mniej dokładna ze względu na brak ogólnego metrum, który pozwala „uprawdopodobnić” padanie akcentu na konkretnych sylabach. To samo dotyczy wierszy wolnych, przy czym w ich przypadku parametry wiesza podane na początku analizy mogą być niedokładne. Wiersze toniczne Metrificale traktuje jak sylabiczne – analiza wierszy tonicznych wymaga zupełnie innego podejścia, które jeszcze nie zostało zaimplementowane.
Obecna wersja Metrificale traktuje wiersze sylabotoniczne o metrach logaedycznych jak wiersze sylabotoniczne – algorytm pozwalający na dopasowanie wzorców złożonych z dowolnej kombinacji stóp metrycznych jeszcze nie został wprowadzony w tej wersji.
Metrificale wykorzystuje stworzony przez autora pakiet kokosznicka do podziału tekstu na sylaby. Popularne rozwiązania, takie jak Pyphen lub PyHyphen (wykorzystywane np. przez Jasnopis) w przypadku języka polskiego dosyć często zwracają podział z niepoprawną liczbą sylab, przede wszystkim w wyrazach zawierajacych samogłoski niesylabiczne, dlatego nie są dobrą opcją dla analizatora wersologicznego. Pakiet kokosznicka został przede wszystkim przygotowany tak, aby zwracał podział z poprawną liczbą sylab, może jednak tworzyć podziały nienormatywne w niektórych grupach spółgłoskowych. Następne wersje pakietu zostaną rozszerzone o rozwiazania inspirowane badaniami Brigitte Bigi i Katarzyny Klessy oraz Daniela Śledzińskiego.
Wykrywanie rymów obsługiwane jest za pomocą stworzonego przez autora pakietu Araχne. Pakiet ten jest obecnie w bardzo wczesnej, eksperymentalnej wersji – obecnie umożliwia podstawowe rozróżnianie między rymami i wyrazami, które się nie rymują. Niedługo zostanie wprowadzone wykrywanie rymów niedokładnych, asonansów i konsonansów.
Metrificale analizuje dany wiersz jako całość. Oznacza to, że jeśli między strofami o regularnym metrum lub wewnątrz takiej strofy nastąpi zmiana metrum na inny, program nie będzie w stanie rozpoznać wiersza jako sylabotonicznego. Algorytm przeprowadzający analizę każdej strofy osobno, który umożliwi także rozpoznawanie struktur wyższego rzędu, np. gatunków lirycznych, zostanie wprowadzony w najbliższej dużej aktualizacji. Wraz z nim zostanie wprowadzony specjalny system tagów, który umożliwi efektywne wyszukiwanie i porównywanie struktur wierszy.
Jak interpretować wynik analizy?
Po kliknięciu przycisku „Analizuj” program zwraca wynik analizy w oknie obok. Na górze znajdują się ogólne parametry wiersza – wykryty system numeryczny, długość wersu, średniówka i metrum. Pod nimi pokazana jest ogólna reprezentacja metrum wiersza (jeśli wiersz jest sylabotoniczny).
Pod parametrami znajduje się szczegółowa analiza wiersza w formie tabeli. Do każdego wersu przypisane są cztery rodzaje informacji – w kolejności:
- Graficzna reprezentacja prawdopodobnego akcentu
- Tekst sylaby
- Ciężkość akcentowa sylaby
- Obecność akcentu wierszowego w tej pozycji wersu
Graficzna reprezentacja sylaby w szczegółowej analizie została rozszerzona względem tradycyjnej, uniwerysteckiej anotacji. Oprócz dwóch podstawowych znaków (– dla sylab nieakcentowanych i ⨩ dla mających akcent główny) w szczegółowej analizie mogą znaleźć się znaki: ⨫ dla akcentu zestrojowego (pobocznego), znajdującego się na początku zestroju, oraz ∸ dla tzw. „akcentu łączącego”, który znajduje się wewnątrz zestroju, pomiędzy akcentem zestrojowym i głównym, jeśli między nimi znajdują się co najmniej trzy sylaby. Znaki są odpowiednio dobierane w zależności od ciężkości akcentowej i obecności akcentu wierszowego.
Tekst sylaby prezentowany jest według podziału wykonanego przez pakiet kokosznicka. Jak zostało wspomniane wcześniej, kokosznicka może robić błędy w podziale grup spółgłoskowych.
Ciężkość akcentowa sylaby to kategoria wprowadzona na potrzeby modelu formalnej analizy wiersza realizowanej przez Metrificale. Została zdefiniowana jako cecha sylaby, która określa prawdopodobieństwo padania na nią akcentu na czterostopniowej skali (0–3) w oparciu o jej zawartość, a także położenie względem innych sylab i wyrazów oraz ich zawartość. Jest to kategoria przedakcentowa, nieprzynależąca do żadnej pojedynczej wypowiedzi, mająca swoje źródło w normie językowej.
- System ciężkosci akcentowych został opracowany na podstawie badań empirycznych Marii Steffen-Batogowej i teorii Marii Dłuskiej. Dokładna jego charakterystyka oraz sposób działania programu Metrificale będą przedmiotem powstającego obecnie artykułu naukowego.
Obecność akcentu wierszowego określana jest przez Metrificale poprzez sumowanie ciężkości akcentowych według pozycji sylaby w wersie. Otrzymana lista sum jest porównywana do wzorca utworzonego z powtarzanych do wypełnienia długości wiersza stóp metrycznych, w których pod sylabę akcentowaną jest podstawiana średnia wszystkich sum, a pod nieakcentowaną – najniższa z sum. Istnieje też specjalny wzorzec do wykrywania niemetryczności wiersza, w którym wszystkie pozycje wypełnia średnia wszystkich sum. Algorytm następnie oblicza wartość bezwzględną od różnicy sum i wzorca – wzorzec z najmniejszą różnicą zostaje uznany za poprawne metrum tego wiersza.
- Wzorce tworzone są tylko na podstawie następujących stóp metrycznych: trocheja, jambu, amfibrachu i daktyla, ponieważ praktycznie tylko z tych stóp można w języku polskim utworzyć wiersz o regularnym, powtarzalnym metrum.
Rym ostatniego słowa reprezentowany jest przez kolor wiersza tabeli. Metrificale losuje dla każdego wersu kolor – jeśli w odległości czterech wersów ostatnie słowo któregoś z nich będzie się rymowało, program ustawi kolor odpowiedniego wiersza tabeli na tę samą barwę. Jeśli nie, wiersz ten pozostanie biały.
Kontakt z autorem i przydatne linki
Zachęcam do kontaktu przez e-mail:
tm.dunin (małpa) student.uw.edu.pl