opis.txt 1002 Bytes
W ramach zadania treść arkuszy kalkulacyjnych zawierających wyniki prac nad semantyką została skonwertowana do postaci strukturalnej i
zapisana w postaci pliku xml oraz plików zawierających opis walencji w formacie przeznaczonym dla parsera ENIAM. 

Paczka zawiera program konwertujący, dane źródłowe w katalogu data oraz przetworzone dane w katalogu results.

Plik xml zawiera pełne informacje zebrane podczas anotacji rolami tematycznymi i preferencjami semantycznymi. 
Może zostać wykorzystany jako dane dla innych parserów lub włączony do słownika walencyjnego Walenty.

Konwersja była zadaniem złożonym uwagi na to, że informacje w przetwarzanym arkuszu kalkulacyjnym miały strukturę drzewa,
którego gałęzie oznaczane były liniami rozdzielającymi pola. Dane zawierały też kilka błędów w tej strukturze,
które trzeba było wykryć i poprawić przed ich przetworzeniem.

Preferencje selekcyjne zostały zweryfikowane poprzez skonfrontowanie ich ze Słowosiecią.