Blame view

tools/swigra/README.md 5.46 KB
Jan Lupa authored
1
2
Before using Świgra it might be necessary to compile the Prolog interface to the morphological analyzer Morfeusz.  
First the package libmorfeusz2-dev must be downloaded from sgjp.pl/morfeusz/dopobrania.html and installed.  
Jan Lupa authored
3
4
(WARNING: do NOT install the package morfeusz2 as it conflicts with the required package)
Then the interface can be compiled by executing
Jan Lupa authored
5
Jan Lupa authored
6
    swipl-ld -v -shared -o morfeusz2-swi.so morfeusz2-glueswi.cc -lmorfeusz2  
Jan Lupa authored
7
8
in the parser directory.
Jan Lupa authored
9
For an example usage of Świgra's server mode (in OCaml) see parser/swigra_test.ml  
Jan Lupa authored
10
The demo assumes you are using swipl which you can install by executing:
Jan Lupa authored
11
Jan Lupa authored
12
    sudo apt-get install swi-prolog  
Jan Lupa authored
13
It also makes use of curl which can be installed with:
Jan Lupa authored
14
Jan Lupa authored
15
    sudo apt-get install curl
Jan Lupa authored
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125

Below are the contents of the original README file.

========================================================================
Analizator składniowy Świgra

========================================================================

Paczka zawiera analizator składniowy Świgra w wersji 1 (2007) i w wersji
rozwojowej kandydującej do nazwy Świgra 2 (2016).

Wersja 1 stanowi komputerową realizację gramatyki przedstawionej przez
prof. Marka Świdzińskiego w jego książce „Gramatyka formalna języka
polskiego” (1992).  Wersja 1 jest częścią wyników pracy doktorskiej
Marcina Wolińskiego opracowanej i obronionej w Instytucie Podstaw
Informatyki PAN w Warszawie w maju 2005. Inicjatorem i promotorem
pracy był Janusz S. Bień, aktualnie z Katedry Lingwistyki Formalnej
Uniwersytetu Warszawskiego.

Wersja 2 reguł została napisana od nowa przez Marcina Wolińskiego przy
współpracy z prof. Świdzińskim.

Runtime analizatora nazywamy roboczo Birnam (z hasłem reklamowym „We
bring forests to your doors”).  Stanowi on interpreter gramatyk DCG
stosujący strategię wstępującą z zapamiętywaniem wyników pośrednich.
Zawiera też pewne rozszerzenia specyficzne dla implementowanej
gramatyki.

Nie wszystkie pliki składające się na analizator zostały udostępnione
na tej samej licencji.  Warunki licencji można sprawdzić w nagłówkach
poszczególnych plików.  Większość plików składających się na te
programy zostaje udostępniona na licencji GNU General Public License 3
(por. plik gpl-3.0.txt).  Pliki umożliwiające skład drzew analizy w
LaTeXu zostały udostępnione na licencji LaTeX Project Public License
wersja 1.2, ponieważ licencja GPL nie jest zgodna ze standardowymi
modułami LaTeXa.  Niektóre pliki pomocnicze zostały dla uproszczenia
uznane za dobro publiczne — autor zrzekł się praw autorskich do nich.
Dotyczy to przykładu użycia platformy Birnam z inną gramatyką oraz
kodu w języku C pozwalającego na wywołanie analizatora Morfeusz z
programu prologowego.

Udostępnienie wersji 1 analizatora na licencji GPL było możliwe dzięki
uprzejmej zgodzie następujących osób i instytucji:

1. prof. Marka Świdzińskiego jako autora reguł gramatycznych,

2. dr. hab. Janusza S. Bienia, prof. UW jako kierownika zrealizowanego
   w Instytucie Informatyki Uniwersytetu Warszawskiego projektu KBN
   8T11C 00213 "Zestaw testów do weryfikacji i oceny analizatorów
   języka polskiego", w ramach którego w latach 1997-1999 powstał
   prototyp analizatora Świgra (pod nazwą AS),

3. dyrekcji Instytutu Podstaw Informatyki PAN - mojego pracodawcy.

Rozwój wersji 2 był finansowany w ramach projektów:
• MNiSW N N104 224735 (2008–2011),
• Nekst http://www.ipipan.waw.pl/nekst/ (2012–2013),
• CLARIN-PL http://clarin-pl.eu/ (2014–2016).

Właścicielem majątkowych praw autorskich do wersji 2 jest Instytut
Podstaw Informatyki Polskiej Akademii Nauk.

========================================================================
Użytkowanie w systemie Ubuntu
========================================================================

Pliki analizatora i dezambiguatora muszą znaleźć się w systemie plików
w takich podkatalogach, jak w paczce dystrybucyjnej.  Analizator (z
wczepionym dezambiguatorem) uruchamia się za pomocą skryptów zawartych
w podkatalogu parser/.

Najwygodniejszym sposobem interaktywnego użycia Świgry wydaje się
interfejs webowy, który można wywołać poleceniem
	  ./swigra -w
Alternatywnie można użyć interfejsu okienkowego SWI Prologu:
	  ./swigra
Domyślnie używana jest Świgra 2, aby wywołać archiwalną wersję Świgry
jeden w wywołaniu skryptu musi znaleźć się argument -1.

Świgra używa analizatora morfologicznego Morfeusz 2
(http://sgjp.pl/morfeusz), który musi być zainstalowany w systemie.
Dodatkową komplikację stanowi fragment kodu łączącego Morfeusza 2 z
SWI Prologiem (morfeusz2-glueswi.cc), który musi zostać skompilowany
do biblioteki dynamicznej zgodnie z opisem na początku wymienionego
pliku źródłowego.  Dystrybucja zawiera kilka wariantów kompilatu
(morfeusz2-*so), w szczególności morfeusz2-swi7-64.so dla Ubuntu 16.04
64-bit.  W razie niezgodności należy przekompilować kod.

W trybie wsadowym Świgra może używać Morfeusza lub pracować na
interpretacjach dostarczonych w formacie NKJP.

Pakiety Ubuntu konieczne dla działania całej wsadowej ścieżki
przetwarzania (skrypty genparser i swigra_batch):

swi-prolog
libbsd-resource-perl
libfile-slurp-perl
libxml-libxml-perl



========================================================================
Marcin Woliński                                 <wolinski@ipipan.waw.pl>
Zespół Inżynierii Lingwistycznej
Instytut Podstaw Informatki PAN

%%% Local Variables: 
%%% coding: utf-8
%%% mode: text
%%% End: