Name	Last Update	Last Commit 50f3afb6 – Add 2011-2015 period. History
1919-1922/sejm/posiedzenia/pp	Loading commit data...
1922-1927	Loading commit data...
1928-1930	Loading commit data...
1930-1935	Loading commit data...
1935-1938	Loading commit data...
1938-1939	Loading commit data...
1943-1947/krn/posiedzenia/pp	Loading commit data...
1947-1952/sejm/posiedzenia/pp	Loading commit data...
1952-1956/sejm/posiedzenia/pp	Loading commit data...
1957-1961/sejm/posiedzenia/pp	Loading commit data...
1961-1965/sejm/posiedzenia/pp	Loading commit data...
1965-1969/sejm/posiedzenia/pp	Loading commit data...
1969-1972/sejm/posiedzenia/pp	Loading commit data...
1972-1976/sejm/posiedzenia/pp	Loading commit data...
1976-1980/sejm/posiedzenia/pp	Loading commit data...
1980-1985/sejm/posiedzenia/pp	Loading commit data...
1985-1989/sejm/posiedzenia/pp	Loading commit data...
1989-1991	Loading commit data...
1991-1993	Loading commit data...
1993-1997	Loading commit data...
1997-2001	Loading commit data...
2001-2005	Loading commit data...
2005-2007	Loading commit data...
2007-2011	Loading commit data...
2011-2015	Loading commit data...
PPC_header.xml	Loading commit data...
README.md	Loading commit data...

README.md

The Polish Parliamentary Corpus / Korpus Dyskursu Parlamentarnego

The Polish Parliamentary Corpus (PPC) is a large collection of linguistically analysed documents from the proceedings of Polish Parliament, Sejm and Senate. It is based on the Polish Sejm Corpus co-funded by project CESAR and is currently being updated by CLARIN-PL infrastructure.

Corpus data

The current size of the corpus amounts over 700M segments. Apart from the stenographic records of plenary sittings and committee sittings, the corpus contains also interpellations and questions.

Corpus files are made available in XML TEI P5 format compatible with the annotation used by the National Corpus of Polish. This repository contains Unannotated TEI version of the corpora. For annotated version please go to the PPC homepage.