Plenary Sessions of the Parliament of Finland, Kielipankki Korp Version 1.1

View resource name in all available languages

Eduskunnan täysistunnot, Kielipankin Korp-versio 1.1

eduskunta-v1-korp

Persistent Identifier of this resource:

http://urn.fi/urn:nbn:fi:lb-2017020202

Access location:

Please note that an updated version of this corpus has been published on 2nd December 2019, see details: http://urn.fi/urn:nbn:fi:lb-2019101621.

The corpus, containing the first version of the transcriptions of of the plenary sessions of the parliament of Finland from 10.09.2008 to 1.7.2016, is available in Kielipankki, the Language Bank of Finland (Korp service), see Access location. Part of the corpus is available also in the LAT service. Korp search results have a link to the LAT version of the session if it exists.

The original transcripts produced by the Parliament of Finland have been aligned with the audio tracks of the video recordings of the plenary sessions. Each speaker's speech has been separately aligned. The alignment is based on the output of a set of automatic tools and it was provided by Aalto University.

Please note that the aligned transcript may contain errors and some superfluous tags may have been inserted in the text due to the automatic alignment and speech recognition process. For portions where the original audio track did not have matching text in the transcript, the speech signal was recognized automatically, and such portions may contain strange or erroneous content.

The text in the transcripts has been parsed automatically using a Finnish language model. This is why the part-of-speech of word tokens in the Swedish portions within the transcripts has usually been marked as 'foreign word'.

View resource description in all available languages

Huomaa, että tästä aineistosta on ilmestynyt 2.12.2019 päivitetty versio, ks. http://urn.fi/urn:nbn:fi:lb-2019101621.

Aineisto sisältää ajalla 10.09.2008 - 1.7.2016 pidettyjen eduskunnan täysistuntojen videotallenteista tehtyjen transkriptioiden ensimmäisen version. Eduskunnan tuottamat pöytäkirjat on kohdistettu istuntojen videotallenteiden ääniraitaan siten, että kukin puhuja on kohdistettu erikseen. Kohdistus on tehty automaattisin menetelmin Aalto-yliopistossa.

Tekstimuotoinen aineisto on saatavilla Kielipankin Korp-palvelussa, ks. Access location. Osa aineistosta on tarjolla myös LAT-palvelussa. Hakutuloksissa on tällöin linkki istunnon LAT-versioon.

Huomaa, että kohdistetussa pöytäkirjaversiossa voi esiintyä virheitä ja siihen on saattanut syntyä ylimääräisiä merkkauksia automaattisen tunnistusprosessin yhteydessä. Ne kohdat äänitteessä, joille ei ole automaattisessa kohdistuksessa löytynyt hyvää vastinetta pöytäkirjan tekstistä, on tunnistettu kokonaan automaattisesti, joten tällaisissa kohdissa saattaa olla kummallista tai virheellistä sisältöä.

Tekstiaineiston automaattisessa jäsentämisessä on käytetty suomen kielen mallia. Tästä syystä alkuperäisten pöytäkirjojen ruotsinkieliset kohdat on yleensä merkitty sanaluokaltaan vierassanoiksi.

You don’t have the permission to edit this resource.
  • TDT alpha