Random set of recordings extracted from the Donate Speech Corpus on 29th June 2020
View resource name in all available languages
Lahjoita puhetta -aineistosta 29.6.2020 poimittu satunnaisotos
puhelahjat-20200629-src
Persistent Identifier of this resource:
http://urn.fi/urn:nbn:fi:lb-2020100221
Lahjoita puhetta -aineistosta poimittiin kesäkuun 2020 lopussa satunnaisotannalla pieni sadan näytteen testimateriaali, jonka avulla oli ensisijaisesti tarkoitus selvittää, täyttääkö kampanjassa kertyvä puhemateriaali toivotut tekniset vaatimukset. Pientä otosta tutkimalla voitiin myös arvioida, kuinka paljon varsinaista puhetta aineistoon keskimäärin sisältyy. Testiotoksen avulla kokeillaan myös aineiston litterointia käsin ja koneellisesti ja saadaan tulevan tutkimus- ja kehitystyön pohjaksi alustavaa tietoa siitä, miten hyvin tai huonosti nykyiset automaattiset puheentunnistimet selviävät tämänkaltaisesta aineistosta.
Tämä ensimmäinen, hyvin suppea testiaineisto on toistaiseksi saatavilla vain rajoitetusti hankkeen sisäiseen käyttöön. Viimeistään keväällä 2021 tullaan tarjoamaan aineistokokonaisuuksia laajemmin tutkijoiden ja yritysten käyttöön.
People who looked at this resource also viewed the following:
- The Downloadable Version of the Finnish Text Collection - Commercial Use
- The Russian Sub-corpus of ParFin 2016, Finnish-Russian Parallel Corpus of Literary Texts
- ParFin 2016, ParRus 2016, Finnish-Russian / Russian-Finnish Parallel Corpus of Literary Texts
- The Advanced Finnish Learners’ Corpus, Downloadable Version