Projekty finansowane przez NCN


Dane kierownika projektu i jednostki realizującej

Szczegółowe informacje o projekcie i konkursie

Słowa kluczowe

Aparatura

Wyczyść formularz

Głęboka ekstrakcja w celu niezawodnego rozpoznawania mowy

2021/42/E/ST7/00452

Słowa kluczowe:

przetwarzanie sygnałów mowy i audio uczenie maszynowe głębokie sieci neuronowe sztuczna inteligencja statystyczne przetwarzanie sygnałów procesy stochastyczne metody optymalizacyjne analiza mowy zrozumienie mowy

Deskryptory:

  • ST7_7: Przetwarzanie sygnałów
  • ST6_11: Uczenie maszynowe, statystyczne przetwarzanie danych i zastosowania w przetwarzaniu sygnałów (np. mowy, obrazów, filmów)

Panel:

ST7 - Inżynieria systemów i komunikacji: elektronika, komunikacja, optoelektronika

Jednostka realizująca:

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie, Wydział Informatyki, Elektroniki i Telekomunikacji

woj.

Inne projekty tej jednostki 

Kierownik projektu (z jednostki realizującej):

dr hab. Konrad Karol Kowalczyk 

Liczba wykonawców projektu: 10

Konkurs: SONATA BIS 11 - ogłoszony 2021-06-15

Przyznana kwota: 1 878 000 PLN

Rozpoczęcie projektu: 2022-11-02

Zakończenie projektu: 2027-11-01

Planowany czas trwania projektu: 60 miesięcy (z wniosku)

Status projektu: Projekt w realizacji

Opis Projektu

Pobierz opis projektu w formacie .pdf

Uwaga - opisy projektów zostały sporządzone przez samych autorów wniosków i w niezmienionej formie umieszczone w systemie.

Dane z raportu końcowego/rocznego

  • Teksty w publikacjach pokonferencyjnych (2)
  1. Causal Signal-Based DCCRN with Overlapped-Frame Prediction for Online Speech Enhancement
    Autorzy:
    Julitta Bartolewska, Stanisław Kacprzak, Konrad Kowalczyk
    Konferencja:
    Proc. INTERSPEECH 2023 (rok: 2023, tom: Annual Conf. Int. Speech Communication Association (INTERSPEECH), strony: 4039-4043), Wydawca: International Speech Communication Association (ISCA)
    Data:
    konferencja 20-24 August 2023
    Status:
    Opublikowana
    Doi:
    10.21437/Interspeech.2023-2177 - link do publikacji
  2. Joint Blind Source Separation and Dereverberation for Automatic Speech Recognition using Delayed-Subsource MNMF with Localization Prior
    Autorzy:
    Mieszko Fra´s, Marcin Witkowski, Konrad Kowalczyk
    Konferencja:
    Proc. INTERSPEECH 2023 (rok: 2023, tom: Annual Conf. Int. Speech Communication Association (INTERSPEECH), strony: 3734-3738), Wydawca: International Speech Communication Association (ISCA)
    Data:
    konferencja 20-24 August 2023
    Status:
    Opublikowana
    Doi:
    10.21437/Interspeech.2023-2520 - link do publikacji