Projekty finansowane przez NCN


Dane kierownika projektu i jednostki realizującej

Szczegółowe informacje o projekcie i konkursie

Słowa kluczowe

Aparatura

Wyczyść formularz

Analiza zastosowania uczenia maszynowego w przestrzennym przetwarzaniu sygnałów dźwiękowych

2017/25/B/ST7/01792

Słowa kluczowe:

dźwięk przestrzenny macierze mikrofonowe rozpoznawanie mówców klasyfikacja źródeł dźwięku

Deskryptory:

  • ST7_7: Przetwarzanie sygnałów
  • ST6_11: Uczenie maszynowe, statystyczne przetwarzanie danych i zastosowanie w przetwarzaniu sygnałów
  • ST2_10: Akustyka

Panel:

ST7 - Inżynieria systemów i komunikacji: elektronika, komunikacja, optoelektronika

Jednostka realizująca:

Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie, Wydział Informatyki, Elektroniki i Telekomunikacji

woj. małopolskie

Inne projekty tej jednostki 

Kierownik projektu (z jednostki realizującej):

dr hab. Konrad Kowalczyk 

Liczba wykonawców projektu: 9

Konkurs: OPUS 13 - ogłoszony 2017-03-15

Przyznana kwota: 998 400 PLN

Rozpoczęcie projektu: 2018-10-01

Zakończenie projektu: 2023-05-30

Planowany czas trwania projektu: 55 miesięcy (z wniosku)

Status projektu: Projekt rozliczony

Opis Projektu

Pobierz opis projektu w formacie .pdf

Uwaga - opisy projektów zostały sporządzone przez samych autorów wniosków i w niezmienionej formie umieszczone w systemie.

Zakupiona aparatura

  1. 2 macierze mikrofonowe wraz z przetwornikami analogowo-cyfrowymi i wielokanałową kartą dźwiękową. Za kwotę 40 752 PLN
  2. 3 komputery / laptopy. Za kwotę 15 000 PLN
  3. Bazy danych z nagraniami. Za kwotę 17 000 PLN
  4. System odsłuchowy. Za kwotę 18 000 PLN

Dane z raportu końcowego/rocznego

  • Publikacje w czasopismach (3)
  • Teksty w publikacjach pokonferencyjnych (13)
  1. An Overview of Machine Learning and Other Data-Based Methods for Spatial Audio Capture, Processing, and Reproduction
    Autorzy:
    Maximo Cobos, Jens Ahrens, Konrad Kowalczyk, and Archontis Politis
    Czasopismo:
    EURASIP Journal on Audio, Speech, and Music Processing (rok: 2022, tom: 10, strony: 45312), Wydawca: Springer Open
    Status:
    Opublikowana
    Doi:
    10.1186/s13636-022-00242-x - link do publikacji
  2. Data‑based spatial audio processing
    Autorzy:
    Maximo Cobos, Jens Ahrens, Konrad Kowalczyk, and Archontis Politis
    Czasopismo:
    EURASIP Journal on Audio, Speech, and Music Processing (rok: 2022, tom: 13, strony: 45294), Wydawca: Springer Open
    Status:
    Opublikowana
    Doi:
    10.1186/s13636-022-00248-5 - link do publikacji
  3. On Ambisonic Source Separation with Spatially Informed Non-negative Tensor Factorization
    Autorzy:
    Mateusz Guzik and Konrad Kowalczyk
    Czasopismo:
    IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH AND LANGUAGE PROCESSING (rok: 2023, tom: 1, strony: 45305), Wydawca: IEEE
    Status:
    Złożona
  1. Data Diversity for Improving DNN-based Localization of Concurrent Sound Events
    Autorzy:
    Daniel Krause, Archontis Politis, and Konrad Kowalczyk
    Konferencja:
    European Signal Processing Conference (EUSIPCO) (rok: 2021, ), Wydawca: EURASIP
    Data:
    konferencja 44431
    Status:
    Opublikowana
  2. Feature Overview for Joint Modeling of Sound Event Detection and Localization Using a Microphone Array
    Autorzy:
    Daniel Krause, Archontis Politis, and Konrad Kowalczyk
    Konferencja:
    European Signal Processing Conference (EUSIPCO) (rok: 2020, ), Wydawca: EURASIP
    Data:
    konferencja 44214
    Status:
    Opublikowana
  3. Sparse Linear Prediction-based Dereverberation for Signal Enhancement in Distant Speaker Verification
    Autorzy:
    Marcin Witkowski, Magdalena Rybicka, and Konrad Kowalczyk
    Konferencja:
    European Signal Processing Conference (EUSIPCO) (rok: 2021, ), Wydawca: EURASIP
    Data:
    konferencja 44431
    Status:
    Opublikowana
  4. Comparison of Convolution Types in CNN-basedFeature Extraction for Sound Source Localization
    Autorzy:
    Daniel Krause, Archontis Politis, and Konrad Kowalczyk
    Konferencja:
    European Signal Processing Conference (EUSIPCO) (rok: 2020, ), Wydawca: EURASIP
    Data:
    konferencja 44214
    Status:
    Opublikowana
  5. Convolutional Weighted Minimum Mean Square Error Filter for Joint Source Separation and Dereverberation
    Autorzy:
    Mieszko Fraś, Marcin Witkowski and Konrad Kowalczyk
    Konferencja:
    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (rok: 2022, ), Wydawca: IEEE
    Data:
    konferencja 44703
    Status:
    Opublikowana
  6. Convolutive Weighted Multichannel Wiener Filter Front-end for Distant Automatic Speech Recognition in Reverberant Multispeaker Scenarios
    Autorzy:
    Mieszko Fras, Marcin Witkowski, and Konrad Kowalczyk
    Konferencja:
    Annual Conf. Int. Speech Communication Association (INTERSPEECH) (rok: 2022, ), Wydawca: Int. Speech Communication Association
    Data:
    konferencja 44822
    Status:
    Opublikowana
  7. Incorporation of Localization Information for Sound Source Separation in Spherical Harmonic Domain
    Autorzy:
    Mateusz Guzik, Mieszko Fraś, and Konrad Kowalczyk
    Konferencja:
    IEEE International Workshop on Multimedia Signal Processing (rok: 2021, ), Wydawca: IEEE
    Data:
    konferencja 44475
    Status:
    Opublikowana
  8. Wishart Localization Prior on Spatial Covariance Matrix in Ambisonic Source Separation using Non-negative Tensor Factorization
    Autorzy:
    Mateusz Guzik and Konrad Kowalczyk
    Konferencja:
    IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP) (rok: 2022, ), Wydawca: IEEE
    Data:
    konferencja 44703
    Status:
    Opublikowana
  9. End-to-End Neural Speaker Diarization with an Iterative Refinement of Non-Autoregressive Attention-based Attractors
    Autorzy:
    Magdalena Rybicka, Jesus Villalba, Najim Dehak, and Konrad Kowalczyk
    Konferencja:
    Annual Conf. Int. Speech Communication Association (INTERSPEECH) (rok: 2022, ), Wydawca: Int. Speech Communication Association
    Data:
    konferencja 44822
    Status:
    Opublikowana
  10. Adversarial Domain Adaptation with Paired Examples for Acoustic Scene Classification on Different Recording Devices
    Autorzy:
    Stanisław Kacprzak and Konrad Kowalczyk
    Konferencja:
    European Signal Processing Conference (EUSIPCO) (rok: 2021, ), Wydawca: EURASIP
    Data:
    konferencja 44431
    Status:
    Opublikowana
  11. Refining DNN-based Mask Estimation using CGMM-based EM Algorithm for Multi-channel Noise Reduction
    Autorzy:
    Julitta Bartolewska, Stanisław Kacprzak, and Konrad Kowalczyk
    Konferencja:
    Annual Conf. Int. Speech Communication Association (INTERSPEECH) (rok: 2022, ), Wydawca: Int. Speech Communication Association
    Data:
    konferencja 44822
    Status:
    Opublikowana
  12. Convolutive NTF for Ambisonic Source Separation under Reverberant Conditions
    Autorzy:
    Mateusz Guzik and Konrad Kowalczyk
    Konferencja:
    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) (rok: 2023, ), Wydawca: IEEE
    Data:
    konferencja 45081
    Status:
    Opublikowana
  13. NTF of Spectral and Spatial Features for Tracking and Separation of Moving Sound Sources in Spherical Harmonic Domain
    Autorzy:
    Mateusz Guzik and Konrad Kowalczyk
    Konferencja:
    Annual Conf. Int. Speech Communication Association (INTERSPEECH) (rok: 2022, ), Wydawca: Int. Speech Communication Association
    Data:
    konferencja 44822
    Status:
    Opublikowana