Projekty finansowane przez NCN


Dane kierownika projektu i jednostki realizującej

Szczegółowe informacje o projekcie i konkursie

Słowa kluczowe

Aparatura

Wyczyść formularz

Wielkoskalowa analiza tekstu i metodologiczne podstawy stylistyki komputerowej

2017/26/E/HS2/01019

Słowa kluczowe:

stylistyka komputerowa stylometria językoznawstwo kwantytatywne duże korpusy Big Data

Deskryptory:

  • HS2_6: Językoznawstwo ogólne, teoria i metodologia badań językoznawczych
  • HS2_1: Historia literatury (w tym: starożytnej, nowożytnej, współczesnej; narodowej, światowej) oraz krytyka i interpretacja literacka
  • HS2_2: Teoria literatury, historia myśli literaturoznawczej, metody i orientacje badań literacko-kulturowych, antropologia literatury, komparatystyka i translatologia literacko-kulturowa

Panel:

HS2 - Kultura i twórczość kulturowa: literaturoznawstwo, bibliotekoznawstwo, językoznawstwo, kulturoznawstwo, nauki o sztuce

Jednostka realizująca:

Instytut Języka Polskiego Polskiej Akademii Nauk

woj. małopolskie

Inne projekty tej jednostki 

Kierownik projektu (z jednostki realizującej):

dr hab. Maciej Eder 

Liczba wykonawców projektu: 6

Konkurs: SONATA BIS 7 - ogłoszony 2017-06-14

Przyznana kwota: 1 258 200 PLN

Rozpoczęcie projektu: 2018-05-08

Zakończenie projektu: 2024-11-07

Planowany czas trwania projektu: 60 miesięcy (z wniosku)

Status projektu: Projekt w realizacji

Opis Projektu

Pobierz opis projektu w formacie .pdf

Uwaga - opisy projektów zostały sporządzone przez samych autorów wniosków i w niezmienionej formie umieszczone w systemie.

Dane z raportu końcowego/rocznego

  • Publikacje w czasopismach (11)
  • Teksty w publikacjach pokonferencyjnych (10)
  • Publikacje książkowe (3)
  1. Detecting Ottokar II's 1248–1249 uprising and its instigators in co-witnessing networks
    Autorzy:
    Jeremi Ochab, Jan Škvrňák, Michael Škvrňák
    Czasopismo:
    Historical Methods: A Journal of Quantitative and Interdisciplinary History (rok: 2022, tom: 55, strony: 189-208), Wydawca: Taylor & Francis
    Status:
    Opublikowana
    Doi:
    10.1080/01615440.2022.2065397 - link do publikacji
  2. La prosa de Gustavo Adolfo Bécquer en los límites de la poesía: Análisis estilométrico
    Autorzy:
    Laura Hernandez Lorenzo
    Czasopismo:
    apropos [Perspektiven auf die Romania] (rok: 2022, tom: 9, strony: 37-56), Wydawca: Hamburg Universitat
    Status:
    Opublikowana
    Doi:
    0.15460/apropos.9.1875 - link do publikacji
  3. Słowozbiory "Tekstów Drugich"
    Autorzy:
    Maciej Maryl, Maciej Eder
    Czasopismo:
    Teksty Drugie (rok: 2023, tom: 33, strony: 346-364), Wydawca: IBL PAN
    Status:
    Opublikowana
    Doi:
    10.18318/td.2023.1.21 - link do publikacji
  4. The fall of genres that did not happen: formalising history of the universal" semantics of Russian iambic tetrameter
    Autorzy:
    Antonina Martynenko, Artjoms Šeļa
    Czasopismo:
    Studia Metrica et Poetica (rok: 2023, tom: 10, strony: 89-111), Wydawca: University of Tartu Press
    Status:
    Opublikowana
    Doi:
  5. Topic Modeling, Long Texts and the Best Number of Topics: Some Problems and Solutions
    Autorzy:
    Stefano Sbalchiero, Maciej Eder
    Czasopismo:
    Quantity & Quality (rok: 2020, tom: 54, strony: 1095–1108), Wydawca: Springer
    Status:
    Opublikowana
    Doi:
    10.1007/s11135-020-00976-w - link do publikacji
  6. Challenging Stylometry: the authorship of the baroque play La Segunda Celestina
    Autorzy:
    Laura Hernandez Lorenzo, Joanna Byszuk
    Czasopismo:
    Digital Scholarship in the Humanities , Wydawca: Oxford University Press
    Status:
    Przyjęta do publikacji
  7. Stylistic fingerprints, POS tags and inflected languages: A case study in Polish
    Autorzy:
    Maciej Eder, Rafał Górski
    Czasopismo:
    Journal of Quantitative Linguistics (rok: 2023, tom: 30, strony: 86-103), Wydawca: Taylor & Francis
    Status:
    Opublikowana
    Doi:
    10.1080/09296174.2022.2122751 - link do publikacji
  8. Erinevused, kaugused ja sõrmejäljed: Stilomeetria ja mitmemõõtmelise tekstianalüüsi alused [Differences, distances and fingerprints: the fundamentals of stylometry and multivariate text analysis]
    Autorzy:
    Šeļa, Artjoms
    Czasopismo:
    Keel ja Kirjandus (rok: 2021, tom: 45513, strony: 696-718), Wydawca: Estonian Academy of Sciences
    Status:
    Opublikowana
    Doi:
    10.54013/kk764a3 - link do publikacji
  9. Stylistic change in early modern Spanish poetry through network analysis (with an especial focus on Fernando de Herrera's role)
    Autorzy:
    Laura Hernandez Lorenzo
    Czasopismo:
    Neophilologus (rok: 2022, tom: 106, strony: 397–417), Wydawca: Springer
    Status:
    Opublikowana
    Doi:
    10.1007/s11061-021-09717-2 - link do publikacji
  10. The Voices of Doctor Who – How Stylometry Can be Useful in Revealing New Information About TV Series
    Autorzy:
    Joanna Byszuk
    Czasopismo:
    Digital Humanities Quarterly (rok: 2020, tom: 14, strony: 25934), Wydawca: Association for Computers and the Humanities
    Status:
    Opublikowana
  11. Computational thematics: Comparing algorithms for clustering the genres of literary fiction
    Autorzy:
    Oleg Sobchuk, Artjoms Šeļa
    Czasopismo:
    Social Sciences Communications (rok: 2024, ), Wydawca: Nature
    Status:
    Przyjęta do publikacji
  1. Using Word Embeddings for Validation and Enhancement of Spatial Entity Lists
    Autorzy:
    Berenike Herrmann, Joanna Byszuk, Giulia Grisot
    Konferencja:
    Digital Humanities 2022 (rok: 2022, ), Wydawca: University of Tokyo
    Data:
    konferencja 25-29.07.2022
    Status:
    Opublikowana
  2. Identifying Similarities in Text Analysis: Hierarchical Clustering (Linkage) versus Network Clustering (Community Detection)
    Autorzy:
    Jeremi K. Ochab, Joanna Byszuk, Steffen Pielström, Maciej Eder
    Konferencja:
    Digital Humanities 2019: Book of Abstracts (rok: 2019, ), Wydawca: University of Utrecht
    Data:
    konferencja 43657
    Status:
    Opublikowana
  3. Stylometric investigations into translationese: The Baby-Sitters Club across languages
    Autorzy:
    Joanna Byszuk, Quinn Dombrowski
    Konferencja:
    Proceedings of the 16th International Conference on Statistical Analysis of Textual Data (rok: 2022, ), Wydawca: VadiStat
    Data:
    konferencja 6-8.07.2022
    Status:
    Opublikowana
  4. Weak Genres: Modeling Association Between Poetic Meter and Meaning in Russian Poetry
    Autorzy:
    Artjoms Šeļa, Boris Orekhov, Roman Leibov
    Konferencja:
    CHR 2020: Workshop on Computational Humanities Research (rok: 2020, ), Wydawca: CEUR-WS.org
    Data:
    konferencja 18–20.11.2020
    Status:
    Opublikowana
  5. Detecting direct speech in multilingual collection of 19th-century novels
    Autorzy:
    Joanna Byszuk, Michał Woźniak, Mike Kestemont, Albert Leśniak, Wojciech Łukasik, Artjoms Šeļa, Maciej Eder
    Konferencja:
    Language Resources and Evaluation (LREC) (rok: 2020, ), Wydawca: European Language Resources Association (ELRA)
    Data:
    konferencja 11-16.05.2020
    Status:
    Opublikowana
  6. Measuring Rhythm Regularity in Verse: Entropy of Inter-Stress Intervals
    Autorzy:
    Artjoms Šeļa, Mikhail Gronas
    Konferencja:
    CHR 2022: Computational Humanities Research Conference (rok: 2022, ), Wydawca: CEUR-WS.org
    Data:
    konferencja 12-14.12.2022
    Status:
    Opublikowana
  7. One word to rule them all: Understanding word embeddings for authorship attribution
    Autorzy:
    Maciej Eder, Artjoms Šeļa
    Konferencja:
    Digital Humanities 2022 (rok: 2022, ), Wydawca: University of Tokyo Press
    Data:
    konferencja 25–29.07.2022
    Status:
    Opublikowana
  8. Boosting word frequencies in authorship attribution
    Autorzy:
    Maciej Eder
    Konferencja:
    CHR 2022: Computational Humanities Research Conference (rok: 2022, ), Wydawca: CEUR-WS.org
    Data:
    konferencja 12-14.12.2022
    Status:
    Opublikowana
  9. Feature Selection in Authorship Attribution: Ordering the Wordlist
    Autorzy:
    Joanna Byszuk, Maciej Eder
    Konferencja:
    Digital Humanities 2019: Book of Abstratcs (rok: 2019, ), Wydawca: University of Utrecht
    Data:
    konferencja 43658
    Status:
    Opublikowana
  10. Improving the performance of word frequencies in authorship attribution
    Autorzy:
    Maciej Eder
    Konferencja:
    Proceedings of the 16th International Conference on Statistical Analysis of Textual Data (rok: 2022, ), Wydawca: VadiStat
    Data:
    konferencja 6-8.07.2022
    Status:
    Opublikowana
  1. On computers in text analysis
    Autorzy:
    Joanna Byszuk
    Książka:
    The Bloomsbury Handbook to the Digital Humanities (rok: 2023, tom: b.d., strony: 159–168), Wydawca: James O'Sullivan
    Status:
    Opublikowana
  2. Tekst w humanistyce cyfrowej. Modelowanie tematyczne
    Autorzy:
    Maciej Eder
    Książka:
    Od Gutenberga do Zuckerberga. Wstęp do humanistyki cyfrowej (rok: 2023, tom: b.d., strony: 129-141), Wydawca: Universitas
    Status:
    Opublikowana
  3. From stage to page: language independent bootstrap measures of distinctiveness in fictional speech
    Autorzy:
    Artjoms Šeļa, Ben Nagy, Joanna Byszuk, Laura Hernández-Lorenzo, Botond Szemes, Maciej Eder
    Książka:
    Workshop on Computational Drama Analysis: Achievements and Opportunities (rok: 2022, tom: 1, strony: 45310), Wydawca: de Gruyter
    Status:
    Przyjęta do publikacji