Publikáció

2021.04.16.

Megjelent online depresszió-fórumok NLP-elemzésével foglalkozó projektünk új eredménye az SSM Population Health (D1) hasábjain, Németh Renáta, Sik Domonkos és Katona Eszter tollából, The asymmetries of the biopsychosocial model of depression in lay discourses – Topic modelling online depression forums címmel:

https://www.sciencedirect.com/science/article/pii/S2352827321000604

Barna Ildikó és Knap Árpád részvétele a 2021-es ISCA konferencián

2020.12.30.

Örömhír. Barna Ildikó és Knap Árpád az Indiana University által szervezett 2021-es ISCA konferencia előadói között. Az “Antisemitism in Today’s America: Manifestations, Causes, and Consequences” c. konferencia az antiszemitizmus-kutatók egyik legfontosabb nemzetközi fóruma. Ildikó és Árpád a Soros Györggyel kapcsolatos, hazai és amerikai összeesküvés-elméletek összehasonlító elemzését mutatja be, online diskurzusok NLP-elemzését alkalmazva. Külön öröm számunkra, hogy a szervező intézetvezető szerint “Your paper promises to make an especially interesting contribution to our collective work on contemporary antisemitism.”
https://isca.indiana.edu/

Siker az ELTE TáTK-s Kari TDK-n

2020.12.13.

Csomor Gábor hallgatónk (Survey Statisztika és Adatanalitika MSc) első helyezést ért el a Kari TDK-n “Romákkal szembeni hivatali diszkrimináció mérése természetesnyelv-feldolgozással” c. dolgozatával. Témavezetője kutatócsoportunk tagja, Németh Renáta és Simonovits Borbála (ELTE PPK) volt. Gratulálunk!

Publikáció

2020.09.30.

Kutatócsoportunk három tagja (Németh RenátaKatona Eszter RitaKmetty Zoltán) szerzőségében született az a frissen megjelent cikk, aminek célja az automatizált szövegelemzés jellegzetességeinek és lehetőségeinek bemutatása. Céluk az volt, hogy ebbe az itthon még kevéssé intézményesült területbe betekintést engedve inspirációt nyújtsanak a hazai társadalomkutatók számára, mert meggyőződésük szerint a szövegbányászat néhány éven belül standard eszköze lesz a nemzetközi alkalmazott társadalomkutatásnak.

https://szociologia.hu/szociologiai-szemle/az_automatizalt_szovegelemzes_perspektivaja_a_tarsadalomtudomanyokban

RC2S2 előadások a “szociológia egy sikeres évszázad előtt?” konferencián

2020.09.21.

Október 8-9-én kerül megrendezésre “A szociológia egy sikeres évszázad előtt?” című konferencia az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferencia szervezőbizottságában Koltai Júlia, az RC2S2 tagja. Előadóként/társszerzőként szerepel  összesen 8 (!) előadással kutatócsoportunkból Barna Ildikó, Katona Eszter, Kmetty Zoltán, Knap Árpád, Koltai Júlia, Németh Renáta, Rakovics Márton, Sik Domonkos

A kutatócsoporthoz köthető előadások:

október 8. csütörtök

INNOVATÍV MÓDSZEREK A SZOCIOLÓGIAI KUTATÁSOKBAN

13:45-15:30 A természetes nyelvfeldolgozás lehetőségei és korlátai I.

Knap Árpád (társszerző: Barna Ildikó): Trianon és a holokauszt tematikus és diszkurzív keretezésének vizsgálata a természetesnyelv-feldolgozás segítésgével

Barna Ildikó (társszerző: Knap Árpád): A koronavírushoz kapcsolódó magyarországi online antiszemitizmus vizsgálata kvantitatív topikmodell és kvalitatív diskurzuselemzés segítségével

Németh Renáta (társszerzők: Sik Domonkos, Katona Eszter): Topikmodell használata a depresszió online diszkurzív keretezésének megértésében

15:45-17:30 A természetes nyelvfeldolgozás lehetőségei és korlátai II.

Katona Eszter (társszerzők: Kmetty Zoltán, Németh Renáta): Korrupció az online médiában. A dinamikus topikmodell alkalmazása

Máté Fanni: Osztályozó algoritmusok szociológusok számára

október 9. péntek

9:00-10:45 A COVID-19 járvány társadalmi hatásai I.

Koltai Júlia (társszerzők: Fodor Éva, Gregor Anikó, Kováts Eszter): Az egyenlőtlenségek alakulása a koronavírus idején Magyarországon

Társszerzőként:

Géring Zsuzsanna (társszerzők: Király Gábor, Rakovics Márton, Tamássy Réka): Jövő-konstrukciók a nemzetközi felsőoktatási intézményi diskurzusban

Stefkovics Ádám (társszerzők: Kmetty Zoltán, Koltai Júlia): Kísérletezz a módszereddel! A survey-kísérletek felhasználási lehetőségei a módszertan-fejlesztés területén

Tófalvy Tamás (társszerző: Koltai Júlia): A földrajzi egyenlőtlenségek algoritmikus újratermelődése a Spotify ajánlórendszerében

Kutatócsoportunk két tagja is ÚNKP-nyertes

2020.09.14.

Katona Eszter és Knap Árpád egyaránt elnyerte az Új Nemzeti Kiválósági Program (ÚNKP) ösztöndíját a következő egy éves időszakra. Eszter kutatásának címe Korrupciós kockázat és predikció – A közbeszerzési pályázatok szövegeinek elemzése a természetes nyelvfeldolgozás eszközeivel, témavezetője Fazekas Mihály. Eszter kutatásának hipotézise szerint a közbeszerzési pályázatok szövegezésének vizsgálata segíthet a korrupciógyanús esetek leleplezésében, kutatásában ezt igyekszik alátámasztani. Árpád Huszadik századi traumákkal kapcsolatos érzelmek elemzése szöveganalitikai módszerekkel című pályázatában a XX. századi magyar történelem két legnagyobb hatású eseményéhez, a Trianoni Békeszerződéshez, illetve a holokauszthoz kapcsolódó, a különböző típusú médiumokban és a közösségi médiában megjelenő érzelmeket elemzi majd. Témavezetője Barna Ildikó, kutatócsoportunk társvezetője.

Siker

2020.09.08.

Örömmel adjuk hírül, hogy hallgatónk, Csala-Ferencz Bernadett (Survey Statiszitika és Adatanalitika MSc) elnyerte az Új Nemzeti Kiválósági Program ösztöndíját az új szemeszterre. Pályázatának címe: Depresszió témájú online posztok exploratív klaszterezése. Bernadett a program támogatásával a Research Center for Computational Social Science kutatócsoport keretén belül Németh Renáta témavezetésével angol nyelvű online depresszió-fórumok posztjait kutatja natural language processing (NPL) módszerekkel.

Siker

2020.08.30.

Kutatócsapatunk óriási lehetőséget kapott – Az “OTKA” kutatási pályázat 2020. évi nyertesei között vagyunk! 2020-2023 közötti időszakra nyertünk támogatást, A politikai nyilvánosság rétegei Magyarországon (2001-2020) – a hivatalos, a médiabeli és a laikus online nyilvánosság szociológiai vizsgálata automatizált szövegelemzés és kritikai diskurzuselemzés használatával című kutatásra. Kutatásvezető: Németh Renáta.

A pályázat résztvevői: Barna Ildikó, Sik Domonkos, Rakovics Márton, Katona Eszter, Knap Árpád (RC2S2, ELTE TáTK) és Csigó Péter (BME).

A pályázat összefoglalója

Kutatásunk az NLP (Natural Language Processing: természetes nyelvfeldolgozás) innovatív, szociológiailag releváns módon való alkalmazásával a politikai nyilvánosságban detektálható nyelvhasználati változásokra koncentrál; ezeket a változásokat digitális szövegkorpuszon vizsgálja, a nyelvet mint az ideológia és hatalom eszközét tekintve, a kritikai diskurzuselemzés elméleti keretei között.

Két kiemelt, a társadalom, illetve a szociológia számára fontos tétje van a kutatásnak: (1) A politikai nyilvánosság különböző szintjeinek működése, e szintek közti interakció, ennek dinamikája, a nyelvben megmutatkozó ideológiai polarizáció, illetve olyan diskurzusok azonosítása, ahol ez nem érvényesül. (2) Az NLP módszertan szerves integrálása az empirikus szociológiába.

A kutatás mindkét eleme nemzetközileg is releváns, hiszen a vizsgált jelenség nem magyar sajátosság, máshol is tapasztalható a nyelvi polarizáció és a nyelvhasználati diffúziós folyamatok Az NLP módszertan szerves integrálása az empirikus szociológiába szintén kurrens, mert lehetőséget ad a nagy mennyiségben rendelkezésre álló digitális szövegek újfajta elemzésére úgy, hogy az eredmények interpretációjához felhasználja a szociológiai tudást.

Az adatgyűjtés és adatelemzés módszertani innovációit, a fejlesztett eszközöket nyilvánosságra hozzuk digitális repozitóriumokon, szakcikkeken és konferenciaelőadásokon, ezzel támogatva az NLP nemzetközi és hazai társadalomtudományi felhasználóit. A kutatócsoport szenior tagjai doktori témavezetőként fiatal kutatóknak, valamint szakmai gyakorlat és TDK/szakdolgozati témakiírás formájában egyetemi hallgatóknak lehetőséget teremtenek a projekthez való kapcsolódáshoz.

A kutatás jelentősége

A digitális forradalom az önkifejezés forradalma is. Míg korábban a szöveges dokumentumok főként az elit narratívái voltak, az internet megnyilvánulási lehetőséget ad gyakorlatilag bárki számára. Kutatásunk relevanciáját elsősorban az adja, hogy ennek a folyamatosan képződő szövegfolyamnak az automatizált feldolgozásával alátámaszthatóvá és megérthetővé teszi a politikai nyilvánosságnak azokat a sajátosságait, melyek a megfigyelők számára csak lokálisan észlelhetők. Kutatásunk tudományos és társadalmi tétje is nagy.

Tudományos szempontból kutatásunk a társadalomkutatás számára nyit perspektívát a survey önbevalláson alapuló információi helyett a megfigyeléses adatok kvantitatív kutatásba emelésével, a kvalitatív (diskurzuselemzés) és kvantitatív megközelítés kombinálásával, az informatikai-nyelvtechnológiai területről jövő módszerek innovatív társadalomkutatási felhasználásával. Mindez nemzetközi szinten is újdonságnak számít. A digitális kommunikáció különböző szintjeit lefedő nagyméretű szövegkorpusz NLP eszközökkel való elemzése tudomásunk szerint hazai közegben úttörő vállalkozás. Míg az erős ideológiai polarizációra vannak bizonyítékok (pl. Vegetti, 2018), és vizsgálták a politikai nyilvánosság networkösödésében megnyilvánuló polarizációt is (Bene és Szabó 2019), a nyelvi polarizáció itthon nem kutatott, és nemzetközi szinten is csak néhány előzményt találtunk, tervezett kutatásunknál jóval szerényebb alkalmazási területtel (lásd pl. Demszky és társai 2019, Twitter-adatokon).

Kutatásunk társadalmi tétje is jelentős: a nyilvánosság a modern képviseleti demokráciák alapköve, ahol fontos szerepet játszik a potenciális torzulások, krízisek megelőzésében.

A pályázat erőssége végül, hogy egy létező és rövid története ellenére sok sikert felmutatott kutatócsoport áll mögötte, nemzetközi publikációkkal, több doktori témával, tudatosan épített hazai és nemzetközi network-kel. A kutatócsoport célja az innovatív módszereket alkalmazó, a szociológiai tudományterületi tudást felhasználó kutatásokon kívül az is, hogy a hazai (és nemzetközi) szociológia számára új és perspektivikus megközelítés, az automatizált szöveganalitika társadalomkutatási intézményesülését elősegítse.

Publikáció

2020.08.25.

Kutatócsoportunk tagjainak (Németh Renáta, Sik Domonkos, Máté Fanni) írása az International Journal of Qualitative Methods (Q1, impakt faktor 3,6) lapjain. Amikor szociológusok alkalmaznak gépi tanulást: a “big data” szövegelemzés hermeneutikai korlátai nem-triviális fogalmak tanítása esetén. Örömmel olvastuk a lektori véleményekben miszerint “The article is the one of the fundamental researches in this area.” és “I look forward to seeing future efforts as you proceed with this research.” Az utóbbi kívánság, reméljük, teljesülni fog, online depresszió fórumok témában három nemzetközi publikációnk is bírálat alatt van.

A publikáció a következő linken olvasható: https://journals.sagepub.com/doi/full/10.1177/1609406920949338

További információk a projektről ezen az oldalon találhatók.

Online antiszemitizmussal foglalkozó kutatócsoportunk új, a koronavírussal összefüggő online antiszemitizmusról szóló projektbe kezdett

2020.07.27.

A zsidókat a történelem során sokszor vádolták azzal, hogy szándékosan betegségeket terjesztenek a nem zsidók között. A koronavírus járvány kitörésével egyidőben újra megjelentek a zsidókat a vírussal összekötő összeesküvés-elméletek. Ezeknek a konteóknak a terjesztésében az internetnek kiemelkedő jelentősége van. Kutatásunkban egy nagyméretű, magyar nyelvű online cikkekből és kommentekből álló szövegkorpuszt vizsgálunk arra a kutatási kérdésre keresve a választ, hogy megjelennek-e a fent említett diskurzusok a magyar adatokban, és ha igen, akkor mi ezek tartalma. Korpuszunk 2019. december 1. és 2020. június 10. közötti időszakban magyar nyelven írt cikkeket, hozzászólásokat, kommenteket tartalmaz, amelyekben egyszerre fordul elő a zsidó, Izrael vagy cionista szó és a koronavírus vagy ennek valamilyen más megnevezése. A koronavírussal összefüggő antiszemita diskurzus látens tematikus struktúrájának feltárására elsősorban topikmodelleket használunk. A kutatásban gyakornokként vesz részt a ELTE Társadalomtudományi Karának tizenöt, szociológia alapszakos hallgatója.