RC2S2 előadások a “szociológia egy sikeres évszázad előtt?” konferencián

2020.09.21.

Október 8-9-én kerül megrendezésre “A szociológia egy sikeres évszázad előtt?” című konferencia az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferencia szervezőbizottságában Koltai Júlia, az RC2S2 tagja. Előadóként/társszerzőként szerepel  összesen 8 (!) előadással kutatócsoportunkból Barna Ildikó, Katona Eszter, Kmetty Zoltán, Knap Árpád, Koltai Júlia, Németh Renáta, Rakovics Márton, Sik Domonkos

A kutatócsoporthoz köthető előadások:

október 8. csütörtök

INNOVATÍV MÓDSZEREK A SZOCIOLÓGIAI KUTATÁSOKBAN

13:45-15:30 A természetes nyelvfeldolgozás lehetőségei és korlátai I.

Knap Árpád (társszerző: Barna Ildikó): Trianon és a holokauszt tematikus és diszkurzív keretezésének vizsgálata a természetesnyelv-feldolgozás segítésgével

Barna Ildikó (társszerző: Knap Árpád): A koronavírushoz kapcsolódó magyarországi online antiszemitizmus vizsgálata kvantitatív topikmodell és kvalitatív diskurzuselemzés segítségével

Németh Renáta (társszerzők: Sik Domonkos, Katona Eszter): Topikmodell használata a depresszió online diszkurzív keretezésének megértésében

15:45-17:30 A természetes nyelvfeldolgozás lehetőségei és korlátai II.

Katona Eszter (társszerzők: Kmetty Zoltán, Németh Renáta): Korrupció az online médiában. A dinamikus topikmodell alkalmazása

Máté Fanni: Osztályozó algoritmusok szociológusok számára

október 9. péntek

9:00-10:45 A COVID-19 járvány társadalmi hatásai I.

Koltai Júlia (társszerzők: Fodor Éva, Gregor Anikó, Kováts Eszter): Az egyenlőtlenségek alakulása a koronavírus idején Magyarországon

Társszerzőként:

Géring Zsuzsanna (társszerzők: Király Gábor, Rakovics Márton, Tamássy Réka): Jövő-konstrukciók a nemzetközi felsőoktatási intézményi diskurzusban

Stefkovics Ádám (társszerzők: Kmetty Zoltán, Koltai Júlia): Kísérletezz a módszereddel! A survey-kísérletek felhasználási lehetőségei a módszertan-fejlesztés területén

Tófalvy Tamás (társszerző: Koltai Júlia): A földrajzi egyenlőtlenségek algoritmikus újratermelődése a Spotify ajánlórendszerében

Kutatócsoportunk két tagja is ÚNKP-nyertes

2020.09.14.

Katona Eszter és Knap Árpád egyaránt elnyerte az Új Nemzeti Kiválósági Program (ÚNKP) ösztöndíját a következő egy éves időszakra. Eszter kutatásának címe Korrupciós kockázat és predikció – A közbeszerzési pályázatok szövegeinek elemzése a természetes nyelvfeldolgozás eszközeivel, témavezetője Fazekas Mihály. Eszter kutatásának hipotézise szerint a közbeszerzési pályázatok szövegezésének vizsgálata segíthet a korrupciógyanús esetek leleplezésében, kutatásában ezt igyekszik alátámasztani. Árpád Huszadik századi traumákkal kapcsolatos érzelmek elemzése szöveganalitikai módszerekkel című pályázatában a XX. századi magyar történelem két legnagyobb hatású eseményéhez, a Trianoni Békeszerződéshez, illetve a holokauszthoz kapcsolódó, a különböző típusú médiumokban és a közösségi médiában megjelenő érzelmeket elemzi majd. Témavezetője Barna Ildikó, kutatócsoportunk társvezetője.

Siker

2020.09.08.

Örömmel adjuk hírül, hogy hallgatónk, Csala-Ferencz Bernadett (Survey Statiszitika és Adatanalitika MSc) elnyerte az Új Nemzeti Kiválósági Program ösztöndíját az új szemeszterre. Pályázatának címe: Depresszió témájú online posztok exploratív klaszterezése. Bernadett a program támogatásával a Research Center for Computational Social Science kutatócsoport keretén belül Németh Renáta témavezetésével angol nyelvű online depresszió-fórumok posztjait kutatja natural language processing (NPL) módszerekkel.

Siker

2020.08.30.

Kutatócsapatunk óriási lehetőséget kapott – Az “OTKA” kutatási pályázat 2020. évi nyertesei között vagyunk! 2020-2023 közötti időszakra nyertünk támogatást, A politikai nyilvánosság rétegei Magyarországon (2001-2020) – a hivatalos, a médiabeli és a laikus online nyilvánosság szociológiai vizsgálata automatizált szövegelemzés és kritikai diskurzuselemzés használatával című kutatásra. Kutatásvezető: Németh Renáta.

A pályázat résztvevői: Barna Ildikó, Sik Domonkos, Rakovics Márton, Katona Eszter, Knap Árpád (RC2S2, ELTE TáTK) és Csigó Péter (BME).

A pályázat összefoglalója

Kutatásunk az NLP (Natural Language Processing: természetes nyelvfeldolgozás) innovatív, szociológiailag releváns módon való alkalmazásával a politikai nyilvánosságban detektálható nyelvhasználati változásokra koncentrál; ezeket a változásokat digitális szövegkorpuszon vizsgálja, a nyelvet mint az ideológia és hatalom eszközét tekintve, a kritikai diskurzuselemzés elméleti keretei között.

Két kiemelt, a társadalom, illetve a szociológia számára fontos tétje van a kutatásnak: (1) A politikai nyilvánosság különböző szintjeinek működése, e szintek közti interakció, ennek dinamikája, a nyelvben megmutatkozó ideológiai polarizáció, illetve olyan diskurzusok azonosítása, ahol ez nem érvényesül. (2) Az NLP módszertan szerves integrálása az empirikus szociológiába.

A kutatás mindkét eleme nemzetközileg is releváns, hiszen a vizsgált jelenség nem magyar sajátosság, máshol is tapasztalható a nyelvi polarizáció és a nyelvhasználati diffúziós folyamatok Az NLP módszertan szerves integrálása az empirikus szociológiába szintén kurrens, mert lehetőséget ad a nagy mennyiségben rendelkezésre álló digitális szövegek újfajta elemzésére úgy, hogy az eredmények interpretációjához felhasználja a szociológiai tudást.

Az adatgyűjtés és adatelemzés módszertani innovációit, a fejlesztett eszközöket nyilvánosságra hozzuk digitális repozitóriumokon, szakcikkeken és konferenciaelőadásokon, ezzel támogatva az NLP nemzetközi és hazai társadalomtudományi felhasználóit. A kutatócsoport szenior tagjai doktori témavezetőként fiatal kutatóknak, valamint szakmai gyakorlat és TDK/szakdolgozati témakiírás formájában egyetemi hallgatóknak lehetőséget teremtenek a projekthez való kapcsolódáshoz.

A kutatás jelentősége

A digitális forradalom az önkifejezés forradalma is. Míg korábban a szöveges dokumentumok főként az elit narratívái voltak, az internet megnyilvánulási lehetőséget ad gyakorlatilag bárki számára. Kutatásunk relevanciáját elsősorban az adja, hogy ennek a folyamatosan képződő szövegfolyamnak az automatizált feldolgozásával alátámaszthatóvá és megérthetővé teszi a politikai nyilvánosságnak azokat a sajátosságait, melyek a megfigyelők számára csak lokálisan észlelhetők. Kutatásunk tudományos és társadalmi tétje is nagy.

Tudományos szempontból kutatásunk a társadalomkutatás számára nyit perspektívát a survey önbevalláson alapuló információi helyett a megfigyeléses adatok kvantitatív kutatásba emelésével, a kvalitatív (diskurzuselemzés) és kvantitatív megközelítés kombinálásával, az informatikai-nyelvtechnológiai területről jövő módszerek innovatív társadalomkutatási felhasználásával. Mindez nemzetközi szinten is újdonságnak számít. A digitális kommunikáció különböző szintjeit lefedő nagyméretű szövegkorpusz NLP eszközökkel való elemzése tudomásunk szerint hazai közegben úttörő vállalkozás. Míg az erős ideológiai polarizációra vannak bizonyítékok (pl. Vegetti, 2018), és vizsgálták a politikai nyilvánosság networkösödésében megnyilvánuló polarizációt is (Bene és Szabó 2019), a nyelvi polarizáció itthon nem kutatott, és nemzetközi szinten is csak néhány előzményt találtunk, tervezett kutatásunknál jóval szerényebb alkalmazási területtel (lásd pl. Demszky és társai 2019, Twitter-adatokon).

Kutatásunk társadalmi tétje is jelentős: a nyilvánosság a modern képviseleti demokráciák alapköve, ahol fontos szerepet játszik a potenciális torzulások, krízisek megelőzésében.

A pályázat erőssége végül, hogy egy létező és rövid története ellenére sok sikert felmutatott kutatócsoport áll mögötte, nemzetközi publikációkkal, több doktori témával, tudatosan épített hazai és nemzetközi network-kel. A kutatócsoport célja az innovatív módszereket alkalmazó, a szociológiai tudományterületi tudást felhasználó kutatásokon kívül az is, hogy a hazai (és nemzetközi) szociológia számára új és perspektivikus megközelítés, az automatizált szöveganalitika társadalomkutatási intézményesülését elősegítse.

Publikáció

2020.08.25.

Kutatócsoportunk tagjainak (Németh Renáta, Sik Domonkos, Máté Fanni) írása az International Journal of Qualitative Methods (Q1, impakt faktor 3,6) lapjain. Amikor szociológusok alkalmaznak gépi tanulást: a “big data” szövegelemzés hermeneutikai korlátai nem-triviális fogalmak tanítása esetén. Örömmel olvastuk a lektori véleményekben miszerint “The article is the one of the fundamental researches in this area.” és “I look forward to seeing future efforts as you proceed with this research.” Az utóbbi kívánság, reméljük, teljesülni fog, online depresszió fórumok témában három nemzetközi publikációnk is bírálat alatt van.

A publikáció a következő linken olvasható: https://journals.sagepub.com/doi/full/10.1177/1609406920949338

További információk a projektről ezen az oldalon találhatók.

Online antiszemitizmussal foglalkozó kutatócsoportunk új, a koronavírussal összefüggő online antiszemitizmusról szóló projektbe kezdett

2020.07.27.

A zsidókat a történelem során sokszor vádolták azzal, hogy szándékosan betegségeket terjesztenek a nem zsidók között. A koronavírus járvány kitörésével egyidőben újra megjelentek a zsidókat a vírussal összekötő összeesküvés-elméletek. Ezeknek a konteóknak a terjesztésében az internetnek kiemelkedő jelentősége van. Kutatásunkban egy nagyméretű, magyar nyelvű online cikkekből és kommentekből álló szövegkorpuszt vizsgálunk arra a kutatási kérdésre keresve a választ, hogy megjelennek-e a fent említett diskurzusok a magyar adatokban, és ha igen, akkor mi ezek tartalma. Korpuszunk 2019. december 1. és 2020. június 10. közötti időszakban magyar nyelven írt cikkeket, hozzászólásokat, kommenteket tartalmaz, amelyekben egyszerre fordul elő a zsidó, Izrael vagy cionista szó és a koronavírus vagy ennek valamilyen más megnevezése. A koronavírussal összefüggő antiszemita diskurzus látens tematikus struktúrájának feltárására elsősorban topikmodelleket használunk. A kutatásban gyakornokként vesz részt a ELTE Társadalomtudományi Karának tizenöt, szociológia alapszakos hallgatója.

Siker

2020.07.21.

Örömmel jelentjük, hogy kutatócsoportunk tagjainak két szakdolgozója is elnyerte az „Év szakdolgozata” címet. Farkas Anna a szociológia BA-n (témavezető: Németh Renáta), Buda Jakab a Survey Statisztika és Adatanalitika MSc-n (témavezető: Rakovics Márton) írta a legjobb szakdolgozatot. Gratulálunk! A dolgozatok itt olvashatók, más CSS-témában íródott, kutatócsoportunk tagjai által vezetett dolgozattal együtt.

Vállalati együttműködés

2020.06.30.

Az Inspira Group kutatócég a “data for social good” elv mentén térítésmentesen tette lehetővé, hogy Farkas Anna szociológia BA-s hallgatónk szakdolgozatához online omnibusz kutatásukhoz kapcsolhasson kérdéseket. A Németh Renáta témavezetésével készült szakdolgozat az algoritmikus torzításnak nevezett jelenséget egy Google Fordítóról készült esettanulmányon keresztül mutatja be (a dolgozat ezen a linken érhető el), a nemi torzítást vizsgálva foglalkozások magyar-angol fordításánál („ő egy orvos” -> „he” vagy „she”?). A kutatás egyik célja a nemi torzítás mértékének (a szakirodalomban sokszor tévesen megközelített) definiálása volt – a fordításokat a foglalkozások valós nemi arányához viszonyította, illetve ahhoz, hogy a mai magyar társadalom hogyan gondolkodik a foglalkozásokról, azokat inkább nőiesnek vagy inkább férfiasnak tartja. Az Inspira ez utóbbiban segítette a kutatást: online omnibusz kutatásuk keretében, reprezentatív lakossági mintát kérdeztek a foglalkozások megítéléséről a szakdolgozó által megadott kérdések használatával. A dolgozat konklúziója szerint a Google Fordító fordításai inkább tükrözik a társadalom foglalkozásokról alkotott véleményét, mint a foglalkozások valós nemi arányát.

Szakmai megjelenés

2020.03.18.

Megjelent a Statisztikai Szemlében Brecsok Anna tavaly, a Survey Statisztika és Adatanalitika MSc-n készült szakdolgozata, amiben survey experimentet végzett egy olyan probléma vizsgálatára, amire a munkahelyén bukkant. A témavezető (és társszerző) kutatócsoportunk társ-vezetője, Németh Renáta volt.

A szociológia egy sikeres évszázad előtt? – konferencia NLP szekcióval

2020.03.10.

Megnyílt a jelentkezési lehetőség A szociológia egy sikeres évszázad előtt? című konferenciára, amely 2020. június 11-12 között kerül megrendezésre az MTA Társadalomtudomány Kutatóközpontjában. A konferencián az NLP szociológiai alkalmazásai külön szekcióval szerepelnek, kutatócsoportunk két társvezetője, Barna Ildikó és Németh Renáta, valamint Ságvári Bence, az MTA CSS-Recens kutatócsoportjának vezetője javaslatára és szekcióvezetésével. A konferenciára március 31-ig lehet jelentkezni ezen a felületen.

Frissítés: a koronavírus kapcsán kialakult helyzet miatt bizonytalanná vált, hogy megtartásra kerül-e a konferencia júniusban. Ettől függetlenül azonban bátorítunk mindenkit, hogy adjon be absztraktot a megadott április 15-i határidőig (meghosszabbított határidő), mert a konferenciát meg fogjuk tartani, legrosszabb esetben egy későbbi időpontban.