Egyetlen bejegyzésből megmondják a twitterezők nemét

Vágólapra másolva!
Egy amerikai cég munkatársai egy olyan elemzőprogramot fejlesztettek ki, amely akár egyetlen twitteres bejegyzésből nagy hatékonysággal meg tudja állapítani szerzőjének nemét.
Vágólapra másolva!

A Twitteren a felhasználók nem tudják profiljaikban feltüntetni, hogy milyen neműek, ebből legfeljebb avatárjukból, a használt becenévből, vagy az esetlegesen megadott valós névből következtethetnek a bejegyzéseiket olvasók. Az amerikai Mitre cég egy szoftveres technológiát fejlesztett ki a twitterezők nemének megállapítására. Ehhez publikus fiókkal rendelkező twitterezők profiloldalain feltüntetett adatokat gyűjtöttek össze, ezt követően pedig nyilvános bejegyzésekből hoztak létre adatbázist - a legtöbb vizsgált felhasználó mindössze egyetlen tweetet írt regisztrálását követően. Ezeket az adatokat vetették alá szoftveres elemzésnek a társaság kutatói.

A Digital Trends technológiai magazin beszámolója szerint ha a szoftver a felhasználó neve alapján 89 százalékos pontossággal tudta megmondani a felhasználó nemét, a becenév analizálásával pedig 77 százalékos pontosságot produkált. Ha azonban ezeket az adatokat szándékosan figyelmen kívül hagyták, vagy nem álltak rendelkezésre, egyetlen tweet szóhasználata alapján is 66 százalékos hatékonysággal sikerült megmondania a számítógépnek azt, hogy az adott felhasználó nő vagy férfi. Ha nem csupán egyetlen bejegyzés, hanem sok tweet állt rendelkezésre az elemzéshez, a megoldás hatékonysága 75 százalékra nőtt. Ha az összes előbb említett adat felhasználható elemzéshez, akkor a program 92 százalékos pontossággal tudja megmondani valakiről a nemét.

A férfiak és nők szóhasználata ugyanis jelentősen eltérő, a nők bejegyzéseiben többször fordulnak elő például a "szerelem", "cuki", "boldog", "baba", "csoki", "utálom" szavak, vagy az internetes szlengben használt "LOL" és "OMG" kifejezések. A férfiak esetében sokkal kevesebb tipikus kifejezést találtak, ezek közé tartozik a "Google" és a weboldalak címe elé beírandó "http" is. A szövegek elemzése alapján a férfiak a legtöbbször a "a feleségem", "a barátnőm" és "a söröm" kifejezéseket gépelik be, míg a nőknél "a joghurtom", és "a férjem" vezet.