Un site Internet ghiceste varsta dupa tweet-uri
retele socialetwitterstereotipii de limbajtweetstudiusoftware
Un program capabil sa evalueze varsta si sexul unui utilizator in functie de postarile sale pe reteaua sociala Twitter a fost lansat de Universitatea din Twente, Olanda, in parteneriat cu un institut de limba si cultura olandeza. Persoanele cu varste de 40 de ani scriu mesaje mai lungi, adolescentii iubesc emoticoanele, iar femeile folosesc des formula "hi,hi", arata universitarii olandezi care au conceput programul de analiza.
Pentru a ajunge la acest rezultat, cercetatorii au analizat aproape 3000 de conturi Twitter ai caror utilizatori erau identificati. Ei au stabilit liste de cuvinte sau expresii care reveneau frecvent la internautii apartinand unei anumite categorii de varsta sau unui anumit sex, a explicat Dong Nguyen, doctorand in informatica la Universitatea din Twente care a participat la proiect. Ea a precizat ca doar continutul tweet-urilor a fost luat in calcul in analiza, si nu imaginea profilului, de exemplu.
"Limbajul utilizatorilor este mai uniform pornind de la circa 35 de ani"
Atunci cand este inregistrat un nume de utilizator, programul se multumeste sa recupereze ultimele sale 200 de tweet-uri, pentru a le compara cu baza de date stabilita de realizatorii site-ului. In ceea ce priveste diferentierea barbatilor fata de femei, ea decurge relativ usor din stereotipurile verbale. De exemplu, barbatii folosesc mai des cuvintele "fotbal" si "bere", in timp ce femeile folosesc termeni precum "unghii" si "hihi", explica site-ul.
"In legatura cu varsta, se observa ca tinerii vorbesc mai frecvent despre ei insisi si utilizeaza mai multe emoticonuri, in timp ce persoanele mai varstnice utilizeaza cuvinte si fraze mai lungi", adauga ea. Programul are o marja de eroare medie de 4 ani. Cu toate acestea, conform realizatorilor, el este mult mai precis cu tinerii decat cu persoanele in varsta.
"Se remarca faptul ca limbajul utilizatorilor este mai uniform pornind de la circa 35 de ani", afirma doamna Nguyen. "Exista, de exemplu, mult mai multe diferente intre un utilizator de 15 ani si un utilizator de 20 de ani decat intre un utilizator de 45 de ani si unul de 55 de ani".
Pe site-ul tweetgenie.nl lansat luni, 13 mai, este suficient sa introduci un nume de utilizator pentru a-i evalua varsta. Programul nu este deocamdata in masura sa analizeze decat tweet-uri in limba olandeza, dar Dong Nguyen a mentionat ca echipa care lucreaza la proiect doreste sa adapteze programul la alte limbi si la alte retele sociale, precum Facebook, de exemplu.