Программисты Университета из города Твенте (Голландия) сотворили онлайн-программку, способную точно определить пол и возраст пользователей социальной сети Twitter, предварительно проанализировав авторские сообщения в сети микроблоггинга.
Создатели заявляют, что не так давно закончили тестировать программу, основываясь на базах данных 3000 twitter-пользователей, которые отправляют регулярно в социальную сеть краткие сообщения на различные темы. В программу было запущено базу знаний. Она при помощи семантического, словарного синтаксического и подобных типов мониторинга определяла возрастную и половую категории автора сообщений.
Программа, чтобы чётко определить параметры – должна проанализировать двести твитов. После этого оператор может ввести просто ник пользователя, и программка выложит информацию, кто скрывается за псевдонимом.
«Анализ наш продемонстрировал: разница между блогерами женщинами и мужчинами достаточно стереотипна. Естественно, мужчины – чаще говорят о политике и футболе, женщины – о ногтиках», – сказал один из разработчиков, Донг Нгуен. «А в позициях возрастных, молодые пользователи говорят чаще о себе самих и пользуются множеством смайликов. Пользователи в возрасте применяют словарные сложные обороты и чаще пишут на нестандартные темы».
А по своей природе – твиты молодёжи эмоциональны, имеют часто крайне положительную или крайне отрицательную окраски. А такое редко встретишь у пользователя старше тридцати лет.
Программка пока мониторит твиты на голландском, что даёт относительную погрешность в четыре года при определении возраста.