Американские ученые из Рочестерского университета создали компьютерную программу, которая может находить "пьяные" записи в Twitter, а также вычислять по их тексту, где именно пьют пользователи в данный момент, сообщает интернет-издание "N+1".
Исследователи не только смогли определить, какие твиты были написаны пьяными людьми, но и составить карту наиболее посещаемых мест употребления алкоголя. В дальнейшем ученые планируют научить систему по твитам определять пол, возраст, этническую принадлежность и другие характеристики пользователей. Авторы исследования считают, что эта работа может помочь властям в изучении проблем общественного здравоохранения.
This browser does not support the video element.
Для своей работы ученые на протяжении года собирали в Нью-Йорке и округе Монро твиты с геотегами. Исследователи отбирали твиты, в которых упоминается алкоголь и близкие по контексту слова: "вечеринка", "пиво", "пьяный" и другие.
Затем, при помощи сервиса Amazon Mechanical Turk были отобраны лишь те посты из Twitter, которые имели непосредственное отношение к употреблению алкоголя. Твиты отбирались по трем ключевым вопросам: делает ли твит ссылки на употребление алкоголя; если да, то относится ли этот твит к автору поста непосредственно; если да, вероятно ли то, что пост был на писан во время и в месте распития спиртных напитков. Всего было проанализировано около 11 тысяч твитов.