Группа исследователей из нескольких европейских университетов опубликовала свои наработки в области автоматизированной оценки авторства текста на основе статистического анализа предыдущих работ. Система требует предварительного обучения для накопления статистических данные, т.е. после анализа точно принадлежащих автору работ позволяет в дальнейшем оценить является ли лицо автором произвольного текста. Код проекта написан на языке С++ и открыт под лицензией GPLv2. Дополнительно доступна статья с изложением используемого в приложении математического аппарата.
Изначально проект был нацелен на решение задачи определения авторства исторических документов, сведения об авторах которых утеряны или поставлены под сомнение. Тем не менее, у разработки имеются большие перспективы при решении современных задач, от определения авторства электронных писем, анонимных обращений к правоохранительным органам и заметок в блогах, до выявления плагиата в научных и художественных публикациях, организации новых систем поиска в Web и задействования в средствах борьбы со спамом.