Фонд Wikimedia анонсировал новый проект - Wikidata, в рамках которого планируется подготовить доступную для совместного наполнения структурированную базу данных, в которой будут собраны разнообразные сведения и знания. Это первый значительны проект Wikimedia за последние 7 лет.
Wikidata станет центральным сервисом для доступа к структурированным данным из всех статей свободной энциклопедии, примерно как в настоящее время Wikimedia Commons выступает в роли хранилища мультимедиа файлов. Например, в Wikidata может быть занесёна сохранена численность населения определённого города, к которой в дальнейшем можно обращаться из статей Wikipedia по ключу с названием города и атрибутом, ассоциированным с численностью населения. При необходимости изменения данных, достаточно будет поправить запись в БД и во всех статьях энциклопедии, упоминающих численность населения города N, будут использоваться новые сведения, без необходимость ручного выявления и правки всех статей. Кроме численности населения, можно сопоставить с городом различные географические и политические сведения, такие как имя мэра города, телефонный код, города-спутники и т.п.
Данные будут доступны не только для ручного редактирования, но и для полностью автоматизированной машинной обработки. Таким образом, данные могут быть задействованы в разнообразных сторонних приложениях, таких как системы аннотирования научных статей. Система будет поддерживать гибкие средства локализации, позволяющие хранить представления фактов на всех языках, поддерживаемых в Wikipedia. Данные будут предоставляться на условиях лицензии Creative Commons.
На разработку начального прототипа проекта выделено 1.3 млн евро, половина из которых пожертвовано Институтом решения проблем искусственного интеллекта (AI²), созданного Полом Алленом. Остальную часть финансирования предоставила компания Google и фонд Gordon and Betty Moore Foundation. По мнению вице-президента института AI² проект Wikidata является следующим шагом эволюции Wikipedia, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Проект Wikidata будет основан на семантических технологиях, которые позволят упростить выявление нужных сведений.
Разработка проекта разделена на три фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между версиями Wikipedia на разных языках. На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.