TechFusion.ruКейсыИстория Большого театра оцифрована с помощью волонтеров и искусственного интеллекта

История Большого театра оцифрована с помощью волонтеров и искусственного интеллекта

История Большого театра

Компания ABBYY подвела итоги волонтерского проекта по оцифровке истории Большого театра. В электронной базе театрального музея собраны данные о 28 тысячах опер, 18 тысячах балетов и 5 тысячах концертов

Большой театр, компания ABBYY и КАМИС объявили о завершении масштабного волонтерского проекта «Открой историю Большого». Искусственный интеллект ABBYY и более 7 тысяч 800 волонтеров помогли оцифровать, извлечь и систематизировать информацию из 48 тысяч афиш, 120 тысяч программок и 100 тысяч фотографий коллекции музея Большого театра. Все данные загружены в электронную базу музея Большого театра, разработанную компанией КАМИС.

Теперь сотрудники музея должны проанализировать весь массив данных. После этого они будут опубликованы на сайте электронного архива театра и станут доступны всем желающим.

Напомним, проект «Открой историю Большого» стартовал в октябре 2016 года. Его целью была оцифровка и упорядочивание информации из коллекции театра. Сначала все исторические документы были отсканированы и распознаны программой ABBYY FineReader. Затем интеллектуальные технологии ABBYY извлекли из документов данные: названия спектаклей, имена артистов, дирижеров и прочее. Проект объединил волонтеров из более чем 60 стран мира: США, Австралии, Бразилии, Индии, Китая, многих стран Европы и России. Они тщательно проверяли и дополняли информацию на каждом этапе проекта, чтобы исключить возможные ошибки и максимально приблизить электронные версии документов к оригиналам.

Также волонтерам был полностью отдан третий этап проекта — рубрикация исторических фотографий. Участники внесли в электронную базу рукописные тексты, написанные на оборотах изображений. Благодаря усилиям волонтеров, люди со всего мира смогут увидеть самые яркие моменты выступлений Майи Плисецкой, Галины Улановой, Федора Шаляпина и еще более 5 тысяч артистов театра.

В заключительной части проекта специалисты ABBYY систематизировали данные в соответствии с требованиями сотрудников музея. Был настроен автоматический перевод текстов с дореволюционной орфографией на современный русский язык. Также заполнены пропущенные поля, исправлены опечатки, цифры и тексты приведены к единому формату. Вся информация из архивов театра загружена в базу данных, разработанную КАМИС. По мере проверки специалистами музея Большого театра, данные публикуются на специально разработанном поисковом разделе театрального сайта.