Материалы Международной студенческой научной конференции
Студенческий научный форум 2024

ТЕХНОЛОГИИ ИСКУСТВЕННОГО ИНТЕЛЛЕКТА В КОНТЕКСТЕ ЦИФРОВОЙ ТРАНСФОРМАЦИИ РОССИЙСКОГО ДОКУМЕНТООБОРОТА

Перова М.В. 1 Низельски-Медрано А.П. 1 Ушакова О.В. 1
1 Южно-Российский институт управления Российская академия народного хозяйства и государственной службы при Президенте Российской Федерации
1. RESC’2018: ЕСМ будет прирастать искусственным интеллектом [Электронный ресурс] URL: https://www.itweek.ru/ecm/article/detail.php?ID=203487 (дата обращения 15.11.2019 г.).
2. Как искусственный интеллект помогает работать с юридическими документами? Лекция Егора Будникова из ABBYY [Электронный ресурс] URL: https://habr.com/ru/company/abbyy/blog/431934/ (дата обращения 15.11.2019 г.).
3. Россияне назвали самые востребованные цифровые услуги [Электронный ресурс] URL: https://www.eos.ru/eos_delopr/eos_delopr_intesting/111/29647/ (дата обращения 15.11.2019 г.).
4. ‘AI Guardman’ – A machine learning applications that uses Pose Estimation to detect shoplifters [Электронный ресурс] URL: https://www.analyticsvidhya.com/blog/2018/06/ai-guardman-machine-learning-application-estimates-poses-detect-shoplifters/ (дата обращения 15.11.2019 г.).
5. Машинное обучение [Электронный ресурс] URL: http://www.tadviser.ru/a/349320 (дата обращения 15.11.2019 г.).
6. Искусственный интеллект (рынок России) [Электронный ресурс] URL: http://www.tadviser.ru/a/389695 (дата обращения 15.11.2019 г.).

В статье рассматриваются экспертные и исследовательские подходы к формированию современной стратегии РФ в сфере цифровизации документооборота. Проведен обзор наиболее значимых технологических трендов на рынке СЭД/ЕСМ, связанных с развитием искусственного интеллекта и внедрением в электронный документооборот нейросетей.

Развитие российского электронного документооборота изначально интересовало экспертов с точки зрения избавления от бумажного документооборота и решения связанных с ним проблем. Сегодня мы фактически наблюдаем следующий этап, в рамках которого главной проблемой выступает оптимизация функционирования систем электронного документооборота. Большие надежды возлагаются на блокчейн, автономное самоуправляемое ПО, естественный интерфейс, а также нейросети и искусственный интеллект. Компании «Oracle» и «IBM» сходятся во мнении, что именно возможности искусственного интеллекта [ИИ] будут определять стратегию Российской Федерации в сфере дальнейшего перехода на ЭДО, а также поведение государства и компаний на национальном рынке СЭД/ЕСМ [1].

Одним из направлений развития технологий ИИ является переход на качественно новый уровень лингвистического и семантического анализов документов. Компания «ABBYY» фокусирует свое внимание на развитии технологий распознавания и извлечения необходимых данных из неструктурированных массивов документов [2]. Их разработки позволяют превращать PDF, отсканированные изображения и картинки в редактируемые текстовые форматы. Кажущейся простой, технология работает по принципу распознавания текса, его разделения на фрагменты информации, преодоление многозначности и художественности языка, сортировку данных и их объединение в новом документе. Искусственный интеллект сокращает время обработки документов вдвое, а помимо этого помогает проводить более качественный контент-анализ неструктурированных данных [2].

Второй значимый тренд – альтернативное взаимодействие. Изменяются формы общения человека и компьютера, стандартные технократические способы ввода заменяются на более гуманизированные новые: мессенджеры, чат-боты, голосовой ввод и биометрия. Диалоговый ИИ становится ключевой точкой в понимании взаимодействия человека с данными. Электронный документ, как носитель данных, больше нельзя считать эквивалентом бумажного: он больше похож на связанные структурированные распределенные записи в базах данных, а компоненты документа могут динамически изменяться. Показательный пример – выписки из ЕГРЮЛ: они представляют собой блоки данных, группируемых реакционно на конкретный запрос без предварительного нахождения в файле. Человеку больше не нужно искать информацию из документа-файла самостоятельно, теперь это может работать по алгоритму: человек запрашивает – ИИ выполняет запрос – человек получает ответ.

Особо эффективным такое взаимодействие может оказаться в сфере предоставления цифровых услуг. Согласно исследованию «BCG», Россия входит в топ-10 стран, граждане которой чаще выбирают получение государственных услуг в электронной форме (рис. 1).

Делегирование работы по обслуживанию граждан через искусственный интеллект означает снижение бюрократизма и повышение качества взаимодействия граждан с органами власти. Кроме того, взаимодействие гражданина и государства сокращает возможность реализации коррупционных схем.

К этому же тренду можно отнести и компьютерное зрение. Хороший пример – алгоритм Gaurdman. Этот алгоритм позволяет выявлять признаки подозрительного поведения людей и отправлять уведомления уполномоченному лицу. Эта нейросеть, подключенная к камере или дрону позволяет следить за порядком в любом типе физических пространств [4]. Другой пример – хранимый в секрете и используемый «Greenpeace» алгоритм приложения, позволяющего с помощью смартфона и его камеры автоматически сформировать и подать сообщение о пожаре в локальные экстренные службы.

В качестве третьего тренда стоит выделить машинное обучение. Способы реализации искусственного интеллекта на рынке СЭД/ЕСМ требуют больше усилий, чем обычное программирование. Преимущества применения ИИ строятся на непредсказуемости поведения системы, так же цель стоит в обработке большого количества информации. В таких условиях, работа с электронными документами должна стать более простой для человека и эффективной для организаций. Программирование обучаемости ИИ, в результате которой он сам формирует алгоритм действий, основываясь при этом на заданной модели и доступному ему массиву данных, позволяет решать эту задачу.

Несмотря на свою относительно долгую историю, машинное обучение стало трендом российского документооборота лишь в последние годы. Так, компания «Инфосистемы Джет» в своих отчётах отражает, что в 2019 г. увеличилось количество проектов по машинному обучению в три раза по сравнению с 2017 г. Данные цифры доказывают вовлечение ИИ во множество отраслей экономики. В 2019 г. выпущен проект «IBM Data Asset eXchange (DAX)», повышающий общую доступность технологии [5].

perov1.wmf

Рис. 1. Наиболее востребованные россиянами цифровые услуги [3]

perov2.tif

Рис. 2. Технологии ИИ в российских компаниях [6]

Такие же оптимистичные результаты показало совместное исследование НИУ ВШЭ и «Microsoft», в котором машинное обучение заняло второе место по распространенности ИИ-решений в России (рис. 2).

Можно выделить ряд трудностей, с которыми столкнулась данная система, связанная с работой алгоритмов. Главные затруднения в этом отношении – недостаточность и дороговизна хороших данных. Обеспечить репрезентативность баз данных, на которых будет обучаться ИИ дело непростое, часто невыполнимое. По этой причине и возникают истории о нейросетях, перенявших субъективные предпочтения своих руководителей или общие искажения пользовательских баз. Искусственный интеллект подвержен ложным корреляциям.

Таких примеров много: автопилот от «Uber» принял решение сбить пешехода, чтобы не тревожить водителя; система распознавания лиц в Нинобо стала видеть в людях соек; HR-бот в «Amazon» стал принимать резюме только от мужчин, основываясь на прошлом опыте компании брать больше мужчин, чем женщин; диалоговый бот «Тау» от «Microsoft», подражавший собеседникам стал выдавать разжигающие ненависть реплики; Face ID на iPhone X получилось взломать фотографиями пользователей. При сопоставлении данных людям достаточно применить жизненный опыт, который невозможно получить при машинном обучении.

При сопоставлении данных людям достаточно применить жизненный опят, который невозможно получить при машинном обучении.

Таким образом, СЭД/ECM-системы давно известные своей возможностью хранения терабайтов информации, как структурированной, так и неструктурированной, перешли во второй этап своего развития, когда применение искусственного интеллекта предоставило возможность работать с неструктурированными документами, дав тем самым толчок к большому количеству трендов и перспектив. Три наиболее интересных тренда, а именно: интеллектуальный поиск, альтернативное взаимодействие и машинное обучение, мы рассмотрели выше.

Можно сделать вывод, что ИИ уже стал технологией современности. В обозримом будущем искусственный интеллект не станет угрозой для ECM-систем, однако, он будет стимулировать сферу управления контентом к улучшению своих ключевых компетенций: задавать правильные вопросы разработчикам и заказчикам, выстраивать привлекательные пользовательские кейсы, связывать между собой приложения на основе ИИ и использовать «сырые» данные для создания стратегии, которая найдет отклик у клиентов.


Библиографическая ссылка

Перова М.В., Низельски-Медрано А.П., Ушакова О.В. ТЕХНОЛОГИИ ИСКУСТВЕННОГО ИНТЕЛЛЕКТА В КОНТЕКСТЕ ЦИФРОВОЙ ТРАНСФОРМАЦИИ РОССИЙСКОГО ДОКУМЕНТООБОРОТА // Материалы МСНК "Студенческий научный форум 2024". – 2020. – № 4. – С. 127-129;
URL: https://publish2020.scienceforum.ru/ru/article/view?id=254 (дата обращения: 20.06.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674