TechFusion.ruАналитика данныхО чем говорят банку большие данные

О чем говорят банку большие данные

Big Data

Банки знают о нас очень многое: размеры зарплат, покупательские привычки, объемы накоплений. Анализ таких данных позволяет банкам создавать и предлагать клиентам релевантные услуги

Андрей Созыкин

Андрей Созыкин. Фото из личного ахива

Технологии big data уже сегодня помогают банкам в реализации бизнес-задач. Для чего применяется аналитика больших данных и как это направление будет развиваться дальше рассказал TechFusion.ru разработчик банка Точка Андрей Созыкин.

У банков есть доступ к большому количеству данных об операциях, совершаемых клиентами. Их анализ позволяет использовать популярный в настоящее время подход к принятию решений, для которого существует специальный англоязычный термин — data driven decision. О своих клиентах банки знают очень многое: размеры их зарплат, структуру трат, объемы накоплений и прочее. Анализ этих данных позволяет оценить кредитоспособность клиента и предложить ему наиболее подходящий продукт: ипотеку, кредит на автомобиль, отпуск, страховую программу или что-то еще.

Большие данные совместно с машинным обучением позволяют проводить сегментацию клиентов на отдельные категории. Например, можно выделить компании с сезонным бизнесом или компании-экспортеры. Затем полученную информацию можно использовать для предложения дополнительных продуктов, характерных для определенного сегмента. Компаниям-экспортерам можно предложить услуги помощника по валютным сделкам, а компаниям с большими остатками на счетах — депозиты.

Анализ больших данных применяется и для предотвращения мошенничества. Наиболее распространены два типа мошенничества. Первый связан с использованием средств компании или человека без их ведома. Например, злоумышленники могут украсть вашу карту и перевести с нее все деньги или купить дорогостоящие товары в интернет-магазинах. Второй вариант — когда сама компания занимается противозаконными операциями, например, обналичивает деньги для выплаты серых зарплат или взяток.

Анализ записей общения клиентов со службой поддержки банка по телефону, в чате или другим каналам позволяет выявить типичные проблемы, с которыми сталкиваются клиенты, и принять меры по их устранению. Это ведет к улучшению клиентского опыта и снижению затрат на службу поддержки.

Технологии больших данных позволяют собрать вместе все отзывы о банке в социальных сетях и интернете, проанализировать их, и полученные знания применять для улучшения клиентского опыта или более полного выяснения потребности клиентов.

Технологии

Самая популярная технология анализа больших данных сейчас — это Apache Hadoop и его экосистема. В нее входит распределенная файловая система HDFS, фреймворки для параллельного запуска задач Spark и MapReduce, системы Hive и Spark SQL для работы с большими данными на языке SQL, распределенные базы данных HBase, Impala и Kudu, библиотеки машинного обучения MLlib и Mahout, а также многое другое.

Существенным преимуществом экосистемы Hadoop является то, что большая часть продуктов имеет открытые исходные коды и распространяется бесплатно. Для работы Hadoop не требуется специализированных дорогостоящих серверов и систем хранения, подойдут обычные серверы, большие данные хранятся на внутренних дисках таких серверов.

Apache Hadoop был разработан более 10 лет назад на основе идей, предложенных в Google. В течение 10 лет Hadoop стремительно развивался и теперь это зрелая технология, пригодная для использования в банках.

Выявление мошенников

Большая часть клиентов банка является законопослушными. Мошеннических операций очень мало по сравнению с обычными, поэтому для их выявления используется подход на основе обнаружения выбросов (outlier detection).

На первом этапе выполняется анализ типичного поведения человека или компании. Например, большая часть компаний регулярно перечисляет зарплату сотрудникам, оплачивает налоги, аренду, покупает канцтовары и прочее. Человек оплачивает картой коммунальные платежи, покупку продуктов, обеды в кафе и ресторанах, а часть денег снимает в банкомате. 

На втором этапе выполняется проверка каждой операции на совпадение с типичным шаблоном поведения. Если человек обычно платит картой, но вдруг решил снять все деньги в банкомате — это нетипичное поведение (выброс или outlier). Аналогично, если компания получает крупные суммы денег и тут же снимает их наличными, при этом не платя зарплату, налоги и аренду — это тоже нетипичное поведение.

Технологии больших данных и машинного обучения не позволяют однозначно выявить нарушителей. Они находят нетипичные операции, однако такие операции вполне могут оказаться законными. Поэтому операция останавливается и предпринимается попытка связаться с клиентом и выяснить, имеет ли место мошенничество.

В случае с человеком, можно просто позвонить по телефону. Вполне вероятно, что ему действительно понадобились наличные деньги, и он решил снять все с карты. Но если окажется, что операция совершалась без ведома клиента, то после звонка можно заблокировать карту и предотвратить кражу денег.

Если подозрение вызывает поведение компании, то ей отправляется запрос с просьбой предоставить документы, подтверждающие законность операций. Клиенты, которые предоставят такие документы, продолжают работу. Однако, если подтверждающие документы не предоставлены, то счет компании клиента в банке закрывается. При этом банк отправляет сообщение о нарушении в Федеральную службу по финансовому мониторингу (Росфинмониторинг).

Будущее

В будущем анализ данных может привести к существенному ускорению процессов обслуживания клиентов в банках и сокращению бюрократии. Компании достаточно будет предоставить ИНН, а всю остальную необходимую информацию банки смогут получать самостоятельно. Важную роль в этом должно сыграть распространение Открытых Данных — это данные о компаниях и людях, которые госорганы и организации предоставляются в открытый доступ с использованием программных интерфейсов (API).

В качестве примера можно привести сервис «Прозрачный бизнес», который в ближайшее время должен быть запущен налоговой инспекцией. Через сервис можно будет получить сведения о доходах и расходах компаний, количестве сотрудников, имеющихся налоговых нарушениях и прочем. Банки могут комбинировать открытые данные с данными социальных сетей и других источников для того, чтобы проверять благонадежность клиентов, проводить кредитный скоринг и другие операции без запросов каких-либо документов от клиента.

Другое перспективное направление применения анализа больших данных — автоматизация службы поддержки. Вместо человека клиенты банка будут общаться по телефону или в чате с ботами. Такие боты могут распознавать речь или текст запроса, определять его смысл, находить решение с помощью базы знаний о проблемах. А затем рассказывать о решении клиенту — голосом или текстом. При этом человек может и не догадаться, что общается не с сотрудником банка, а с умной программой.

Самое интересное будущее применение технологий машинного обучения и анализа больших данных связано с биометрической идентификацией — например, с идентификацией по лицу. Уже существуют решения, которые позволяют осуществлять платежи без карты или смартфона с помощью лица.

В качестве примера можно привести систему Smile to Pay компании Alipay, в которой для проведения оплаты достаточно просто улыбнуться перед камерой терминала. Клиент автоматически распознается с помощью глубокой нейронной сети. Карта клиента находится в базе банка и с нее списываются деньги. 

Лицо, в отличие от карты, нельзя забыть или потерять, его невозможно украсть. Это делает использование биометрической идентификации для совершения платежей очень удобным. В дальнейшем вероятно расширение области применения идентификации по лицу и на проведение других операций.

13 сентября в Москве в пятый раз пройдет ежегодная международная конференция Big Data. Организаторами мероприятия выступают Global Innovation Labs и Rusbase. Одна из тем обсуждения — использование анализа больших данных в банковской сфере.

Иллюстрация на обложке: pixabay.com