Развитие передовых цифровых технологий, которые сейчас принято называть сквозными (согласно программе «Цифровая экономика Российской Федерации»), уже привело к цифровым трансформациям в различных сферах общественной жизни. Область научных исследований не только не является исключением, но в большинстве случаев выступает пионером имплементации инновационных технологий. Одним из таких масштабных примеров является так называемая «электронная наука» – способ организации исследовательской деятельности, позволяющий обеспечить взаимодействие ученых за счет доступа к вычислительным ресурсам, хранилищам научно–технической и инновационной информации, экспериментальным научным электронным площадкам [1]. Причем принято считать, что зарождение новых способов познания окружающего мира, основанных на количественных и верифицируемых методах, происходит в первую очередь в естественных и технических науках, а социогуманитарные области научного знания обогащаются некоторыми из них лишь спустя некоторое время. В отношении сквозных цифровых технологий этот закон не нарушился. Но их влияние на исследовательских инструментарий социальных и гуманитарных наук становится очевидным уже сейчас, и экономические науки не являются исключением.
Очевидно, что далеко не все сквозные технологии могут быть задействованы в исследовательском процессе, тем более в экономическом анализе. К примеру, за последние годы вышло множество научных публикаций, посвященных, например, криптовалютам, блокчейну и роботизации производства. Однако эти технологии не могут повлиять на гносеологические возможности экономической науки (по крайней мере, пока). Чего нельзя сказать о больших данных и искусственном интеллекте. Первая технология претендует на статус субститута традиционных методов статистического наблюдения экономических процессов; вторая – на принципиально новый инструмент количественного анализа, способный подорвать или оспорить гегемонию регрессионного анализа.
Большие данные
Экономические модели, как бы искусно они ни были построены, требуют обязательной верификации, иначе исследовательский процесс превращается в состязание в математическом мастерстве. И тогда всплывает проблема поиска релевантных данных. Национальные статистические ведомства и международные организации предоставляют богатый исходный материал для анализа. Также высокую ценность для экономистов-исследователей имеют опросы населения или сотрудников компаний. Эти источники можно назвать традиционными, и им присущи следующие недостатки: 1) затратность получения, сложность организации системы сплошного статистического наблюдения и проведения опросов; 2) временной лаг получения сведений, который для национальной статистики может составить год и больше; 3) нерепрезентативность выборки в ходе проведения социологических исследований; 4) ограниченные возможности по дезагрегации данных для проведения микроэкономического анализа.
Революцию в области получения данных, пригодных для экономического анализа, «разожгла» сеть Интернет. «Цифровой след» экономического агента, оставляемый после введения запросов в поисковые сервисы, покупок в электронных магазинах, публикации комментариев в социальных сетях или новостных порталах и прочих ресурсах, позволил сформировать внушительных массив информации о поведенческих паттернах [2]. Среди всех новационных источников получения больших данных можно выделить следующие категории:
1) запросы в поисковых системах
Согласно подсчетам компании Alexa [3], самым востребованным в мире сайтом является Google.com, который сейчас получает порядка 3,5 млрд запросов от пользователей в день [4]. И каждый из этих запросов фиксируется и добавляется базу данных. В 2006 г. был запущен сервис Google Trends, позволяющий получить агрегированную статистику из этой базы с возможностью введения фильтров по географическим областям, временным интервалам и другими возможностями. Принимая во внимание защиту от программ автоматизированного ввода запросов, каждый из них символизирует реальные потребности или интересы пользователей. А совокупность запросов, объединенных по пространственному и временному признаку, отражает уже модели коллективных поведенческих установок. Этот факт и заинтересовал экономистов-исследователей, позволив увязать изменения во вводимых запросах с изменением реальных экономических параметров. Более того, инициатива Google была подхвачена и другими поисковиками – были запущены сервисы Подбор слов (wordstat) от Яндекс и Top от Baidu.
Примеры использования Google Trends для прогноза:
– продаж домов, автомобилей, количества заявлений на выдачу пособий по безработице [5];
– притока туристов [6];
– объема потребления благ и услуг [7];
– продаж билетов в кинотеатры [8];
– уровня инфляции [9].
2) сообщения и комментарии в социальных сетях
Помимо поисковых сервисов в число самых посещаемых сайтов входят социальные сети такие как Facebook (более 1,5 млрд пользователей) и Twitter (свыше 300 млн пользователей). В них ежедневно генерируются сотни миллионов кратких сообщений, комментариев, которые отражают отношение пользователей к тем или иным событиям. С одной стороны, исследование этих сообщений позволяет измерить частоту использования определенных слов или словосочетаний (по аналогии с поисковыми системами), а с другой – семантический анализ этих посланий предоставляет возможность оценить их эмоциональную направленность в целом. Как раз вторая опция позволяет более точно уловить поведение объектов, хотя получение такой информации связано с большими сложностями.
Примеры использования социальных сетей в экономическом анализе:
– прогноз динамики фондовых рынков [10];
– дневные продажи пива отдельной пивоварни [11];
– прогноз загруженности общественного метрополитена [12].
Схожие с указанными примерами возможности формирования поведенческих моделей существуют при анализе комментариев читателей на новостных порталах, но размер аудитории у них все же уступает социальным сетям. А в области маркетинга большую ценность представляют отзывы покупателей на сайтах электронных магазинов, что позволяет сформировать прогнозы продаж тех или иных товаров.
3) иные источники
К прочим источникам получения больших данных для исследований в сфере экономики можно отнести частные и государственные компании, предлагающим потребительские товары и услуги. Например, в Германии сведения о пользовании платными трассами грузовым транспортом стали основой для построения ежемесячного индекса деловой активности [13]. Кроме того, информация о банковских транзакциях, агрегируемая банками, может быть использована для прогнозирования банкротства физических или юридических лиц [14]. Или анализ статистики продаж в продуктовых магазинах применялся для прогнозирования поведения потребителей, уровней продаж и цен [15]. К более необычным случаям получения и использования больших данных для экономических изысканий относится измерение уровня освещенности территорий в темное время суток по снимкам из космоса с целью получения альтернативных замеров ВВП [16].
Роднит эти случаи кроме изобретательности исследователей еще и достаточно высокая трудоемкость получения данных хотя бы по сравнению с поисковыми системами. И здесь как раз может исчезнуть одно из достоинств нетрадиционных источников данных – бесплатность распространения последних. Как бы то ни было, все описанные нетрадиционные источники демонстрируют свою исключительную полезность для расширения экономических знаний на всех уровнях анализа.
Нейронные сети
Прогресс экономики как науки неразрывно связан с ее оплодотворением математическим инструментарием [17]. И новые инструменты количественного анализа постоянно появляются в экономических исследованиях, а чаще заимствуются из других дисциплин. Помимо исследования данных новые источники их получения поставили задачу структуризации «сырой» информации. По некоторым подсчетам 95% информации, получаемой из «больших данных», имеет неструктурированный вид [18]. Поэтому на предварительных стадиях экономических изысканий активно используются методы обработки естественного языка и связывания записей, позволяющие работать с дезагрегированной информацией. При всей необходимости и полезности этих инструментов наибольший интерес с точки зрения развития экономической науки представляют методы проверки связей и обнаружения закономерностей.
Этим целям последние десятилетия верно и достаточно эффективно служил регрессионный анализ, предлагающий удобные и весьма прозрачные алгоритмы установления зависимости между набором переменных. В его основе (в большинстве случаев) лежит априорное определение формы зависимости между зависимым и объясняющими регрессорами, которая зачастую принимает линейный вид. Затем устанавливается сила и направление связи, определяется общая пригодность модели в объяснении дисперсии зависимой переменной, проводятся сравнения достоинств различных конфигураций моделей и т.д. Использование и развитие этих процедур принесло не одну Нобелевскую премию, с одной стороны, а с другой – провоцировало все более последовательную и агрессивную критику со стороны приверженцев нелинейности в экономических системах. В частности, один из ярких представителей этого направления – Н.Н. Талеб [19] – связывает возникновение глобальных экономических кризисов с «линейным» мышлением высокопоставленных чиновников, ответственных за экономическую политику. Как итог, критика регрессионных методов анализа привела к распространению в экономической науке более сложных инструментов познания экономической реальности.
К ним относятся «древа решений», методы опорных векторов, искусственные нейронные сети и другие методы [20]. Но именно нейросети оказались особенно востребованы в экономическом анализе в силу их большей вариативности и гибкости при решении задач классификации и прогнозирования экономических процессов. Первые попытки использования нейросетей в экономической науке датируются началом 1990–х гг. В пионерных работах этого времени определялся уровень риска банкротства фирм, исходя из их текущего финансового благополучия [21]. Параллельно с этим направлением нейронные сети нашли применение в оценке уровня возвратности кредитов, выдаваемых частным лицам и организациям [22]. Помимо группировки субъектов экономической деятельности на уровне микроэкономики, нейросети доказали свою применимость при прогнозировании макроэкономических показателей. В частности, широкую известность получила модель предсказания ВВП в Канаде [23], в рамках которой были получены более точные прогнозы в долгосрочном периоде по сравнению с традиционными линейными эконометрическими моделями. Аналогичным образом для США было спрогнозировано квартальное изменение ВВП и помесячное изменение индекса промышленного производства [24]. Также был составлен достаточно точный прогноз динамики объема розничных продаж в Соединенных Штатах [25]. Постепенно нейросети оказались востребованы в самых разных областях экономического прогнозирования: обменные курсы валют [26]; валовые объемы прибылей корпораций и потребительских расходов [27]; динамика фондовых индексов [28] и т.п. Кроме того, магистральным направлением нейросетевых приложений, которое ежегодно обогащается все новыми работами, признается прогнозирование динамики уровня цен [29].
Задачи классификации и прогнозирования решаются при помощи нейронный сетей во всевозможных областях экономического анализа, а, экспериментальный и новаторский характер таких исследований подтверждается тем фактом, что полученная нейросетевая модель как правило сравнивается с регрессионными подходами по точности полученных результатов [например, 30]. Очевидно, тут кроется некоторое лукавство, так как авторы работ стремятся доработать нейронную сеть до тех пор, пока она не превзойдет иные подходы. Другими словами, результаты научных изысканий демонстрируют не абсолютное преимущество нейросетей над традиционной эконометрикой, а возможности достижения большей точности при некотором статичном состоянии подходов-конкурентов.
Еще один и более однозначный аргумент в пользу нейронных сетей и других методов продвинутого машинного обучения состоит в большей их совместимости с большими данными. Проблемы сложной группировки и прогнозирования на основе многомерного массива данных существенно осложняют применение «линейных» регрессионных подходов, в то время как нейронные сети как раз показывают надежную работоспособность именно на объемной информации. Соответственно, чем стремительней будут развиваться источники получения больших данных об экономических процессах, тем более высокое место будут занимать нейросети в иерархии методов экономических исследований.
Большие данные и нейросети в зеркале статистики научных публикаций
Наглядной иллюстрацией возникшего тренда использования в экономическом анализе больших данных и методов их обработки на основе нейротехнологий и искусственного интеллекта выступает динамика научных публикаций. База данных Web of Science позволяет выполнить поиск публикаций по критерию «тема», т.е. запрашиваемые термины могут присутствовать в названии, аннотации или ключевых словах работы. Опыт создания поисковых образов для сквозных технологий был получен И. Тихомировым и соавторами [31]. Ученые составили лексический ряд для направления «Нейротехнологии и искусственный интеллект» (87 слов и словосочетаний). По тому же принципу был сформирован образ для больших данных (24 термина). Области поиска ограничены десятью дисциплинами, которые можно отнести к экономическим наукам.
Рис. 1 Динамика публикаций по направлениям «Большие данные» и «Нейротехнологии и искусственный интеллект» в экономических дисциплинах
Источник: Web of Science; предметные области: "Business", "Business, Finance", "Development Studies", "Economics", "Demography", "Management", "Public Administration", "Regional & Urban Planning", "Transportation", "Urban Studies"; тип публикаций: статья; индекс: SSCI.
Для обоих вышеуказанных направлений поиска характерна растущая динамика числа публикаций (рис. 1), хотя в общей массе экономических статей (который, например, в 2018 г. было 50 тыс.) их доля пока не велика. В области больших данных более трети статей аффилированы с США (932), далее следуют Китай (315) и Великобритания (291); от России было опубликовано всего 6 работ. Аналогичные закономерности выявлены и для направления «Нейротехнологии и искусственный интеллект», при этом с Россией аффилировано лишь 25 статей. Эти цифры дают основание полагать, что наша страна выпадает из перспективных направлений экономического анализа, которые имеют шансы занять центральное место в экономической науке.
Заключение
Экономика, как и любая научная дисциплина, находится под влиянием развития как других областей науки, так и общества в целом. Сложилось мнение, что последнее переживает цифровую трансформацию, вызванную стремительным распространением цифровых технологий. Этот процесс не только породил качественное изменение повседневной жизни граждан, но и привел к появлению новых способов получения данных об их экономической активности или, иными словами, чтению «цифрового следа». Обилие информации, добытой подобным образом, дало право утверждать об интеграции больших данных в экономический анализ. С одной стороны, это открыло принципиально новые горизонты в экономических исследованиях, поскольку традиционные агрегаторы статистических данных по определению не могут предоставить сведения о поведении экономических агентов с той степенью детализации и оперативности, с которой с этим справляют альтернативные источники. С другой стороны – необходимость обработки и анализа новых масштабных информационных массивов поставила под вопрос релевантность используемых методов их обработки и анализа, которые в своей массе сводятся к линейному регрессионному анализу.
В ответ на эти вызовы, а также решая проблемы учета нелинейности процессов в экономических системах, в экономических исследованиях все чаще стали использоваться методы глубокого машинного обучения, включая искусственные нейронные сети. Успешно справляясь с задачами от оценки риска банкротства отдельных коммерческих структур до прогнозирования уровня ВВП, они с каждым годом, как показал библиометрический анализ, занимают все более прочные позиции в арсенале инструментов экономических исследований. По всей видимости, синергетический эффект от использования больших данных и нейронных сетей будет постепенно вытеснять традиционные методы сбора и обработки данных из лона академической экономики, включая отечественную ее ветвь.
Литература
1. Елизаров А. М. Анализ использования ИКТ в электронной научной деятельности в странах СНГ // Информационное общество. 2016. №. 4–5. С. 114–124.
2. Einav L., Levin J. The data revolution and economic analysis // Innovation Policy and the Economy. 2014. 14(1). Pp. 1–24.
3. Blazquez D., Domenech J. Big Data sources and methods for social and economic analyses // Technological Forecasting and Social Change. 2018. Vol. 130. Pp. 99–113.
4. Alexa Internet. URL:https://www.alexa.com/topsites (дата обращения: 11.09.2019).
5. Choi H., Varian H. Predicting the present with Google Trends // Economic Record. 2012. Vol. 88. Pp. 2–9.
6. Bangwayo-Skeete P. F., Skeete R. W. Can Google data improve the forecasting performance of tourist arrivals? Mixed-data sampling approach // Tourism Management. 2015. Vol. 46. Pp. 454–464.
7. Vosen S., Schmidt T. Forecasting private consumption: survey‐based indicators vs. Google trends // Journal of Forecasting. 2011. 30(6). Pp. 565–578.
8. Hand C., Judge G. Searching for the picture: forecasting UK cinema admissions using Google Trends data // Applied Economics Letters. 2012. 19(11). Pp. 1051–1055.
9. Hassani H., Silva E. S. Forecasting UK consumer price inflation using inflation forecasts // Research in Economics. 2018. 72(3). Pp. 367–378.
10. Pagolu V. S. et al. Sentiment analysis of twitter data for predicting stock market movements / 2016 international conference on signal processing, communication, power and embedded system (SCOPES). IEEE. 2016. Pp. 1345–1350.
11. la Cour L. et al. Predicting the Daily Sales of Mikkeller Bars Using Facebook Data / 40 Symposium i Anvendt Statistik. Københavns Universitet. 2018. Pp. 125–141.
12. Ni M., He Q., Gao J. Forecasting the subway passenger flow under event occurrences with social media // IEEE Transactions on Intelligent Transportation Systems. 2016. 18(6). Pp. 1623–1632.
13. Askitas N., Zimmermann K. F. Nowcasting business cycles using toll data // Journal of Forecasting. 2013. 32(4). Pp. 299–306.
14. Xiong T. et al. Personal bankruptcy prediction by mining credit card data // Expert systems with applications. 2013. 40(2). Pp. 665–676.
15. Einav L., Levin J. The data revolution and economic analysis // Innovation Policy and the Economy. 2014. 14(1). Pp. 1–24.
16. Martinez L. R. How Much Should We Trust the Dictator's GDP Estimates? 2018. URL: http://pubdocs.worldbank.org/en/350051528721174623/Nightlights.pdf (дата обращения: 01.09.2019).
17. Юревич М. А., Цапенко И. П. Математизация экономической науки в зеркале библиометрии // Terra Economicus. 2016. Т. 14. №. 3. С. 14–26.
18. Gandomi A., Haider M. Beyond the hype: Big data concepts, methods, and analytics // International journal of information management. 2015. 35(2). Pp. 137–144.
19. Н. Н. Талеб. Антихрупкость. Как извлечь выгоду из хаоса. М.: КоЛибри, 2014. 768 с.
20. Blazquez D., Domenech J. Big Data sources and methods for social and economic analyses // Technological Forecasting and Social Change. 2018. Vol. 130. Pp. 99–113.
21. Odom M.D., Sharda R. A neural network model for bankruptcy prediction / IJCNN International Joint Conference. Neural Networks. 1990. Pp. 163–168.
22. Marose R.A. A financial neural-network application // AI Expert. 1990. 5(5). Pp. 50–53.
23. Tkacz G. Neural network forecasting of Canadian GDP growth // International Journal of Forecasting. 2001. 17(1). Pp. 57–69.
24. Aminian F., Suarez E.D., Aminian M., Walz D.T. Forecasting economic data with neural networks // Computational Economics. 2006. 28(1). Pp. 71–88.
25. Alon I., Qi M., Sadowski R.J. Forecasting aggregate retail sales: a comparison of artificial neural net-works and traditional methods // Journal of Retailing and Consumer Services. 2001. 8(3). Pp. 147–156.
26. Kuan C.M., Liu T. Forecasting exchange rates using feedforward and recurrent neural networks // Journal of applied econometrics.1995. 10(4). Pp. 347–364.
27. Swanson N.R., White H. A model selection approach to real-time macroeconomic forecasting using linear models and artificial neural networks // Review of Economics and Statistics. 1997. 79(4). Pp. 540–550.
28. Shen W., Guo X., Wu C., Wu D. Forecasting stock indices using radial basis function neural networks optimized by arti–ficial fish swarm algorithm // Knowledge–Based Systems. 2011. 24(3). Pp. 378–385.
29. Choudhary M.A., Haider A. Neural network models for inflation forecasting: an appraisal // Applied Economics. 2012. 44(20). Pp. 2631–2635.
30. Binner J.M., Bissoondeeal R., Elger T., Gazely A., Mullineux A. A comparison of linear forecasting models and neural networks: an application to Euro inflation and Euro Divisia // Applied economics. 2005. 37(6). Pp. 665–680.
31. Бакаров, А. А., Девяткин, Д. А., Ершова, Т. В., Тихомиров, И. А., Хохлов, Ю. Е. Научные заделы России по сквозным технологиям цифровой экономики // Информационное общество. 2018. № 4–5. С. 54–64.
Официальная ссылка на статью:
Юревич М.А., Екимова Н.А., Балацкий Е.В. Цифровая трансформация экономической науки // «Информационное общество», 2020, № 2, С. 39–47.