Антон Халиков: «Нейросеть не заглядывает в будущее, она просто пытается продолжить числовой ряд» - видео
13 мая 2020, 10:30
706
0
Антон Халиков является основателем уральской IT-компании NetAngels и создатель нейросети, которая дает прогноз по заболеваемости COVID-19.
В беседе с корреспондентом интернет-редакции ТНВ он рассказал о том, что любые предсказания носят теоретический характер, а прогнозы следует воспринимать с осторожностью, о том, что нас уже давно «чипировали», о разработке нейросети, о своих татарских корнях, а также составил прогноз для Татарстана.
«Моей целью изначально было просто понять, выйдем мы все на работу после 30 апреля или нет»
- Как вам пришла идея создать нейросеть и сделать прогноз относительно окончания эпидемии коронавирусной инфекции COVID-19 в России?
- Прогноз делается не относительно окончания эпидемии, а буквально на неделю вперед. Я думаю, такая идея пришла в голову всем, кто по долгу службы занимается анализом данных, мне очень часто приходится это делать поскольку я руковожу IT-компанией. Т.е. это для меня не ново, и я занимаюсь прогнозированием периодически. В 10-х числах апреля мне стало интересно «А что же нас ждет дальше?», потому что жить в состоянии неопределенности довольно сложно. Поскольку президент сказал, что до 30 апреля мы сидим дома, я подумал, реально ли все это и действительно ли закончится карантин после 30-го и мы все начнем жить прежней жизнью.
Поскольку у меня есть много математических моделей, которые можно использовать для прогнозирования, я начал использовать различные варианты и смотреть какая подходит больше, это произошло примерно 15 апреля. Через несколько дней у меня получился первый результат, который так скажем, меня удовлетворял. Когда нейросети обучаются, то выборка тех данных, которые у вас есть, она всегда делится на обучающую и тестовую. Т.е. обучающую выборку мы показываем нейросети. Например, данные, которые были с начала эпидемии с 1 марта и до того, что было неделю назад, а потом смотрим данные за прошлую неделю, что бы посмотреть реальные ли они. И когда более или менее показатели стали похожи на правду, я начал строить прогнозы дальше. С 18 апреля я начал добавлять в нейросеть новые данные и смотреть прогноз вперед, через несколько дней я понял, что прогноз получается точным, но только на неделю. Потому что нейросеть такого типа – это рекуррентная нейросеть, т.е. она не умеет строить долгосрочные прогнозы, она просто пытается повторить тот тренд данных, которые были до этого. 26 апреля прогноз показал, что планируется 100 тысяч заразившихся, а на тот момент было 40 тысяч. В итоге прогноз правился и тремя днями позже в реальности получилось 100 тысяч заразившихся, т.е. за 5 дней до того, как это случилось, я ошибся на 3 дня. Позже в какой-то момент я решил переделать и засунуть в нейросеть больше данных, не только по количеству заболевших, но и по количеству смертей по России. Но самое главное надо помнить о том, что эта штука (нейросеть) не обладает знаниями о том, как протекает эпидемия на самом деле, с точки зрения нейросети - это просто цифры. Поэтому всерьез относится к прогнозам нельзя!
Моей целью изначально было просто понять, выйдем мы все на работу после 30-го апреля или нет, я понял, что нет, не выйдем. А 3 дня назад (интервью было записано 6 мая) наш губернатор Свердловской области сказал, что мы сидим по домам до конца майских праздников, и я задался вопросом «А потом мы выйдем на работу?», ну очевидно тоже что нет. А в итоге проходит 3 дня и губернатор сам заявил о том, что мы не выйдем на работу. Т.е. то, что наш губернатор сказал сегодня я знал 3 дня назад.
- На чем вы основывались, создавая эту сеть? Т.е. этот прогноз не предвзятый?
- Основные данные, которые использовались до недавнего времени по заболеваемости были взяты с сайта стопкоронавирус.рф. Со временем стало интересно, повысить точность прогноза и тогда я стал добавлять дополнительные данные. Какие-то данные помогли, а какие-то ухудшили точность прогноза. На данный момент с того же сайта я добавляю данные по смертности и есть еще планы добавить данные об индексе самоизоляции из Яндекса.
У эпидемиологов есть специальные системы расчетов, которые базируются на давным-давно разработанных математических моделях, система дифференциальных уравнений, которая позволяет прогнозировать рост эпидемии от начала и до конца.
- Когда вы сделали первый прогноз? И совпадал ли он с реальными данными?
- Я сделал его 18 апреля. Тогда нейросеть сказала, что у нас будет 100 тысяч заболевших 25-го числа, а по факту это было 28 или 29 апреля. Т.е. ошибка довольно большая, если мы говорим о прогнозе на неделю, то я ошибся на полнедели. Но, как я уже сказал раннее – эта штука не заглядывает в будущее, она просто пытается продолжить числовой ряд.
- Выясняли ли вы когда наступит пик заболеваемости в нашей стране? Это возможно вычислить по нейросети?
- Нет, это невозможно! Потому что для этого нужно большее количество данных, для того чтобы понимать, какие из данных влияют на снижение прироста заболеваемости в день, а какие влияют, наоборот на повышение.
Мы живем в огромной стране и у нас куча регионов, и в каждом свои особенности. В Свердловской области, где я живу, у большинства людей конфессия – это православие. 2 недели назад был православный праздник - Пасха, она очевидным образом повлияла на последующий рост заболеваемости спустя инкубационный период, потому что много людей пошли в церковь не смотря на все запреты. В Татарстане я так понимаю, что там основная конфессия – мусульманство, люди тоже собираются на праздники. Я сделал прогноз в нейросети для Татарстана с начала апреля и до 4 мая (см. ниже). И если вести данные об увеличении мер самоизоляции, со всех регионов, собрать индексы самоизоляции, данные о погоде, тогда можно будет предсказать прогнозы с большей точностью.
- Сингапурские ученые тоже делает прогнозы относительно окончания пандемии, чем их прогнозы отличаются от ваших?
- Сейчас прогнозы делают все кому не лень. Есть методики, которые разработаны еще в прошлом веке эпидемиологами совместно с математиками, которые описывают как должна идти пандемия. В любой стране, с любой плотностью населения – это не секрет. Другое дело, что системы уравнения, нейросети – они не учитывают реальных факторов того, как например, сегодня может что-то пойти не так.
- Недавно сооснователь Microsoft Билл Гейтс сказал о том, что мир сможет вернуться к обычному распорядку после пандемии коронавируса не раньше, чем через год или два, поскольку люди еще долго будут бояться посещать общественные места, опасаясь заразиться вирусом. На ваш взгляд, каким будет мир после окончания пандемии? И когда примерно мир «вернется в прежнее русло»?
- Мы видим, как разные страны накрыло с разной скоростью и разными последствиями. Если мы посмотрим данные по миру, которые публикуются каждый день точно также как и у нас в стране, в некоторых странах уровень смертности по отношению к заболевшим, то, например, уровень смертности во Франции отличается от России в 15 раз – соответственно где-то это закончится раньше, а где-то позже. Я думаю, как минимум все продлится до осени, причем это очень оптимистично, и ни о каком открытии границ в мире речи идти не будет. Не знаю когда это будет возможно говорить о том, что житель Казани полетел на самолете в Чехию...
- Недавно российский режиссер Никита Михалков в своей программе рассуждал на тему “У кого в кармане государство”. Он рассказал о том, что Билл Гейтс планирует массово чипировать людей планеты. Благодаря этому он будет контролировать людей на соответствие характеристик ежедневной активности. Вы верите в это?
- Я слышал, что есть шутки по этому поводу, но сам не читал их интервью. В каком-то смысле нас всех уже чипировали, потому что на мне всегда часы, со мной всегда телефон, ноутбук и корпорация Apple всегда знает, в какой день, например, я больше активен, сколько я расходую калорий и т.д. Многие данные о нас доступны уже давно. Также наше государство по вышкам сотовой связи может знать где я нахожусь в данный момент. Не знаю, что придумал Билл Гейтс, ну и что дальше?
«Мы перевели нашу компанию на удаленный режим работы за 2 недели до объявления официальной самоизоляции»
- Каков на ваш взгляд, самый оптимистичный прогноз относительно срока окончания эпидемии?
- Может быть полгода, может быть больше. Если говорить о том, когда мы все сможем вернуться к какому-то подобию предыдущей жизни, то может быть в июне.
- Посещаете ли вы работу или же работаете дома? Что стало самым сложным для вас с введением карантина?
- Мы IT-компания, которая работает круглосуточно, поскольку мы предоставляем облачные услуги для организаций, в том числе и для правительственных. Мы работаем в новогоднюю ночь и для нас удаленная работа – не новость.
Мы перевели нашу компанию на удаленный режим работы за 2 недели до объявления официальной самоизоляции, это была середина марта. Но некоторые люди в том числе и я, ходим на работу, потому что из офиса работать удобней, а дома у меня двое детей, которые учатся на удаленке.
- Антон, судя по фамилии у вас есть татарские корни или может быть вы сам татарин?
- Со стороны отца у меня вся родня – это татары, которые жили в Челябинской области в деревне, которая после переезда называлась Караболка, оттуда родом мой дед. Деревня была перевезена из Татарстана целиком 150 лет назад, когда помещик переехал вместе со всеми крестьянами. По той деревне прямо по краю прошелся радиоактивный след после аварии на Маяке в 1950-х годах. В Екатеринбурге папа встретил мою маму из Московской области, где уже появились я и мой брат. Так что, я наполовину русский, а наполовину татарин.
Если говорить в общем, то я из Екатеринбурга. 16 лет назад я организовал IT-компанию, которая занимается предоставлением услуг хостинга. Сейчас занимаюсь тем, что строю и развиваю эту компанию.
Комментарии 0