Новый суперкомпьютерный центр принесет двойную эффективность

На встрече с президентом России Владимиром Владимировичем Путиным сибирский ученый акцентировал проблему резкой неравномерности распределения супервычислительных мощностей по территории страны и его несоответствия интеллектуальному потенциалу регионов и их вкладу в российскую науку. Более 90 % этих ресурсов сконцентрировано западнее Урала, около 75 % — непосредственно в Москве, тогда как только Сибирь дает 15 % высококачественных российских научных публикаций (если считать по статьям в изданиях, входящих в Web of Science).

Так, в Новосибирске, с одной стороны, есть три центра коллективного пользования киберинфраструктурой: Информационно-вычислительный центр Новосибирского государственного университета, Сибирский суперкомпьютерный центр Института вычислительной математики и математической геофизики СО РАН и Центр научных ИТ-сервисов ИВТ СО РАН. С другой стороны, суммарная производительность их вычислительных систем меньше одной десятой Кристофари (суперкомпьютер Сбербанка). В результате существенной ограниченности вычислительных мощностей страдают в первую очередь пользователи. В НГУ, ориентированном в основном на потребности студентов и аспирантов, жестко лимитируют количество одновременно используемых для решения задач процессоров, ССКЦ имеет среднее время ожидания старта задания в очереди задач в 14—17 дней, ИВТ СО РАН предоставляет вычислительные ресурсы очень ограниченному числу пользователей. При этом решаемые вычислительные задачи полностью соответствуют приоритетам стратегии научно-технологического развития Российской Федерации. Например, в 2019 году только с помощью ресурсов ССКЦ было выполнено более 100 НИР на общую сумму свыше 700 млн рублей, и это при производительности систем не более 160 терафлопс. Некоторые вычисления уже сейчас невозможно проводить в Новосибирске из-за недостаточной мощности. Если же говорить о параметрах дальневосточных центров, то они еще ниже, и на карте распределения российской суперкомпьютерной инфраструктуры (по данным рейтинга top50.supercomputers.ru) их нет вообще. В то же время в США, по словам ученого, суперкомпьютерные мощности распределены равномерно по всей территории страны, от Массачусетского технологического института (MIT) на восточном побережье до калифорнийского Ливермора.

Заместитель директора ИВТ СО РАН также обратил внимание на перспективу создания на востоке России мощных научных установок класса мегасайенс, в числе которых — сибирский синхротрон СКИФ и его дальневосточный аналог РИФ, размещение которого планируется на острове Русский. «Вот почему возрастает роль проекта СНЦ ВВОД, — уточнил А. В. Юрченко. — Дело не только в отставании России от ведущих научных держав, в пятерку которых мы должны вернуться, и не во вхождении в какие-то другие рейтинги. Перед нами стоит конкретная задача. Одна рабочая станция СКИФа будет генерировать данные со скоростью до 9 гигабайт в секунду. Не всякая современная система хранения данных способна принимать их в таком режиме, не говоря уже об обработке. У синхротрона запланирован внутренний дата-центр, но он проектировался для задачи приема и предварительной обработки данных с дальнейшим их трансфером на более мощную машину. И такая машина должна быть локализована здесь же, чтобы обеспечивать оперативный прием данных со СКИФа и их обработку практически в режиме реального времени».

По словам ученого, проект СНЦ ВВОД предусматривает создание суперкомпьютера, состоящего из двух блоков для возможности решения задач разных классов, в том числе анализа данных с применением методов машинного и глубокого обучения и традиционного суперкомпьютерного моделирования. Первый блок — на основе классического кластерного суперкомпьютера, второй — гибридный, на основе графических процессоров. Оба блока, как планируется, будут соответствовать мировому top50. «При выборе организационной модели мы опирались на опыт европейских стран, прежде всего Германии, — конкретизировал Андрей Юрченко. — Поэтому СНЦ ВВОД будет не просто мощным дата-центром, но и центром компетенций, образовательной площадкой». В перспективе он сможет стать ядром всей Сибирской сети суперкомпьютерной инфраструктуры, в рамках которой, используя современные грид-технологии, можно будет перемещать задачи между узлами этой сети, исходя из класса таких задач и свободных ресурсов.

«Наука в Сибири»

Фото Александры Федосеевой

СКИФ, встреча с Путиным, новый министр и многое другое

Ключевое слово — СКИФ, причем как в главной роли, так и в привязке к другим темам и сюжетам. В первом случае материалы выходили в широком оценочном диапазоне: от позитивно-самоотчетных (исходящих от губернатора и правительства Новосибирской области) до тревожных (требования ученых к федеральному центру ускорить начало финансирования проекта). СКИФ присутствовал практически во всех публикациях по Академгородку 2.0, в том числе прямо не касавшихся синхротрона. Отдельно выделим получившие по нескольку перепечаток интервью изданию РБК зам.руководителя проектного офиса СКИФ Якова Ракшуна и сообщение РИА Новости (со ссылкой на академика Павла Логачева) о подключении к проекту СКИФ одной из структур Росатома («Титан-2»).

Главные фигуры — губернатор Новосибирской области Андрей Травников и президент РАН академик Александр Сергеев. Первый говорил об Академгородке и СКИФе на аппаратных совещаниях и брифингах в Новосибирске и Москве, на Гайдаровском форуме, во время встреч с Анатолием Чубайсом, Александром Сергеевым и новым главой Минобрнауки Валерием Фальковым. Высказывался и критически (не в адрес руководства области), предложил управление программой «сделать более жестким и глубоким».  Глава Академии наук совершил поездку в Новосибирский научный центр, отразившуюся в около 30 публикациях федеральных, региональных и отраслевых СМИ. В числе первых —  Регнум, Вести, The world news, новости Рамблера.

Энергетика Новосибирской области привязывалась к Академгородку 2.0 — на сессии регионального Минкомхоза программа развития ННЦ была названа главной предпосылкой 60-процентного увеличения числа объектов энергетики в 2019 году и 75%-го — резервных мощностей.

 В ЧС-инфо вышла публикация кандидата экономических наук Юрия Воронова с критикой концепции пространственного развития Академгородка 2.0 от ООО «Концепт-Проект». Критика отчасти справедливая («В концепции главным должно быть описание места новосибирского Наукополиса среди других научных центров мира», «В концепции игнорируется проблема реновации, крайне актуальная для Академгородка»), местами с перехлёстами: «Полуфеодальное деление Академгородка на верхнюю (для ученых) и нижнюю (для быдла) зоны в Концепции делается еще более суровым, чем в советские времена».

 «Академгородок 2.0 без Академгородка 2.0» — так можно обозначить сообщения СМИ о диалоге зам. директора ИВТ СО РАН Андрея Юрченко и Владимира Путина во время встречи в Череповце 04 февраля. Публикации не имели никакой привязки к программе «Академгородок 2.0», поскольку ни она, ни проект СНЦ ВВОД не фигурировали в диалоге главы государства и сибирского ученого.

Как обычно, Академгородок 2.0 фигурировал во множестве публикаций, почти никак к нему не относящихся. К примеру, анонсы февральских Дней науки, достижения ученых Калининградского университета, намерения присвоить Новосибирску звание города трудовой доблести, студенческий дискуссионный клуб «Диалог на равных», планы развития метрополитена и скоростных электричек, дебаты вокруг места строительства музыкальной школы в Академгородке, уголовное дело по факту распределения земель Барышевского сельсовета, личные увлечения Андрея Травникова — программа развития Новосибирского научного центра всё равно так или иначе упоминалась.

Сибирские ученые развивают проект СНЦ ВВОД

«СНЦ ВВОД — это флагманский, очень важный, интегрирующий, объединяющий новые направления “Академгородка 2.0” проект, — отметил министр науки и инновационной политики Новосибирской области кандидат физико-математических наук Алексей Владимирович Васильев. — Он развивается довольно динамично и по части поиска и проработки технических, инженерных решений, которые будут использоваться при создании этого центра, и в плане формирования перспективных команд и коллективов».

 



Алексей Васильев

Министр отметил основные этапы 2019 года, пройденные СНЦ ВВОД: формирование команды, подготовку молодых исследователей, а самое главное — создание исследовательской программы, которая будет реализовываться на вычислительном комплексе, и как следствие — формулировку и уточнение технических и инженерных требований.

«Есть много задач в области обработки данных и в научных исследованиях, которые требуют запланированных нами мощностей», — прокомментировал руководитель координационного совета проекта СНЦ ВВОД, ректор Новосибирского государственного университета академик Михаил Петрович Федорук. Напомним, к 2022 году предполагается достигнуть мощности по крайней мере в 10 петафлопс, объема системы хранения данных — минимум 150 петабайт.  «У нас есть четкий план, который состоит из многих этапов, в частности необходимо проработать вопросы о земельном участке, проектную документацию на строительство здания и так далее. Подчеркну — это один из базовых проектов программы “Академгородок 2.0”, потому что центр обработки данных и вычислений нужен всем институтам и всем остальным проектам», — сказал Михаил Федорук.

 



Михаил Федорук

Заместитель руководителя координационного совета проекта СНЦ ВВОД, директор Института вычислительной математики и математической геофизики СО РАН доктор физико-математических наук Михаил Александрович Марченко также сообщил, что в 2019 году достигнута договоренность с будущими ключевыми пользователями центра о проведении суперкомпьютерных вычислений и хранении данных в едином пространстве СНЦ ВВОД.

 



Андрей Юрченко

«Мы завершили то, что можно назвать концептуальным проектом — то есть сформировали основополагающий пакет документов, в частности готовы документы для подачи в федеральную адресную инвестиционную программу, — сказал заместитель руководителя координационного совета проекта СНЦ ВВОД, первый заместитель директора Института вычислительных технологий СО РАН кандидат физико-математических наук Андрей Васильевич Юрченко. — Сейчас у нас есть вся документация, чтобы продвигать этот проект в целях поиска поддержки».

«Наука в Сибири»
Фото ИВТ СО РАН (анонс) и Андрея Соболевского

Большим данным – большие проекты

О чем речь?

Как принято в академической среде, участники обсуждения сначала взялись сформулировать его предмет. Первый заместитель директора ИВТ кандидат физико-математических наук Андрей Васильевич Юрченко констатировал, что оба термина — цифровые двойники и большие данные — уже хорошо прижились как в научном, так и более широком обиходе. «С другой стороны, они очень расплывчаты. При этом я не считаю, что научные определения нужно унифицировать ГОСТами, — сказал А. Юрченко. — Мы, ученые, вправе находить взаимоприемлемые трактовки в рамках профессионального общения».

«С понятием больших данных я столкнулся впервые в 2012 году на крупной корпоративной конференции, — вспоминал доктор технических наук Владимир Борисович Барахнин из ИВТ СО РАН. — Представитель одного из операторов сотовой связи рассказывал, как они анализируют логи пользователей для выбора оптимальной маркетинговой политики. Речь шла о десятках миллионов записей и вывод был такой: решение по выбору сети принимают отцы семейств, на них нужно ориентироваться. Затем дама из медицинской компании продемонстрировала результаты работы с более сложными данными о ста тысячах пациентов. Это делалось для решения той же задачи, но дало противоположный результат: вышло, что ориентироваться при продвижении медицинских услуг нужно в первую очередь на женщин. Тогда нам казалось, что с позиций науки о вычислениях и первое, и второе ничего принципиально нового не представляют — не те величины. Но когда летом уже следующего года во время истории с Эдвардом Сноуденом выяснилось, что спецслужбы США способны сканировать и анализировать едва ли не всю электронную переписку — а это миллиарды очень плохо структурированных записей, — стало ясно, что термин “большие данные” имеет полное право на существование. И они требуют принципиально других, новых методов работы по сравнению с теми, к которым мы привыкли». Владимир Барахнин обозначил одно из таких отличий: работа с big data невозможна прямыми методами обращения к ним и требует многоуровневого машинного обучения.

Заместитель главного ученого секретаря Сибирского отделения РАН кандидат технических наук Юрий Александрович Аникин также апеллировал к опыту американских спецслужб, цитируя максималистское определение одного из директоров ЦРУ: «Большие данные — это все данные мира, причем доступные для анализа в пределах одного акта». Говоря о цифровых двойниках, доцент факультета информационных технологий Новосибирского государственного университета Виталий Геннадьевич Казаков назвал их «не научным термином, но научной метафорой». «Такие иносказания используются не для того, чтобы раздвинуть горизонты внутринаучного и межнаучного общения, — считает он, — а для вступления в контакт с людьми, которые распределяют деньги. Имитационное моделирование на компьютерах проводилось еще с 1950-х годов, и в течение нескольких десятилетий у нас не было никакой необходимости в термине “цифровые двойники”. Он появляется в тот момент, когда такие модели начали массово применяться в промышленности, а ей руководят не научные работники — с ними потребовалось находить общий язык и подбирать приемлемые понятия. Но прежде чем использовать такие термины в науке, я бы предложил предварительно определяться в их необходимости».


Юрий Аникин

Кандидат технических наук Роман Константинович Федоров из иркутского Института динамики систем и теории управления им. В.М. Матросова СО РАН считает, что понятие “цифровые двойники” всё же приемлемо и в науке, поскольку выделяет класс имитационных моделей многоразового непрерывного использования и поэтому самообновляющихся, «живых», реагирующих на поступление новых данных в режиме реального времени. Прозвучала и гуманитарная трактовка: «Цифровые двойники — очередная опасная игрушка человечества, порожденная его неистребимой ленью и любознательностью». Опасность видится в превращении пользователя из профессионала в так называемого квалифицированного потребителя, который в большей степени наблюдает виртуального субъекта, нежели управляет им. В качестве примера приводились летные происшествия и даже катастрофы последних лет, вызванные зависимостью экипажей от интеллектуальной авионики.

Цифровые урожаи

Сельское хозяйство перестает быть консервативной сферой, в том числе и в России. Производительность растениеводства, например, за последние десятилетия возросла в разы. Если в СССР ежегодные «битвы за урожай» с привлечением почти всего городского населения давали (по состоянию на 1978 г.) средние 17 центнеров зерновых с гектара на площади 74 миллиона гектаров, то урожайность 2017 года составила 29 центнеров с гектара при сокращении посевов до 48 миллионов гектаров. Эти данные приводились в презентации академика Виктора Валентиновича Альта (Сибирский федеральный научный центр агробиотехнологий РАН), представленной участникам круглого стола.

Как выяснилось, рост производительности достигнут за счет комплекса изменений — прежде всего, увеличения количества и точности операций, производимых на полях, а также замены машинного парка на более современный (в том числе с автоматизированным и роботизированным управлением). Примером служит хозяйство «Майское» (Новосибирская область), где в 1988 году 9 тысяч гектар обрабатывали 67 комбайнов, а сегодня с 20 тысячами управляется 15 машин, при этом урожайность выросла ровно вдвое. Но высокий урожай — не всегда благо, в некоторые годы это вызывает пресыщение рынков, падение цен, накопление нереализуемых товарных излишков, как это произошло с сахарной свеклой и сахаром в текущем году.

Поэтому цифровизация аграрного сектора — не «цифровые двойники коров» (упоминавшиеся в качестве курьёза), а интеллектуальные системы комплексного прогнозирования, планирования и ведения хозяйства, основанные на работе с big data самого различного происхождения: от данных дистанционного мониторинга земной поверхности до экономических показателей и информации с сенсоров сельхозмашин. «Специалисты СФНЦА РАН и ИВТ СО РАН ведут совместный проект, к развитию которого намерены подключить индустриальных партнеров, — сообщил А.В. Юрченко. — Речь идет о разработке цифровых технологий для снижения потерь от заболеваний культур, а в перспективе — поэтапном создании системы планирования и управления урожайностью». Ученый не отрицает, что это окажет воздействие на автономию принятия решений отдельными холдингами и хозяйствами: «Мы все встали на путь создания новой плановой экономики, и не только аграрной».

Правда, не все согласны с возможностью стопроцентно эффективного планирования урожайности. «До сих пор важнейшим воздействующим фактором здесь является климат, — отметил В. Б. Барахнин. — Возможности его прогнозирования на сезоны вперед сегодня весьма невелики. Четкое предсказание семи тощих и семи тучных лет пока описано только в Книге Бытия».


Владимир Барахнин

Потоки и преграды

Другой комплексный проект, обсуждавшийся на круглом столе — создание цифровой модели Обь-Иртышского речного бассейна. Со стороны науки его инициаторами выступили барнаульский Институт водных и экологических проблем СО РАН и Кемеровский филиал ИВТ СО РАН, к которым позднее присоединился и центр «Новые производственные технологии» Санкт-Петербургского политехнического университета Петра Великого. Проект уже включен в программу развития создаваемого научно-образовательного центра (НОЦ) «Кузбасс» и концептуально задуман прежде всего как межрегиональный. Соглашение об участии в нем подписали Кемеровская область (координационный совет проекта возглавил вице-губернатор региона Константин Геннадьевич Венгер) и еще восемь субъектов Сибирского и Уральского федеральных округов.

По словам Андрея Юрченко, цель этой научно-территориальной коллаборации — сохранение и экологическая реабилитация водных объектов, входящих в Обь-Иртышский бассейн (включая Телецкое озеро), точная оценка влияния на них располагающихся на берегах рек и озер этого бассейна городов и агломераций за счет построения основанной на больших данных (data-driven) системы комплексного управления водными ресурсами (КУВР) речного бассейна в соответствии с действующим международным стандартом на такие системы. «Это очень больший проект, — подчеркнул заместитель директора ИВТ, — в котором мы хотели бы, с одной стороны, использовать по максимуму те заделы, которые уже есть у нас и наших коллег — как в области моделирования, так и в работе с большими данными. — С другой стороны, мы надеемся, что межрегиональная и междисциплинарная инициатива будет поддержана государством как соответствующая целям национальных стратегий и проектов».

Обь-Иртышский проект А. Юрченко назвал своеобразным спин-оффом (ответвлением — Прим. ред.) более широкого научного начинания по моделированию сложных экосистем, сопряженного с Планом комплексного развития СО РАН. «Мы видим возможность не только масштабирования и переноса создаваемых моделей на экосистемы других частей России и заинтересованных стран, но и построение, по аналогии, систем мониторинга и управления другими природными ресурсами», — подчеркнул ученый.

Затраты на создание цифровой модели Обь-Иртышского бассейна оценены весьма приблизительно — «порядка миллиарда рублей». «Потребуется создание десятков, если не сотен, новых экологических полигонов и контрольных станций, оснащенных самым современным оборудованием, — заметил Андрей Юрченко. — Это далеко не чисто научный проект, и мы рассчитываем на участие в нем десятков предприятий и компаний, региональных властей и управляемых ими ресурсов». Неизбежен, но не решен вопрос об интернационализации проекта: верховья и истоки Иртыша находятся на территориях Казахстана и Китая, без поступления данных откуда полнота модели ставится под сомнение. Как отметил заведующий лабораторией ИВТ СО РАН доктор технических наук Евгений Леонидович Счастливцев, сопредельные страны могут быть вовлечены через структуры Шанхайской организации сотрудничества, тем более что академии наук государств-участников ШОС создали специальный совет по взаимодействию.

 

Виталий Казаков

Участники обсуждения не скрывали того, что в академических институтах и университетах есть факторы, препятствующие их активности в комплексных проектах. В частности, был назван разрыв (ментальный, мотивационный, инструментальный) с высокотехнологическими компаниями, включая сектор IT. «Даже в Академгородке не все субъекты готовы к кооперации», — высказался Виталий Геннадьевич Казаков из Новосибирского госуниверситета. «Мы относимся со скепсисом друг к другу и все вместе — к новым амбициозным проектам, — заметил Андрей Юрченко. — Возможно, этот скепсис и мешает нам больше всего».

Фото Андрея Соболевского