3 216 0

Денис Гурский: "Государство не понимает, какие данные надо открыть, оно откроет то, что требует общественность"

Автор: 

Основатель портала открытых данных Денис Гурский рассказал БизнесЦензор, почему государство так вяло выкладывает массивы данных и какие перспективы ждут Украину, когда процесс запустится в полный рост.

гурский

Фото: Facebook Дениса Гурского

Украина заняла 62 место в рейтинге открытых данных Open Data Barometer по итогам 2015 года. Всего в нем принимали участие 92 страны. Лидеры рейтинга - Великобритания и США.

Великобритания начала процесс открытия государственных данных в 2006 году, а США - всего 6 лет назад. За ними следуют Франция, Канада, Мексика, Уругвай, Южная Корея и Филиппины.

А согласно прогнозам исследователей европейского проекта по большим отрытым данным Bigopendata.eu, к 2020 году открытые данные принесут только Европе 206 млрд евро. Впрочем, уже по итогам нынешнего года Украина имеет шансы подняться в рейтинге.

В минувшем году парламент принял закон о доступе к публичной информации на основе открытых данных. Было принято постановление, регламентирующее формат, в которых должны открываться данные. Был указан перечень данных, подлежащих опубликованию.

На конец апреля постановление должно было быть выполнено, однако многие ведомства, как часто бывает, к этому времени лишь "проснулись".

Сейчас государственный вэб-портал открытых данных (data. gov. ua) работает в тестовом режиме.

В июне издание T exty подготовило инфографику о том, насколько активно госорганы выполняют постановление Кабмина. Как выяснилось, стандартные типовые данные выложили все - это название, структура, контакты, выделенные бюджеты, словом то, что обычно содержится на официальном сайте любого министерства или ведомства.

Однако в постановлении говорилось и о необходимости открыть индивидуальные наборы данных. 10 ведомств это указание правительства проигнорировали.

В списке "нарушителей" Высший хозяйственный суд, Государственная регистрационная служба, Госветфитослужба, Госрыбагентство, Министерство агрополитики, МИД, Минобразования, Минздрав, Минфин и Нацсовет по вопросам телевидения и радиовещания.

Часть информации, выложенная на портал открытых данных, малоинформативна, либо ее практически невозможно использовать. Большая часть данных выложена в форматах, которые сложно использовать дальше - doc, docx, а также в pdf, jpg, png и tiff.

Одна из причин - недостаток финансирования. Все затраты, связанные с открытием информации, возложены на сами министерства и ведомства. Им надо подготовить специалистов и оцифровать в нужном формате весь массив данных.

О том, какие еще проблемы возникают у госорганов в связи с необходимостью открыть свои данные, и как можно их использовать, в интервью Бизнес Цензор рассказал основатель SocialBoost (платформы, запустившей портал открытых данных) и инкубатора на основе открытых данных 1991 Open Data Incubator Денис Гурский.

данные

- На сегодняшний день постановление Кабмина о необходимости открыть данные выполнили немногие. Кто в лидерах?

- Как ни странно, Государственная фискальная служба опубликовала большое количество данных, Минфин опубликовал много данных. Есть проект E - Data (spending.gov.ua), который публикует финансовую информацию, связанную с бюджетными транзакциями, есть открытые данные, которые публикуются о госзакупках - это проект Прозорро.

Мне кажется, основная причина, почему финансовая информация открывается легко, заключается в том, что эта информация хранится в структурированном, машиночитаемом виде. В отличие от информации, например, экологической, или связанной с инфраструктурными объектами.

Поэтому тут нужно было те информационные системы, которые есть в Минфине, перенастроить для публикации на сайт. В принципе, они публикуют информацию, которая уже есть у них в базах.

Среди тех, кто будет сейчас активно публиковать информацию, находится Министерство инфраструктуры, потому что мы вместе с ними продолжаем проводить аудит данных внутри министерства.

Само министерство имеет не очень много информации, но очень много информации находится на гос компаниях, которые под ним. Э то "Укрзализныця", "Укрпошта". И, соответственно, там за какой пласт информации ни возьмись - все коммерческая информация.

Например, удалось выяснить, что у "Укрзализныци" есть набор данных, который называется Координаты всех ж/д станций и узлов, в котором есть не только координаты этих станций, но и часы открытия/закрытия этих станций и пассажиропоток.

Это просто золотая информация для тех, кто решил открыть какой-то малый бизнес и продает, к примеру, булочки какие-то, или другую розничную сеть строит. Но эту информацию невозможно получить открыто, за нее нужно заплатить. А она теряет актуальность где-то через полгода.

Соответственно, приходится платить снова. Это не нормально. Такая информация должна публиковаться "Укрзализныцей" открыто, а уже на электронных сервисах в партнерстве с компаниями, которые используют эту информацию, зарабатывать деньги, формируя государственно-частное партнерство.

Так может появится сервис, который позволяет спланировать розничную сеть на основании станций украинской железной дороги. Вот это нормальная цивилизованная модель. Министерство инфраструктуры сейчас будет активно открывать информацию о почтовых отделениях, по "Укрзализныце", про порты и про лицензии, автоперевозки, пункты взвешивания и т.д.

- Почему некоторым органам проще других открыть свои данные?

- С меньше активностью данные открываются там, где информационные, внутренние системы не позволяют сделать это быстро.

Сейчас в активном обсуждении находится закон об облачных технологиях, который должен, в том числе, облегчить госорганам публикацию информации, а также хранить свои информационные ресурсы в облаке. Мне кажется, это очень правильная инициатива и она приведет к тому, что государство существенно уменьшит ненужные статьи затрат.

Это абсолютно неправильная ситуация, когда покупаются серверы, ими набивается подвал, они используются на 10%, и еще есть мужчина с ружьем, который стоит, охраняет его. Я понимаю, что это прекрасное желание списать 90% бюджета в ИТ на закупку серверов, которые стоят дорого. Но мне кажется, что деньги государство должно тратить на квалифицированных сотрудников и на разработку сервисов, нужных гражданам.

Такие сервисы можно сделать на данных, но эти данные должны храниться в необходимом формате и храниться в общедоступной системе, за исключением секретной и персональной информации.

Взять любое министерство. У него информационная система не интегрирована с другими министерскими системами. То есть, одно министерство не знает, какая информация хранится в другом и приходится распечатывать это на листах, делать визы, нести в другое министерство, где это снова начинают оцифровывать.

Вот эти все сумасшедшие процедуры легко избежать, если данные будут публиковаться в общем облаке. Может быть, вообще надо создать государственное облако, как это сделано в некоторых странах. Облако принадлежит государству, государством администрируется, но это уже не такие сумасшедшие деньги, как на сервера. И все министерства и граждане имеют доступ к закрытой или открытой части облака соответственно.

данные

- То есть, ни министерствам, ни гражданам для получения какой-либо информации или справки не нужно будет запрашивать ее дополнительно, а можно будет в рамках разрешенного доступа к информации просто зайти и посмотреть на открытом ресурсе?

- Так и есть. Многие министерства уже хотели бы открывать данные, но информационные системы не позволяют. Все разбросано в "вордовских" файлах по разным компьютерам. Отдельного человека, который мог бы все это собрать, нет. Они не понимают, как все это свести в машиночитаемый формат.

- Тупик?

- У нас есть понимание того, как можно помочь, но это тоже процесс. Нужно обучить сотрудников. В каждом министерстве должен появиться open - data чемпион - человек, который будет "драйвить" этот процесс изнутри. Помогать чиновникам открывать информацию, отвечать за построение грамотной архитектуры внутри ведомства.

Зачастую министерства не знают, какие данные и как собираются. И, более того, не могут ответить на вопрос, как эти данные надо хранить и как они сейчас хранятся. Спросите у любого министерства, какие данные у вас есть - они до конца не знают. Потому что большое количество госпредприятий, департаментов, госагентств, которые находятся под министерствами… Эту схему нужно нарисовать, и сделать это может только инсайдер.

- Какие министерства столкнулись с такой проблемой и вообще не могут открыть данные?

- Таких чтоб совсем, таких нет. Есть министерства, которые столкнулись с тем, что данных очень много и не получается открыть то, что хочется. Например, Минэкологии.

Там политическая воля к открытию данных есть. И не только среди чиновников министерства, но и среди депутатов, которые по этой теме работают. Вы знаете только о скандале с янтарем. Но есть масса запросов, которые касаются качества воздуха, состояния почвы, других ископаемых.

Проблема в том, что много разрозненных систем. И получается, что надо каждую систему отдельно допиливать и создавать API (Application Programming Interface, интерфейс прикладного программирования - БЦ) для открытия данных.

Возьмем Минагрополитики. Там, может быть, не так много разрозненных систем. Но, огромное количество информации собирается и хранится на бумаге. А оцифровать - огромный кусок работы. Нужна целая команда и оборудование для оцифровки. Поэтому все точечно.

Владислава Рутицкая помогает очень. Например, в инкубаторе 1991 появился стартап AgriEye, который позволяет фермерам использовать спектральную камеру на дроне, которая анализирует почву на предмет влажности и температуры. Эти данные скрещиваются с данными агрохимпаспортов полей, которые показывают химический анализ почвы. Понятный стартап.

Министерство увидело в этом общественный интерес и помогло конкретно этому проекту открыть нужные данные. Данные уже общедоступны, но появление проекта привело к тому, что министерство открыло эту информацию. Поэтому мне кажется, что чем больше будет проектов, реализация которых требует какой-то набор открытых данных, тем больше у государства будет поводов открывать эти данные.

- Те министерства и ведомства, которые сейчас открывают данные, они это делают уже в каком-то унифицированном формате, или потом придется вновь приводить их к "общему знаменателю"?

- Постановление Кабмина четко говорит о том, в каких форматах данные должны публиковаться. Многие действительно публикуют данные не в тех форматах. Чаще в тех, в которых им удобно опубликовать.

Например, в "ворде" - в не машиночитаемом формате. Иногда это оправдано, например, при публикации постановлений. Но, если мы говорим о формировании таблиц, то данные в "ворде" тут можно считать "преступлением" против системы открытых данных.

Поэтому надо образовывать, проводить тренинги. У нас создана для этого целая школа. Мы делали серию тренингов для чиновников в Минэкономики, в Мининфраструктуры. Собирали госпредприятия, рассказывали, в чем может быть их интерес в формировании государственно-частного партнерства со стартапами на основе открытых данных.

- Пару лет назад делали "рейтинг коррупции" и тогда самыми коррумпированными называли милицию, учителей и врачей. Как открывают данные в этих министерствах?

- Министр образования Лилия Гриневич активно поддерживает все общественные инициативы, связанные с открытыми данными. Министерство будет открывать очень много информации. Они и сейчас уже открывают. У них есть сложности с администрированием реестров, потому что они очень большие. Но я думаю, что все эти сложности решаться, как только новая команда войдет в курс дела.

А вот что касается здравоохранения, то давайте дождемся какого-то министра.

- А с МВД?

- Благодаря тому, что министр не против, а грузинская команда "за", все, в принципе, происходит достаточно гладко. Но есть свои нюансы - новая полиция забрала на себя часть информационных функций и неразбериха теперь с тем кто что администрирует.

- Какие проекты сейчас планируют внедрять на основе открытых данных?

- Об одном проекте я вам уже рассказал. Есть проект, который называется "Цифровая полиция". Он использует данные по количеству преступлений, месту и времени. Соответственно, это карта преступности и система уведомлений, направленная на обеспечение безопасности граждан в городе.

С ее помощью возможна прокладка безопасных маршрутов и уведомление, если вы забрели в опасный район. Плюс ко всему там есть информация о краже автомобилей или вандализме. Соответственно, если вы припарковались в незнакомом месте, можно проверить, насколько безопасно оставлять машину на ночь по этому адресу. Это данные полиции из реестра МВД. Проект сейчас пилотом тестируется во Львове и постепенно будет распространяться на все украинские города.

Проект "Антикоррупционный монитор", который анализирует данные системы ProZorro. Там идет по несколько тысяч записей в сутки по госзакупкам, но ни один экспертный совет не сможет провести качественный анализ этой информации.

Ребята из "монитора" имеют опыт работы в бюро кредитных историй, они знают, как по формулам определить подозрительного заемщика. Они анализируют весь пул информации от ProZorro в автоматическом режиме, вычленяют 20-30 случаев в сутки опасных с точки зрения коррупции и предоставляют экспертам на рассмотрение.

Есть проект, который реализуется в Киеве - t eplo. org. ua. Он анализирует информацию об энергоэффективности домов. Позволяет вам, живя в типовом доме, оценить, сколько вы платите за коммунальные платежи, а сколько платят соседи в таком же точно доме рядом. Сопоставить, насколько энергоэффективны дома.

Есть еще ряд проектов, которые связаны с энергетикой. Когда они будут в инкубационной программе 1991 в партнерстве с Kyiv Smart City, тогда и поговорим о них.

- Насколько велик интерес инвесторов к украинским стартапам на основе открытых данных?

- Основная магия происходит там, где открытые данные смешиваются с большими данными. Условно говоря, мы дроном собираем информацию с полей и связываем с этим пару государственных реестров. Получается полноценный проект. К таким стартапам интерес инвесторов есть.

Один из первых стартапов в 1991 - AgriEye получил инвестицию пару недель назад - $150 тысяч при оценке в $1 млн. Проект Агромонитор, который собирает информацию с датчиков, вкопанных в землю в полях, уже активно продает свой сервис, причем не только в Украине, но и за рубеж.

Navizor - проект, который анализирует информацию о качестве дорожного покрытия. Формирует маршрут без ям и позволяет экономить бензин - что важно не только частным водителям, но и логистическим компаниям.

Ребята выиграли продолжение инкубации в Торонто и едут сейчас в Канаду. У нас еще ряд переговоров и это не только интерес со стороны инвесторов, но и интерес со стороны доноров, которые хотели бы поддержать некоммерческие стартапы на основе открытых данных.

данные

- Как вы оцениваете, когда будут открыты данные всех министерств?

- Это длительный процесс. Скажем, Великобритания идет к открытию данных с 2006-го года. У них появился первый в мире портал отрытых данных. И то они открыли еще не все.

Рынок формирует спрос на те наборы данных, которые важны для создания новых сервисов. На основе этого спроса государство открывает все большие массивы в правильных форматах. Но это движение навстречу.

На мой взгляд, у нас самая главная проблема решена. Механизмы влияния на государство реализованы. Есть закон про открытые данные, есть портал открытых данных - надо только давить, требовать и говорить, какие данные нужны.

Государство само не понимает, какие данные надо открыть. И потому они будут открывать то, что будет требовать общественность. Разница в законе о доступе к информации и законе об открытых данных в том, что по первому вы обратились за информацией и получили ее в бумажном виде.

Во втором случае - вы запросили информацию для открытия на портале открытых данных. Эти данные станут общедоступными и второй раз их запрашивать уже не нужно. Важно, чтобы возникал все больший пласт активных людей, которые станут инициаторами открытия тех или иных данных.

- Главное знать, где это сказать, чтобы государство услышало.

- Мы, как общественная организация, за грантовые деньги разработали портал Data. gov. ua в прошлом году. Этот портал содержит в себе револьверный механизм, в рамках которого можно сформировать запрос на открытие определенного набора данных в машиночитаемом виде на портале.

Запрос каждый месяц рассматривается экспертным советом межведомственной рабочей группы по открытым данным, в котором есть представители всех министерств.

Отсутствие в базе некоторых массивов данных связано с тем, что чиновники на данном этапе все еще не понимают как это организовать. Часто присутствует коррупционный компонент, когда госпредприятия просто продают информацию и не хотят отходить от отработанной схемы в сторону более прозрачных механизмов.

Кроме того, есть несогласованность между информационными системами различных министерств и ведомств. Автоматическая выгрузка текстовых файлов в автоматическом режиме не может произойти.

Поэтому у чиновников среднего звена опускаются руки, они не знают, что с этим делать. В этом месте все останавливается. Соответственно, реформа государственных IT -систем, обучение чиновников, а также проведение аудита данных в каждом министерстве позволит ускорить процесс.
Коментувати
Сортувати: