18+

Артур Скальский

©  РИА-Новости

Интернет и ИТ Мир

3035

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

©  РИА-Новости

Интернет и ИТ Мир

3035

19.07.2013, 13:04

URL: https://m.babr24.com/?ADE=116758

Bytes: 5521 / 5360

Скачать PDF

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
newsbabr@gmail.com

Другие статьи и новости в рубрике "Интернет и ИТ"

Новые абоненты T2 в Иркутской области получат полгода бесплатной связи при переносе номера

Мобильный оператор T2 запустил специальные условия для новых абонентов, которые планируют перейти от других операторов связи.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

896

27.02.2026

Нейросети или кошелёк: в Бурятии чиновников лишат премий за цифровую неграмотность

Правительство Бурятии 9 февраля подписало распоряжение, которое обязывает всех лиц, замещающих государственные должности, и руководителей ...

Автор: Виктор Кулагин.

Источник: Babr24.com.

Интернет и ИТ, Официоз

Бурятия

1949

24.02.2026

В Бурятии заблокировали ряд интернет-ресурсов, где нелегально продавали сим-карты

Прокуратура Прибайкальского района Бурятии обнаружила ряд интернет-ресурсов, где нелегально продавали сим-карты, и приняла меры по их блокировке.

Источник: Babr24.com.

Интернет и ИТ

Бурятия

1993

11.02.2026

Миллионы скачанных гигабайт и больше года «на трубке»: в Т2 выяснили, насколько активно жители малых сел Прибайкалья пользуются связью

Анализ Т2 показал высокую активность абонентов в небольших населенных пунктах Иркутской области, где связь появилась не так давно благодаря программе ...

Автор: Александр Макаров.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

2718

10.02.2026

«Игра Сервис» объяснила массовое отключение интернета у красноярцев

Интернет-провайдер «Игра Сервис» объяснил, почему утром 2 февраля у абонентов случился массовый сбой.

Источник: Babr24.com.

Интернет и ИТ

Красноярск

2859

02.02.2026

Т2 за 2025 год заблокировала свыше 2 миллиардов спам-звонков

В 2025 году технологии мобильного оператора Т2 помогли предотвратить более двух миллиардов нежелательных вызовов.

Автор: Александр Макаров.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

4335

31.01.2026

Т2 и «Солар» представили абонентам сервис мониторинга утечек данных

Мобильный оператор Т2 вместе с компанией «Солар» запустил для своих клиентов новую услугу — автоматический мониторинг утечек персональных данных.

Автор: Ярослава Грин.

Источник: Babr24.com.

Интернет и ИТ

Иркутск

8034

27.01.2026

Банкоматы как основа государства: монгольский опыт, востребованный в США

Монгольская финансовая система редко становится предметом международного интереса.

Автор: Эрнест Баатырев.

Источник: Babr24.com.

Интернет и ИТ, Наука и технологии, Экономика

Монголия

3923

27.01.2026

В Хакасии депутаты предложили маркировать контент от искусственного интеллекта

Депутаты Верховного Совета Хакасии выступили с инициативой ввести обязательную маркировку для продукции, которую создал искусственный интеллект.

Умный контроль в Улан-Баторе: безопасность растет, но вопросы остаются

С начала 2026 года в Улан-Баторе официально заработала автоматическая система фиксации дорожных нарушений на основе искусственного интеллекта.

Автор: Эрнест Баатырев.

Источник: Babr24.com.

Интернет и ИТ, Общество, Транспорт

Монголия

5756

06.01.2026

В Монголии представили платформу на ИИ для повышения прозрачности бюджетных расходов

В министерстве юстиции и внутренних дел Монголии презентовали новую ИИ-платформу Voyager Transparency.

Япония поможет Монголии улучшить киберзащиту

В Монголии стартовали подготовительные исследования для проекта по укреплению потенциала в сфере защиты критически важной информационной ...

Источник: Babr24.com.

Интернет и ИТ

Монголия

5902

23.12.2025