Исследователи разрабатывают новую систему с открытым исходным кодом для управления и обмена сложными наборами данных

open source
0
(0)

Данные часто лежат в основе науки — исследователи отслеживают скорости, измеряют свет, исходящий от звезд, анализируют частоту сердечных сокращений и уровень холестерина и сканируют мозг человека на предмет электрических импульсов.

Но часто делиться этими данными с другими учеными — или с рецензируемыми редакторами журналов, или спонсорами — сложно. Программное обеспечение может быть проприетарным и чрезмерно дорогим в приобретении. Чтобы человек мог управлять программным обеспечением и понимать его, могут потребоваться годы обучения. Или компания, которая создала программное обеспечение, могла обанкротиться.

Исследовательская группа разработала систему управления данными с открытым исходным кодом, которая, как надеются ученые, решит все эти проблемы. Исследователи изложили свою систему сегодня в журнале PLOS ONE.

«Мы хотели создать формат файла и модель набора данных, которые бы инкапсулировали большинство наборов данных, над которыми мы работаем, на всех приборах в лаборатории», — сказал Филипп Грандинетти, профессор химии в Университете штата Огайо и старший автор статьи. , «Существует такая давняя проблема, распространенная среди ученых, что вы покупаете многомиллионный инструмент, и компании, которые делают этот инструмент, имеют свой собственный запатентованный формат, и поделиться с кем-либо еще — это кошмар».

Большие наборы данных сложно разделить, отчасти потому, что программное обеспечение часто является проприетарным, но также отчасти потому, что файлы часто бывают настолько большими, что их трудно передать по электронной почте или через облачный сервер. И даже если файлы можно экспортировать как тип файла, которым можно делиться, важные метаданные — то, что объясняет, что на самом деле представляет собой набор данных — часто теряются.

Их система, которую Grandinetti и ее коллеги назвали «Базовая модель научных данных», предназначена для простого совместного использования сложных наборов данных, без массивных файлов, занимающих большую полосу пропускания и места на жестком диске, и без потери метаданных. Рассмотрим набор данных, который включает температуру воздуха, давление воздуха, скорость ветра и солнечный поток — эта система может справиться с этим. Или рассмотрите измерения и цвет света, исходящего от звезды в далекой галактике — эта система может справиться с этим.

«Вам нужен набор данных, который невероятно гибок в своей способности хранить все эти вещи в одном формате без потери информации», — сказал Грандинетти. «Итак, идея в том, что мы создали модель, которая, по нашему мнению, была достаточно гибкой, чтобы сделать это».

Команда Университета штата Огайо в сотрудничестве с профессором Томасом Восегардом из Университета Орхуса в Дании и доктором Домиником Массио из Университета Орлеана во Франции создали программное обеспечение, которое может работать на Mac или ПК. Они загрузили его в Интернет и сделали код открытым исходным кодом (то есть любой может посмотреть его, использовать и загрузить бесплатно). Публикация в PLOS ONE является преднамеренной: журнал также доступен любому, бесплатно.

И, как надеются исследователи, система могла бы быть простым и бесплатным способом объединения нескольких типов данных в одном месте.

«Мы изучаем несколько наборов данных как ученые, и как сам ученый, я хотел бы иметь возможность получать данные из всех этих файлов и объединять их так, чтобы я мог с ними работать», — сказал Дипанш Шривастава, доктор наук. в группе Грандинетти.

«Вместо того, чтобы искать данные и извлекать их из наборов данных, если бы мы могли просто экспортировать их как этот один тип файла — как основной тип файла научных данных — мы могли бы работать в общей системе».

Насколько полезен был этот пост?

Нажмите на звезду, чтобы оценить его!

Средний рейтинг 0 / 5. Подсчет голосов: 0

Пока никаких голосов! Будьте первым, кто оценит этот пост.

Блог Comsecurity приложил все усилия, чтобы обеспечить точность и достоверность информации, представленной на этом сайте. Тем не менее, информация предоставляется «как есть» без каких-либо гарантий. Comsecurity не несет никакой ответственности за точность, содержание, полноту, законность или достоверность информации, содержащейся на этом сайте.

Оставить комментарий

avatar
  Подписаться  
Уведомление о