GraphDB

Материал из Национальной библиотеки им. Н. Э. Баумана
Версия от 13:27, 24 июня 2020; a.dronova (обсуждение | вклад) (Начальные заполнения)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

GraphDB - это семейство высокоэффективных, надежных и масштабируемых баз данных RDF. Он упрощает загрузку и использование связанных облачных наборов данных, а также ваших собственных ресурсов. Для удобства использования и совместимости с отраслевыми стандартами GraphDB реализует интерфейсы фреймворка RDF4J, спецификацию протокола W3C SPARQL и поддерживает все форматы сериализации RDF. Эта база данных является предпочтительным выбором как небольших независимых разработчиков, так и крупных корпоративных организаций из-за ее поддержки ее коммерческими и некоммерческими предприятиями и программистами, а также превосходных корпоративных функций, таких как поддержка кластеров и интеграция с внешними высокопроизводительными поисковыми приложениями - Lucene, Solr и Elasticsearch.

Базовые понятия GraphDB

RDF

Фреймворк описания ресурсов (RDF) - это графическая модель данных, которая

  • формально описывает семантику, или значение информации
  • представляет метаданные, т. е. данные о данных

Модель данных RDF состоит из троек

  • каждая из которых представляет вершину в графе RDF
  • где структура каждой тройки - субъект, предикат, объект

Примеры использования RDF

На рисунке 1 показано возможное использование троек для построения графа. Здесь субъект тройки представим в виде вершины, предикат - обозначение направленного ребра, а объект - вершина другой тройки.

Рисунок 1 – Образец представления данных в RDF

RDFS

Схема RDF (RDFS)

  • Добавляет такие понятия, как ресурс, литерал, класс и тип данных
  • Представляет метаданные, то есть данные о данных. Добавляет отношения, такие как подкласс (subClassOf), подмножество (subPropertyOf), домен и диапазон

RDFS позволяет определять

  • Классы и свойства
  • Иерархии классов и свойств

Также RDFS включает правила для вывода новых утверждений. На рисунке 2 представлено возможное применение RDFS для получения новых троек.

Рисунок 2 – Применение RDFS для получения новых троек


О версиях GraphDB

Ontotext предлагает три версии GraphDB: Free, Standard и Enterprise.

GraphDB Free-commercial, file-based, sameAs & query optimizations, масштабируется до десятков миллиардов операторов RDF на одном сервере с ограничением в два параллельных запроса.

GraphDB Standard Edition (SE) - коммерческая, файловая оптимизация sameAs & query, масштабируемая до десятков миллиардов операторов RDF на одном сервере и неограниченное количество параллельных запросов.

GraphDB Enterprise Edition (EE) - кластер высокой доступности с реализацией рабочей и главной баз данных для обеспечения устойчивости и высокопроизводительного параллельного ответа на запросы.

SPARQL

  • SPARQL* - это SQL-подобный язык запросов для графических данных RDF со следующими типами запросов:
  • SELECT возвращает табличные результаты
  • CONSTRUCT создает новый граф RDF на основе результатов запроса
  • ASK возвращает "да’, если запрос имеет решение, в противном случае" нет’
  • DESCRIBE возвращает графические данные RDF о ресурсе; полезно, когда клиент запроса не знает структуру данных RDF в источнике данных
  • INSERT вставляет тройки в график
  • DELETE удалить удаляет тройки из графика.

Использование SPARQL

Использование SPARQL для создания троек

Чтобы создать график RDF, необходимо:

  • Определите префиксы для URIs с помощью ключевого слова PREFIX
  • Используйте INSERT DATA для обозначения того, что вы хотите вставить выражение. Напишите тройку в виде субъект-предикат-объект.
  • Выполните этот запрос.

Пример запроса и его выполнения представлен на рисунках 3-4.

Рисунок 3 – Применение RDFS для получения новых троек
Рисунок 4 – Применение RDFS для получения новых троек

Использование SPARQL для выбора троек