Weaviate — различия между версиями

Материал из Национальной библиотеки им. Н. Э. Баумана
(Ещё глава)
(не показаны 2 промежуточные версии этого же участника)
Строка 1: Строка 1:
'''Weaviate''' - это современная база данных семантических графов, которая реализована на языке программирования [[Go_(язык программирования) | Go]]. Основан на механизме встраивания графов, который называется Contextionary. Поддерживает использование нативных RESTful API, Containerized и Scalable, а в качестве языка запросов используется GraphQL. Weaviate разработан организацией SeMI Technologies.
+
'''Weaviate''' - это современная поисковая система с открытым исходным кодом, которая реализована на языке программирования [[Go_(язык программирования) | Go]]. Основана на механизме встраивания графов со встроенной моделью НЛП, который называется Contextionary. Уникальность Weaviate заключается в том, что она хранит данные в векторном пространстве, а не в традиционной структуре строк-столбцов или графиков, что позволяет искать данные по их значению, а не по ключевым словам. Поддерживает использование нативных RESTful API, Containerized и Scalable, а в качестве языка запросов используется GraphQL. Weaviate разработан организацией SeMI Technologies.
 
{{Infobox software
 
{{Infobox software
 
| name                  = Weaviate
 
| name                  = Weaviate
Строка 14: Строка 14:
  
 
==SeMI Technologies==
 
==SeMI Technologies==
SeMI Technologies основана 26 июня 2019 года, основателями которой являются Боб Ван Луйт, Миша Верхаген и Эттьен Дилокер. Это компания, базирующаяся на поисковых графах с открытым исходным кодом. За первый год своей работы, и благодаря Weaviate, данная организация уже имеет таких партнёров как Google Cloud, METRO и Flexfab. Также эти разработчики предлагают такой продукт, как платформы для разработки искусственного интеллекта, что делает SeMI Technologies перспективной командой. Но эта компания занимается и другой деятельностью, помимо разработки программного обеспечения. Например, блог основателя Боба Ван Луйта содержит в себе статью «Исследования в области технологий, искусства и бизнеса», которая является источником для лекций на конференциях и университетах по всей Европе, США и России.
+
SeMI Technologies основана 26 июня 2019 года в Нидерландах, основателями которой являются Боб Ван Луйт, Миша Верхаген и Эттьен Дилокер. Это компания, базирующаяся на поисковых графах с открытым исходным кодом. За первый год своей работы, и благодаря Weaviate, данная организация уже имеет таких партнёров как Google Cloud, METRO и Flexfab. Также эти разработчики предлагают такой продукт, как платформы для разработки искусственного интеллекта, что делает SeMI Technologies перспективной командой. Но эта компания занимается и другой деятельностью, помимо разработки программного обеспечения. Например, блог основателя Боба Ван Луйта содержит в себе статью «Исследования в области технологий, искусства и бизнеса», которая является источником для лекций на конференциях и университетах по всей Европе, США и России.
  
  
 
  [[ File: Semifounders.png | 500px | center |thumb| {{center| Рисунок 1 – Основатели SeMI Technologies}} ]]
 
  [[ File: Semifounders.png | 500px | center |thumb| {{center| Рисунок 1 – Основатели SeMI Technologies}} ]]
 
==Достоинства Weaviate==
 
==Достоинства Weaviate==
Weaviate это графоориентированная база данных. В базе данных графы отражают представление сущностей, которые в ней хранятся,  и их отношений между собой. При сравнении с классическими реляционными базами данных, графоориентированные базы данных могут представлять сразу несколько точек зрения на одни и те же данные одновременно. Этот тип баз данных  разработан специально учитывая то, что информация в системе подвержена постоянному изменению, поэтому модель базы легко изменить в любой момент времени, в отличие от реляционных баз.
+
Weaviate это графоориентированная база данных. В базе данных графы отражают представление сущностей, которые в ней хранятся,  и их отношений между собой. При сравнении с классическими реляционными базами данных, графоориентированные базы данных могут представлять сразу несколько точек зрения на одни и те же данные одновременно. Этот тип баз данных  разработан специально учитывая то, что информация в системе подвержена постоянному изменению, поэтому модель базы легко изменить в любой момент времени, в отличие от реляционных баз.<br />
Кроме того, такие хранилища позволяют хранить, индексировать  и получать различные данные из разных источников — например, при решении какой-то актуальной задачи по интеграции сервисов, которую можно свести к объединению разрозненных реляционных баз в единую базу и приводит к задаче обработки структурированных данных. Внутри каждой базы данные строго структурированы для работы с реляционной моделью, но каждая база структурирована по-своему, поэтому задача их интеграции в рамках реляционной модели требует того, что придётся реинжинирить всё решениё.
+
Кроме того, такие хранилища позволяют хранить, индексировать  и получать различные данные из разных источников — например, при решении какой-то актуальной задачи по интеграции сервисов, которую можно свести к объединению разрозненных реляционных баз в единую базу и приводит к задаче обработки структурированных данных. Внутри каждой базы данные строго структурированы для работы с реляционной моделью, но каждая база структурирована по-своему, поэтому задача их интеграции в рамках реляционной модели требует того, что придётся реинжинирить всё решениё.<br />
Изменять архитектуру информационной системы, построенной и основанной на графоориентированной модели, намного легче, чем изменять систему, построенную на реляционной модели, и, в основном, даже не требуют реинжиниринга базы. Данная база данных идеально подходит для задач, требующих учета и выявления большого количества взаимосвязей. Для графа достаточно легко принимать новую информацию об узлах, он просто создаёт новые рёбра, чтобы связать поступившие данные с уже существующими. Для сравнения, в реляционной базе добавление новой структуры, которая еще не учтена в схеме, требует создания новой схемы и нового комбинированного набора данных. Способность графовой БД быстро обрабатывать новую информацию делает ее идеальной для проектов, развивающихся по этой схеме.
+
Изменять архитектуру информационной системы, построенной и основанной на графоориентированной модели, намного легче, чем изменять систему, построенную на реляционной модели, и, в основном, даже не требуют реинжиниринга базы. Данная база данных идеально подходит для задач, требующих учета и выявления большого количества взаимосвязей. Для графа достаточно легко принимать новую информацию об узлах, он просто создаёт новые рёбра, чтобы связать поступившие данные с уже существующими. Для сравнения, в реляционной базе добавление новой структуры, которая еще не учтена в схеме, требует создания новой схемы и нового комбинированного набора данных. Способность графовой БД быстро обрабатывать новую информацию делает ее идеальной для проектов, развивающихся по этой схеме.<br />
 +
==Применение графовых СУБД==
 +
Можно выделить несколько направлений, в которых применение графовых СУБД наиболее эффективно:
 +
===Государственный сектор===
 +
Управление процессами, документооборот, аналитика, социологические исследования, и т.д. Клиентами могут быть федеральные и региональные министерства, исследовательские организации, и т.д.
 +
===Жизненный цикл предприятий===
 +
Интеграция и управление жизненным циклом предприятий в системах автоматизации предприятий. Применение графовых технологий дает возможность единообразно хранить и обрабатывать очень разнородную информацию, включая данные систем ERP, EAM, PLM, САПР и т.д. Платформа унификации данных Stardog решает существенную проблему при производстве: от замены бумажных систем до использования специализированных инженерных систем и внедрения инноваций в IoT: данные из любого источника бессмысленны, если они не объединены.
 +
===Маркетинг, реклама, PR===
 +
Сбор и анализ разнородной информации из блогов, соц. сетей и т.д. для выявления источников информации, предпочтений пользователей; программы лояльности; SEO и т. д.
 +
===СМИ===
 +
Единая база событий, фактов, компаний, предприятий, журналистов, изданий, статей, сообщений и т.д.
 +
===Безопасность===
 +
Анализ логов, электронной почты, интернет трафика; финансовый анализ; анализ информации о людях из разных источников, включая данные о работе, собственности, доходах; анализ информации о связях и интересах из социальных сетей.
 +
===Бизнес-аналитика===
 +
С помощью Stardog финансовые учреждения могут создать единую платформу, чтобы получить полное представление о клиентах, транзакциях, счетах, рисках и различных взаимосвязанных рисках в масштабах всей фирмы, чтобы обеспечить широкий спектр вариантов использования - от соответствия нормативным требованиям до выявления мошенничества.
 +
===Управление сетями и дата-центрами===
 +
Управление жизненным циклом вычислительных комплексов, дата-центров, компьютерных и телекоммуникационных сетей и т.д.; моделирование и оптимизация взаимодействия физического, сетевого и других. уровней. Социальные приложения, рекомендационные сервисы и коммерция
 +
===Построение и анализ социальных графов===
 +
Применение графовых подходов позволяет выявлять модели аналогичного поведения, групп влияния, неявных групп, и т.д.
 +
===Образование===
 +
Построение графа взаимосвязей между терминами, понятиями, программами обучения, задачами, тестами, знаниями учащегося и т.д. для построения адаптивных обучающих систем.
 +
===Геосервисы, геоприложения===
 +
Построение взаимосвязей разнородных данных на карте, связанной с людьми, местами и событиями, компаниями, предприятиями и т.д.; решение задач логистики, маршрутизации и т.д.
 +
==Источники==
 +
{{reflist|group=Источник}}
 +
 
 +
==Примечания==
 +
{{reflist}}

Версия 22:17, 27 июня 2020

Weaviate - это современная поисковая система с открытым исходным кодом, которая реализована на языке программирования Go. Основана на механизме встраивания графов со встроенной моделью НЛП, который называется Contextionary. Уникальность Weaviate заключается в том, что она хранит данные в векторном пространстве, а не в традиционной структуре строк-столбцов или графиков, что позволяет искать данные по их значению, а не по ключевым словам. Поддерживает использование нативных RESTful API, Containerized и Scalable, а в качестве языка запросов используется GraphQL. Weaviate разработан организацией SeMI Technologies.

Weaviate
fraimed
Разработчики: SeMI Technologies
Постоянный выпуск: 0.22.10 / 19 июня 2020 г.
Состояние разработки: Активное
Написана на: Go
Операционная система: MacOS X , Linux
Тип ПО: графовая СУБД
Веб-сайт Официальный сайт Weaviate

SeMI Technologies

SeMI Technologies основана 26 июня 2019 года в Нидерландах, основателями которой являются Боб Ван Луйт, Миша Верхаген и Эттьен Дилокер. Это компания, базирующаяся на поисковых графах с открытым исходным кодом. За первый год своей работы, и благодаря Weaviate, данная организация уже имеет таких партнёров как Google Cloud, METRO и Flexfab. Также эти разработчики предлагают такой продукт, как платформы для разработки искусственного интеллекта, что делает SeMI Technologies перспективной командой. Но эта компания занимается и другой деятельностью, помимо разработки программного обеспечения. Например, блог основателя Боба Ван Луйта содержит в себе статью «Исследования в области технологий, искусства и бизнеса», которая является источником для лекций на конференциях и университетах по всей Европе, США и России.


Рисунок 1 – Основатели SeMI Technologies

Достоинства Weaviate

Weaviate это графоориентированная база данных. В базе данных графы отражают представление сущностей, которые в ней хранятся, и их отношений между собой. При сравнении с классическими реляционными базами данных, графоориентированные базы данных могут представлять сразу несколько точек зрения на одни и те же данные одновременно. Этот тип баз данных разработан специально учитывая то, что информация в системе подвержена постоянному изменению, поэтому модель базы легко изменить в любой момент времени, в отличие от реляционных баз.
Кроме того, такие хранилища позволяют хранить, индексировать и получать различные данные из разных источников — например, при решении какой-то актуальной задачи по интеграции сервисов, которую можно свести к объединению разрозненных реляционных баз в единую базу и приводит к задаче обработки структурированных данных. Внутри каждой базы данные строго структурированы для работы с реляционной моделью, но каждая база структурирована по-своему, поэтому задача их интеграции в рамках реляционной модели требует того, что придётся реинжинирить всё решениё.
Изменять архитектуру информационной системы, построенной и основанной на графоориентированной модели, намного легче, чем изменять систему, построенную на реляционной модели, и, в основном, даже не требуют реинжиниринга базы. Данная база данных идеально подходит для задач, требующих учета и выявления большого количества взаимосвязей. Для графа достаточно легко принимать новую информацию об узлах, он просто создаёт новые рёбра, чтобы связать поступившие данные с уже существующими. Для сравнения, в реляционной базе добавление новой структуры, которая еще не учтена в схеме, требует создания новой схемы и нового комбинированного набора данных. Способность графовой БД быстро обрабатывать новую информацию делает ее идеальной для проектов, развивающихся по этой схеме.

Применение графовых СУБД

Можно выделить несколько направлений, в которых применение графовых СУБД наиболее эффективно:

Государственный сектор

Управление процессами, документооборот, аналитика, социологические исследования, и т.д. Клиентами могут быть федеральные и региональные министерства, исследовательские организации, и т.д.

Жизненный цикл предприятий

Интеграция и управление жизненным циклом предприятий в системах автоматизации предприятий. Применение графовых технологий дает возможность единообразно хранить и обрабатывать очень разнородную информацию, включая данные систем ERP, EAM, PLM, САПР и т.д. Платформа унификации данных Stardog решает существенную проблему при производстве: от замены бумажных систем до использования специализированных инженерных систем и внедрения инноваций в IoT: данные из любого источника бессмысленны, если они не объединены.

Маркетинг, реклама, PR

Сбор и анализ разнородной информации из блогов, соц. сетей и т.д. для выявления источников информации, предпочтений пользователей; программы лояльности; SEO и т. д.

СМИ

Единая база событий, фактов, компаний, предприятий, журналистов, изданий, статей, сообщений и т.д.

Безопасность

Анализ логов, электронной почты, интернет трафика; финансовый анализ; анализ информации о людях из разных источников, включая данные о работе, собственности, доходах; анализ информации о связях и интересах из социальных сетей.

Бизнес-аналитика

С помощью Stardog финансовые учреждения могут создать единую платформу, чтобы получить полное представление о клиентах, транзакциях, счетах, рисках и различных взаимосвязанных рисках в масштабах всей фирмы, чтобы обеспечить широкий спектр вариантов использования - от соответствия нормативным требованиям до выявления мошенничества.

Управление сетями и дата-центрами

Управление жизненным циклом вычислительных комплексов, дата-центров, компьютерных и телекоммуникационных сетей и т.д.; моделирование и оптимизация взаимодействия физического, сетевого и других. уровней. Социальные приложения, рекомендационные сервисы и коммерция

Построение и анализ социальных графов

Применение графовых подходов позволяет выявлять модели аналогичного поведения, групп влияния, неявных групп, и т.д.

Образование

Построение графа взаимосвязей между терминами, понятиями, программами обучения, задачами, тестами, знаниями учащегося и т.д. для построения адаптивных обучающих систем.

Геосервисы, геоприложения

Построение взаимосвязей разнородных данных на карте, связанной с людьми, местами и событиями, компаниями, предприятиями и т.д.; решение задач логистики, маршрутизации и т.д.

Источники

Примечания