Vertica Systems

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 22:22, 25 ноября 2017.
Vertica
Industry Корпоративное ПО, СУБД, хранилища данных
Founded 2005
Founder Эндрю Палмер, Майкл Стоунбрейкер
Headquarters Кэмбридж, штат Массачусетс
Key people
  • Колин Магони (старший вице-президент и главный управляющий)
  • Джой Кинг (вице-президент отдела маркетинга и управления разработкой)
Миша Дэвидсон (Misha Davidson (технический директор)
Products Vertica Analytics Platform Enterprise Edition, Vertica SQL на Hadoop, Vertica Analytics Platform Community Edition
Parent Micro Focus
Website www.vertica.com

Vertica Systems - корпорация, разрабатывающая системы управления базами данных. [Источник 1] [Источник 2] Vertica была основана в 2005 году специалистами, работающими с базами данных: Майклом Стоунбрейкером (Michael Stonebraker) и Эндрю Палмер (Andrew Palmer). Ранее в состав руководства компании входили Ральф Бреслоер (Ralph Breslauer) и Кристофер П. Линч (Christopher P. Lynch).

Vertica была куплена компанией Hewlett Packard 22 марта 2011 года.[Источник 3][Источник 4]Эта покупка расширила портфель ПО компании HP Software для корпоративных компаний и группы государственного сектора. [Источник 5]С 1 сентября 2017 объединена с Micro Focus.

Продукты

Колонко-ориентированная платформа Vertica Analytics разрабатывалась для управления большими, быстро растущими объёмами данных и обеспечения как можно более быстрого выполнения запросов при использовании других высокоинтенсивных программ. Утверждается, что данная платформа значительно ускорит выполнение запросов традиционными реляционными базами данных, обеспечит высокую доступность и эксабайтовую масштабируемость потребительских серверов. Vertica независима от инфраструктуры, поддерживает работу на нескольких облачных платформах (AWS, Google, Azure, Hadoop).

Особенности

  • Колонко-ориентированность, позволяющая увеличить скорость работы с последовательным доступом на запись за счёт обыкновенных транзакций записи, модификации и удаления. [Источник 6]
  • Массово-параллельная архитектура распределяет запросы на независимых узлах, линейно масштабируя производительность.
  • Стандартный интерфейс SQL с множеством встроенных возможностей, таких как заполнение (интерполирование) временных рядов, событийно-ориентированные окна и сессии, механизм сопоставления образов, статистические вычисления (регрессионный анализ) и геопространственный анализ.
  • Искусственный интеллект БД включает категоризацию, настройку и прогнозирование для повышения скорости обработки за счёт устранения необходимости сбрасывания и перемещения данных. Vertica предлагает множество алгоритмов баз данных, включая линейную регрессию, логистическую регрессию, K-средства, машины для продуктов Naive Bayes, Random Forest & Support Vector. Vertica 9 также позволяет развертывать модели ML для нескольких кластеров, что является значительным преимуществом для разработчиков программного обеспечения, которые внедряют аналитику Vertica.
  • Сжатие данных, снижающее затраты на хранение и пропускную способность ввода-вывода. Высокое сжатие возможно, потому что столбцы однородного типа данных хранятся вместе и потому, что пакеты обновлений хранятся в главном хранилище.[Источник 7]
  • Архитектура без общего доступа, которая снижает системный конфликт для общих ресурсов и позволяет постепенно снижать производительность перед сбоем оборудования.
  • Простота использования и поддержки благодаря автоматизированному управлению рабочей нагрузкой, репликации данных, восстановлению серверов, оптимизации запросов и хранилищ.
  • Встроенная интеграция с технологиями обработки больших данных с открытым исходным кодом, такие как Apache Kafka и Apache Spark.
  • Поддержка стандартных интерфейсов программирования ODBC, JDBC, ADO.NET и OLEDB.
  • Высокопроизводительная и параллельная передача данных в статистические инструменты, такие как встроенное машинное обучение на основе языка R и способность сохранять модели машинного обучения и использовать их для вычислений в базе данных.

Специализированный подход Vertica направлен на существенное увеличение производительности запросов в хранилищах данных, одновременно уменьшая общую стоимость системы за счет сокращения объёма оборудования. Один из примеров использования, подробно описанный в исследовательском документе, показывает увеличение производительности в сотни раз с помощью Vertica в конкретном приложении из-за использования вертикального подхода СУБД.[Источник 8]

В конце 2011 года версия Vertica Analytics Platform Community Edition была доступна бесплатно с определенными ограничениями, такими как максимум один терабайт необработанных данных, кластер с тремя узлами (серверами) и поддержка на уровне сообществ.

Оптимизация

Платформа Vertica Analytics работает на кластере Linux на основе товарных серверов. Она также доступна на Amazon ec2, Microsoft Azure и облачной платформе Google, гарантируя отсутствие инфраструктуры или блокировки платформы. Продукт интегрируется с Hadoop, чтобы использовать распределенную файловую систему Hadoop через внешние таблицы с помощью ORC и Parquet Readers и может быть установлен на узлах Hadoop совместно расположенным образом, как Vertica for SQL на Hadoop. Эти объединенные возможности позволяют пользователям анализировать свои данные в нужном месте, в том числе в нескольких озёрах данных.

Интеграция

Ряд инструментов BI, инструментов визуализации данных и ETL сертифицированы для работы с платформой Vertica Analytics и интеграции с ней. Vertica также предлагает сертифицированный и безопасный интерфейс с популярной шиной сообщений Kafka, позволяющей получать данные о потоковой передаче данных. Эта возможность в сочетании с высокопроизводительной аналитикой Vertica поддерживает такие технологии, как Internet of Things, Edge Analytics и предотвращение мошенничества в режиме реального времени. На сайте Vertica перечислены многие из них.

Некоторые функции Vertica были первоначально прототипированы в колонко-ориентированной базе данных C-Store, академическом исследовательском open source проекте в MIT и других университетах. Архитектура системы описана в документе VLDB 2012 года.[Источник 9]

Версии и документации

События

В январе 2008 года Sybase подала иск против Vertica о нарушении патентных прав.[Источник 10] В январе 2010 года Vertica прошла предварительное слушание, [Источник 11], а в июне 2010 года Sybase и Vertica разрешили иск, при этом суд отклонил все требования о нарушении.[Источник 12] Под руководством Колина Магони Vertica спонсировала различные технические мероприятия в сфере баз данных. В августе 2013 года компания Vertica провела свою первую конференцию по big data [Источник 13]в Бостоне, США. Это мероприятие было проведено еще в 2014, 2015, 2016 и 2017.

В 2016 году Vertica опубликовала свою первую книгу О'Рейли The Big Data Transformation - Understanding Why Change is Actually Good for Your Business.

Источники

  1. Network World staff: "New database company raises funds, nabs ex-Oracle bigwigs” // linuxworld [2006—2017]. Дата обновления: 25.05.2012. URL: http://www.linuxworld.com/news/2007/021407-vertica-oracle.html (дата обращения: 01.03.2017).
  2. Brodkin, J: "10 enterprise software companies to watch" // Network World [2006—2017]. Дата обновления: 25.05.2012. URL: http://www.networkworld.com/news/2007/041107-enterprise-software-companies-to-watch.html?page=9 (дата обращения: 01.03.2017).
  3. HP News Release: “HP to Acquire Vertica: Customers Can Analyze Massive Amounts of Big Data at Speed and Scale” // HP [2006—2017]. Дата обновления: 25.05.2012. URL: http://www.hp.com/hpinfo/newsroom/press/2011/110214xb.html (дата обращения: 01.03.2017).
  4. HP News Release: HP News Release: “HP Completes Acquisition of Vertica Systems, Inc.” // HP [2006—2017]. Дата обновления: 25.05.2012. URL: http://www8.hp.com/us/en/hp-news/article_detail.html?compURI=tcm:245-907883&pageTitle=HP%20Completes%20Acquisition%20of%20Vertica%20Systems,%20Inc (дата обращения: 01.03.2017).
  5. HP News Release: “HP to Acquire Vertica: Customers Can Analyze Massive Amounts of Big Data at Speed and Scale” // ComputerWorld.com [2006—2017]. Дата обновления: 25.05.2012. URL: http://www.computerworld.com/s/article/9209327/Update_HP_to_buy_Vertica_for_analytics?source=rss_news (дата обращения: 01.03.2017).
  6. Monash, C: "Are row-oriented RDBMS obsolete?" // DBMS2' [2010—2017]. Дата обновления: 25.05.2012. URL: http://www.computerworld.com/s/article/9209327/Update_HP_to_buy_Vertica_for_analytics?source=rss_news (дата обращения: 02.11.2017).
  7. Monash, C: "Mike Stonebraker on database compression – comments” // DBMS2 [2010—2017]. Дата обновления: 25.05.2012. URL: http://www.dbms2.com/2007/03/24/comments-stonebraker-data-compression/ (дата обращения: 02.11.2017).
  8. One Size Fits All? Part 2: Benchmarking Results (sect. 3.1) // MIT [2010—2017]. Дата обновления: 25.05.2012. URL: http://nms.csail.mit.edu/~stavros/pubs/osfa.pdf (дата обращения: 02.11.2017).
  9. The Vertica Analytic Database: C-Store 7 Years Later // VLDB [2010—2017]. Дата обновления: 25.05.2012. URL: http://vldb.org/pvldb/vol5/p1790_andrewlamb_vldb2012.pdf (дата обращения: 02.11.2017).
  10. Sybase, Inc. v. Vertica Systems, Inc. // Justia [2010—2017]. Дата обновления: 25.05.2012. URL: http://dockets.justia.com/docket/court-txedce/case_no-6:2008cv00024/case_id-107871/ (дата обращения: 02.11.2017).
  11. Monash, C: "Vertica slaughters Sybase in patent litigation” // Justia [2010—2017]. Дата обновления: 25.05.2012. URL: http://www.dbms2.com/2010/01/15/vertica-sybase-ipatent-litigation/ (дата обращения: 02.11.2017).
  12. Vertica Press Release, "Vertica Resolves Sybase Patent Lawsuits" // Vertica [2010—2017]. Дата обновления: 25.05.2012. URL: http://www.vertica.com/news/press/vertica-resolves-sybase-patent-lawsuits/ (дата обращения: 02.11.2017).
  13. HP Vertica Big Data Conference 2013 // Vertica [2010—2017]. Дата обновления: 25.05.2012. URL: http://www.vertica.com/hp-vertica-big-data-conference-2013/ (дата обращения: 02.11.2017).