SAP HANA

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 23:01, 10 сентября 2018.
SAP HANA
SAP-HANA-Logo.png
fraimed
Создатели: SAP
Разработчики: SAP ES
Выпущена: 2010.11.1; 9 years ago (2010.11.1)
Состояние разработки: Active
Написана на: C и С++
Операционная система: Windows Lunix
Локализация: Языков доступно: 32
Тип ПО: СУБД
Лицензия: Proprietary software
Веб-сайт SAP HANA

SAP HANA (англ. High-Performance Analytic Appliance) - это программный комплекс управления реляционной базой данных, ориентированная на хранение данных, с применением технология вычислений in-memory и использованием принципа поколоночного хранения данных, платформы, разработанной компанией SAP SE. Система выполняет расширенную аналитику (интеллектуальная аналитика, обработка пространственных данных, текстовая аналитика, текстовый поиск, потоковая аналитика , обработка графических данных ) и включает в себя возможности ETL-системы. Имеет возможность интеграции как ряда приложений содержащихся в сервере приложений, так и сторонних приложений.

История

Первое демонстрация SAP HANA была в 2008 году, когда команда SAP ES, работавшая c Hasso Plattner Institute и Stanford University показали архитектуру приложений для анализа и агрегации в режиме реального времени. Бывший руководитель SAP SE, Vishal Sikka, упомянул эту архитектуру как «Новая архитектура Хассо»,а систему «новой базой данных» в блоге технического директора SAP. Затем входе жизни проекта, программное обеспечение получило название «SAP High-Performance Analytic Appliance»(SAP HANA).

Основным плюсом системы было то, что служебный аналитический продукт имел отклик в режиме реального времени. Первый продукт был отправлен в конце ноября 2010 года. К середине 2011 года эта технология привлекла к себе внимание рынка, консервативно настроенные бизнес-заказчики продолжали считать, что технология еще «не созрела».Поддержка HANA для SAP NetWeaver Business Warehouse была объявлена ​​в сентябре того же года для ее доступности уже к ноябрю.

В 2012 году SAP продвинул аспекты облачных вычислений. В октябре SAP объявила о платформе как услуге, называемой облачной платформой SAP HANA, а так же SAP HANA One, единственным отличием которого, было использование меньший объем памяти.

В мае 2013 года было объявлено о выпуске управляемого облачного облака под названием HANA Enterprise Cloud и Business Suite на HANA, позволяющий клиентам выполнять функции планирования SAP Enterprise Resource на платформе HANA.

В 2015 году SE SAP выпускает S / 4HANA, написанный специально для платформы HANA, который объединяет функции для ERP , CRM , SRM и других в единую систему HANA. S / 4HANA предназначен для упрощенного бизнес-пакета, заменяющего ERP- системы предыдущего поколения.Хотя вполне вероятно, что SAP сосредоточит свои инновации на S / 4HANA, некоторые клиенты, использующие системы, отличные от HANA, подняли опасения о блокировке продуктов SAP. Поскольку S / 4HANA требует запуска системы SAP HANA, клиенты, работающие с приложениями SAP Business Suite на оборудовании, не сертифицированном SAP, должны будут перенести в базу данных HANA, сертифицированную SAP, если они выберут функции, предлагаемые S / 4HANA . [Источник 1].

Инновации в HANA

Компания SAP реализовала в своем ядре вычислений in-memory ряд технических прорывов, обеспечив, например, оптимальную загрузку процессора и возможность параллельной обработки данных на нескольких узлах. В процессе совместной работы с клиентами на экспериментальном этапе проекта SAP HANA удалось продемонстрировать ряд глобальных инноваций в трех ключевых областях:

Скорость: Модуль вычислений в оперативной памяти от SAP позволяет каждому ядру процессора сканировать 2 миллиона записей в миллисекунду и производить «на лету» более 10 миллионов операций по агрегированию данных в секунду. Эти результаты достигнуты с использованием реальных данных клиентов, работающих на стандартных процессорах Intel. Например, компания SAP внедрила реальное решение на основе SAP HANA для клиента, занимающегося продажей потребительских товаров, которое продемонстрировало возможность обработки максимально сложных запросов с участием более 450 миллиардов записей за считанные секунды.

Масштабируемость: Программное ядро SAP HANA разработано на основе многоядерной архитектуры, в нем реализованы адаптивные алгоритмы, позволяющие оптимально использовать кэш. В результате производительность линейно растет при увеличении количества задействованных ядер, процессоров и серверов. Выводы очевидны – это технология будущего. Она на долгое время обеспечит наилучшее соотношение «цена/производительность», поскольку количество ядер, используемых в серверах, продолжает увеличиваться в геометрической прогрессии.

Сжатие: Ядро SAP для вычислений в памяти использует передовые алгоритмы сжатия и структуры данных, позволяющие минимизировать объем памяти, необходимый для нормальной работы системы.

Также SAP HANA полностью адаптирована к прогрессу в технологиях аппаратных средств хранения, как локальных, так и облачных. Многоядерные процессоры и 64-битные системы создают качественно новые возможности в отношении масштабируемости. Например, блейд-сервер с 4 платами, каждая из которых содержит четыре 8-ядерных процессора, предоставляет 128 ядер для программной обработки. Новая технология предоставляет систему с несколькими разъемами, содержащую восемь 10-ядерных процессоров в 1 сервере, что соответствует 1 терабайту памяти. [Источник 2].

Архитектура

Архитектура SAP HANA


Основной особенностью HANA является то, что она является колонки-ориентированной , в оперативной памяти базы данных , который сочетает в себе OLAP и OLTP операций в единую систему, что дает возможность чтения информации на более высокой скорости, а так же эффективно применять механизмы компрессии данных . Таким образом, SAP HANA работает непосредственно со сжатыми данными, не тратя ресурсы на процесс разархивирования. Системы, ориентированные на столбцы, хранят все данные для одного столбца в одном месте, а не сохраняют все данные для одной строки в одном месте (ориентированные на строки системы). Это обеспечивает повышение производительности для запросов OLAP на больших наборах данных и позволяет увеличить вертикальное сжатие подобных типов данных в одном столбце, устраняя необходимость сохранения совокупных представлений и связанной с ними избыточности данных . [Источник 3].


Диспетчер авторизации обеспечивает работу служб аутентификации и авторизации. Диспетчер авторизации обеспечивает защиту с использованием протоколов аутентификации SAML, OAuth или Kerberos

Подсистема Extended Services (XS) представляет собой веб-сервер с привилегированным доступом к базе данных. Для развертывания приложений в XS могут использоваться Java Servlets или приложения JavaScript на стороне сервера. Такими приложениями могут быть веб-приложения HTML или конечные точки веб-службы REST. В состав JavaScript стороны сервера входят расширения на основе jQuery для доступа к БД и для доступа к запросным и ответным сообщениям HTTP. Движок JavaScript реализован на основе проекта Mozilla SpiderMonkey.[Источник 4].

Принцип хранения in-memory

Клиентские приложения получают доступ к базе данных HANA непосредственно с использованием JDBC, либо через подсистему Extended Services с использованием HTTP.


Механизм Delta Storage, позволяет моментально вносить поступающую информацию в систему и учитывать ее в запросах и расчетах, при этом перенос поступившей информации происходит позже в фоновом режиме. Такой подход позволяет применить технологию хранения данных в оперативной памяти SAP HANA не только для аналитических, но и для транзакционных систем. В следствии чего, производительность растет, а объемы хранимой в системе информации снижается. [Источник 5]. На практике, при введении данной технологии, коэффициент сжатия достигал 15–20 раз. Ярким примером эффективности технологии стал проект, проведенный в крупном телеком-операторе стран СНГ, в рамках которого была достигнута компрессия базы данных с операциями клиентов в 30 раз, что позволило сильно сократить стоимость всего проекта. [Источник 6].

Так же SAP HANA управляет параллелизмом с помощью Multiversion concurrency control (MVCC or MCC), который дает каждой транзакции моментальный снимок базы данных в определенный момент времени. Когда база данных MVCC должна обновлять элемент данных, она не перезаписывает старые данные новыми, а вместо этого ставит старые данные как устаревшие и добавляет новую версию. [Источник 7].

Bring your own language

Принцип Bring your own language

Платформа SAP HANA предлагает также использовать разные опции при выборе языка программирования для создания приложений в рамках новой концепции Bring your own language. Встроенный сервер приложений SAP HANA XS advanced позволяет создавать независимые контейнеры приложений на базе языков JavaScript (движок Google V8 и Node.JS), Java (Tomcat Java), Python, Ruby, C++. При реализации видео алгоритмов в SAP HANA возможно также использовать популярные пакеты Caffe, Theano, Torch, Tensorflow и переносить уже разработанные приложения без изменений в контейнеры на базе HANA XS Advanced или среду Hadoop Spark. [Источник 8]. Примеры: «Цифровая парковка» для автомобилей Одна из важных задач при управлении городским движением – это отслеживание доступных парковочных мест для контроля загрузки городских парковок. Специализированные датчики, которые устанавливаются на парковках, могут отслеживать количество свободных и занятых мест. Cистема контроля на базе SAP HANA Smart Data Streaming позволяет в реальном времени отслеживать состояние датчиков и управлять картой парковочных мест.

Цифровая система контроля качества доставки товаров Управление и отслеживание процессом доставки товара является важной задачей для крупных городских сетей доставки. В больших городах, в условиях ограниченного времени доставки и большого количества заказов необходимо своевременно реагировать на изменения в заказах и планировать доставку товаров с учётом меняющихся требований со стороны клиентов. Интеграция системы SAP HANA Smart Data Streaming помогает обработать несколько миллионов заявок на доставку товаров в минуту и в дальнейшем с помощью специализированных инструментов своевременно корректировать планы по доставке товаров в режиме реального времени.


Big Data

В масштабируемой среде HANA может поддерживать объемы до петабайта данных в памяти, возвращая результаты запроса менее чем за секунду, чтобы сбалансировать компромисс между стоимостью больших систем в памяти (в частности, стоимостью ОЗУ по сравнению с твердотельными или жесткими дисками на жестких дисках), HANA обладает возможностями для управления уровнем данных, обеспеченных данных на дисковое хранилище. [Источник 9].

SAP предлагает отдельный, но связанный с ним продукт, называемый Vora, для тесной интеграции больших данных, хранящихся в Hadoop, с корпоративными данными в HANA. Вора использует некоторые из тех же концепций из HANA, а именно: хранение в памяти, опрокидывание запросов и массивные распараллеливания.

Управление жизненным циклом данных HANA - это функция администрирования данных, которая позволяет администраторам баз данных определять правила, когда записи в таблице должны быть выгружены из памяти в хранилище столбцов на основе диска на том же сервере HANA, то есть хранилище «теплых данных», или выгружать данные из памяти или диска на отдельный сервер Hadoop. [Источник 10].

Лицензии

Лицензирование SAP HANA в основном разделено на две категории: Runtime License, Full Use License.

Runtime License: Используется для запуска приложений SAP, таких как SAP Business Warehouse, на базе SAP HANA и SAP S / 4HANA .

Full Use License: Используется для запуска приложений SAP и других приложений. Это лицензирование можно использовать для создания пользовательских приложений. В рамках лицензии на полное использование функции группируются в виде изданий, предназначенных для различных вариантов использования. Base Edition -предоставляет основные функции базы данных и средства разработки, но не поддерживает приложения SAP. Платформа Edition - базовая версия плюс пространственная, интеллектуальная, R-серверная интеграция, поиск, текст, аналитика, графические движки и дополнительные упакованные бизнес-библиотеки. Enterprise Edition - выпуск платформы и дополнительные компоненты для некоторых функций загрузки данных и рамки правил. На данном рисунку изображен принцип работы системы:

Принцип работы платформы

Применение

Поскольку SAP HANA позиционируется, в частности, в качестве производительной СУБД для приложений любого класса, следует выделить следующие целевые отрасли:

  • нефтегазовый комплекс;
  • металлургия;
  • машиностроение;
  • транспорт;
  • энергетика;
  • телекоммуникации;
  • финансовая отрасль (банки и страховые организации);
  • розничная торговля;
  • госсектор

Бизнес-процессы предприятия, производительность которых может быть существенно повышена с помощью SAP HANA:

  • закрытие финансового периода;
  • анализ финансовых показателей в режиме реального времени;
  • эффективное управление дебиторской задолженностью;
  • эффективное управление кредиторской задолженностью;
  • централизованное управление казначейскими рисками;
  • анализ доступа на основе ролей;
  • автоматизированный контроль межсистемных процессов;
  • оптимизированное управление коммерческими предложениями;
  • управление запасами в режиме реального времени;
  • эффективное снабжение;
  • оптимизация стратегических закупок;
  • максимизация использования оборудования и времени непрерывной работы;
  • ускоренная публикация организационных изменений;
  • продуманное управление затратами на кадровые ресурсы;
  • планирование материалов в реальном времени;
  • контроль перемещения материалов;
  • комплексное управление проектами;
  • повышение производительности и доходности сложных проектов. [Источник 11].

Развертывание

HANA может быть развернута на месте или в облаке от ряда поставщиков облачных сервисов. Система предназначена для поддержки как горизонтальное и вертикальное масштабирование. На месте можно развернут как новое устройство от сертифицированного поставщика оборудования. В качестве альтернативы существующие компоненты оборудования, такие как хранилище и сеть, могут использоваться как часть реализации, подход, который SAP называет «Интегрированная интеграция центров обработки данных (TDI)». Поддерживаемые аппаратные платформы для локального развертывания включают Intel 64 и POWER Systems . Видео с описанием принципа работы системы и установкой SAP HANA. Собственный облачный сервис SAP HANA Enterprise Cloud SAP Cloud Platform Сторонние облачные сервисы, предлагающие SAP HANA. Amazon Web Services Microsoft Azure Google Cloud Platform IBM Softlayer Huawei FusionSphere HP Helion

Пример установки

Видео с канала myErp-school


Источники

  1. SAP's S4/HANA master plan: The lingering questions / ZDnet. [2010—2017]. Дата обновления: 6 февраля 2015. URL: http://www.zdnet.com/article/saps-s4hana-master-plan-the-lingering-questions/ (дата обращения: 29.10.2017).
  2. SAP HANA / Tadviser. [2010—2017]. Дата обновления: 13 август 2017. URL: http://www.tadviser.ru/index.php/%D0%9F%D1%80%D0%BE%D0%B4%D1%83%D0%BA%D1%82:SAP_HANA_(High_Performance_Analytic_Appliance)#SAP_HANA_2 (дата обращения: 29.10.2017).
  3. Row and Column; David Dobri / SAP HANA BLOG. [2017]. Дата обновления: 12 июня 2012. URL: https://blogs.saphana.com/2012/06/05/row-itandit-column/ (дата обращения: 28.10.2017).
  4. SAP HANA Suspport/ SAP. [2012—2017]. Дата обновления: 3 декабря 2012. URL: https://blogs.saphana.com/2012/12/ (дата обращения: 29.10.2017).
  5. What is the scale-up Or scale-out HANA configuration ? / Hanatutorials. [2017]. Дата обновления: 16 февраля 2016. URL: http://www.hanatutorials.com/p/scale-up-or-scale-out-hana-configuration.htm (дата обращения: 28.10.2017).
  6. SAP HANA что такое полноценная in memory / Cnews. [2012—2017]. Дата обновления: 6 февраля 2017. URL: http://www.cnews.ru/articles/sap_hana_chto_takoe_polnocennaya_inmemory (дата обращения: 29.10.2017).
  7. SAP help Hana Platform / SAP. [2012-2017]. Дата обновления: 14 сентября 2014. URL: http://help.sap.com/saphelp_hanaplatform/helpdata/en/94/fc07fbeff1474aa878737f2c9921d3/content.htm?frameset=/en/63/d055985b2a4d19bc860c98ac5a02cb/frameset.htm&current_toc=/en/85/d132c3f05e40a2b20c25aa5fd6331b/plain.htm&node_id=68&show_children=false (дата обращения: 28.10.2017).
  8. Как платформа SAP HANA работает с большими данными / Habrahabr. [2006—2017]. Дата обновления: 6 февраля 2017. URL: https://habrahabr.ru/company/sap/blog/321156/ (дата обращения: 28.10.2017).
  9. Seamless Big Data tiering with HANA / SAP. [2006—2017]. Дата обновления: 6 февраля 2017. URL: https://blogs.sap.com/2016/02/12/seamless-big-data-tiering-with-hana-hadoop-and-vora-with-a-little-help-from-dlm/ (дата обращения: 28.10.2017).
  10. The SAP HANA Vora FAQ / John Appleby. [2006—2017]. Дата обновления: 6 февраля 2017. URL: http://www.bluefinsolutions.com/insights/john-appleby/september-2015/the-sap-hana-vora-faq (дата обращения: 28.10.2017).
  11. Все, что вы когда-либо хотели узнать о SAP HANA / PCWEEK. [2017—2017]. Дата обновления: 15 августа 2012. URL: https://www.itweek.ru/its/sap-cloud/4.php (дата обращения: 28.09.2017).