Teradata Aster Analytics

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 16:31, 1 марта 2019.
Teradata Aster Analytics
3187 572307 AsterLogo rgb colorRESIZED.jpg
Разработчики: www.teradata.ru
Постоянный выпуск: 6.20.02.00-03 / October 2017; 2 years ago (2017-10)
Состояние разработки: Активное
Операционная система: Linux, UNIX
Локализация: Английский язык
Тип ПО: СУБД
Лицензия: Коммерческая
Веб-сайт www.teradata.ru/Products/All-Products

Teradata Aster Analytics - это инструмент, который в рамках одного интерфейса и синтаксиса позволяет работать с текстом, графикой, машинным обучением, паттернами и статистикой. Бизнес-аналитики и специалисты по анализу данных могут провести комплексный анализ данных со всего предприятия путем выполнения одного запроса. У Teradata Aster Analytics есть более 100 интегрированных передовых аналитических запросов.

Данный инструмент позволяет объединить Graph, R и MapReduce в пределах одного фреймворка. Со всеми функциями, которые выполняются как команды SQL, и со всеми аналитическими движками, встроенными в инструмент, Aster Analytics обеспечивает высокую производительность при обработке больших массивов данных.

Обзор

Особенности

Teradata Aster Analytics предоставляет бизнес-пользователям набор инструментов и модулей, которые позволяют им эффективно работать с данными, используя расширенные функции анализа данных. Инструменты предназначены для ряда сценариев бизнес-аналитики, включая работу с клиентами, продажи, анализ мошенничества, оптимизацию производства продукта.

Продукт включает в себя модули, которые охватывают весь жизненный цикл аналитики данных, от сбора данных до подготовки, моделирования и визуализации. Эти инструменты и технологии позволяют пользователям работать с данными, используя различные хранилища данных и аналитические технологии. К ним относятся SQL, MapReduce, Hadoop, R, Spark, Graph и другие хранилища данных для типов данных, которые включают структурированные, полуструктурированные и неструктурированные данные. Объединение нескольких технологий в одну платформу обеспечивает слои аналитики, что позволяет находить данные, которые было бы труднее найти с помощью отдельных или разрозненных инструментов.

Компоненты пакета Teradata Aster Analytics

В основе Aster Analytics лежит база данных Aster, которая предоставляет основное хранилище данных о продуктах, которое включает поддержку файловой системы Hadoop и Aster Execution Engine, обеспечивая масштабируемую архитектуру хранения и выполнения масштабируемой параллельной обработки Teradata.

Основной слой также включает в себя несколько компонентов; например, Aster SNAP Framework, который позволяет легко интегрировать различные аналитические механизмы и механизмы хранения с основной платформой. SNAP также включает оптимизатор запросов для обработки различных типов рабочих нагрузок, включая Graph, R, MapReduce и SQL.

Платформа Aster SQL-MapReduce позволяет пользователям выполнять высокопроизводительную аналитику MapReduce, используя стандартный SQL или R для базы данных Aster.

Aster R сочетает мощь SNAP Framework Aster с возможностями движка R с открытым исходным кодом. Такой подход позволяет программистам R использовать преимущества встроенных функций, предоставляемых продуктом Aster's Portfolio, в дополнение к возможностям библиотек R. Программисты, использующие R в инфраструктуре Aster, могут достичь огромной масштабируемости, используя базу данных Aster и архитектуру массовой параллельной обработки.

Aster SQL-GR - это механизм обработки графиков для анализа графиков больших наборов данных в базе данных Aster. Обнаружение графа позволяет пользователям анализировать сложные сетевые структуры Графа.

Aster Analytics Portfolio - это набор модулей, которые работают над основным уровнем Analytics 7. В портфель входят следующие модули:

  • Модуль Data Acquisition поддерживает доступ к данным из различных источников, включая хранилище данных Teradata, Apache Hadoop, а также другие структурированные и неструктурированные источники данных.
  • Модуль подготовки данных позволяет пользователям преобразовывать данные из различных типов данных и источников в форматы, которые легче использовать для целей анализа.
  • Модуль Analytics предоставляет пользователям набор предварительно настроенных аналитических функций для использования в операциях, включая PageRank, Confusion Matrix и Single Decision Tree.
  • Модуль визуализации включает в себя несколько возможностей, которые используют функции Visual SQL-MapReduce. Они могут работать с использованием параллельной обработки огромных объемов данных, что позволяет пользователям быстрее находить из них информацию.

С выпуском 7.0 Aster также предоставляет ряд других функций, в том числе:

  • Расширение для интеграции с KNIME, позволяющее пользователям использовать редактор рабочих процессов KNIME и включать функции Astor Analytics в эти рабочие процессы. Это позволяет как опытным, так и неопытным пользователям более легко и быстро разрабатывать аналитические модели, используя объединенные функции обоих продуктов.
  • Дополнительные расширения, включающие возможность подключения рабочих процессов Aster к Spark.
  • Дополнительные аналитические функции для Интернета вещей и ряд функций проверки моделей.
  • Teradata также предлагает Teradata IntelliCloud, управляемый облачный сервис, который предоставляет пользователям гибкость и гибкость облачных вычислений для анализа больших данных, одновременно используя массивный параллельный механизм аналитики Aster.
  • Teradata также предлагает Aster Express (на основе Aster 6.1), виртуальное устройство, которое работает в VMware Workstation Player на ПК. Aster Express - это полнофункциональный кластер, который можно использовать для оценки, тестирования или разработки.

Teradata Aster Analytics Hadoop

20 октября 2015 года компания Teradata объявила о выпуске ПО Aster Analytics on Hadoop[1].

В составе программного продукта набор из более 100 совершенно разных, готовых к использованию технологий анализа данных и семь вертикальных отраслевых приложений, запускаемых непосредственно на платформе Hadoop. Это помогает организациям решать коммерческие задачи с помощью одного комплексного решения для анализа данных.

8 сентября 2016 года корпорация Teradata представила модернизированный вариант разворачивания системы многофункционального анализа данных Teradata Aster Analytics on Hadoop.

Для работы предыдущих версий Aster Analytics требовались выделенные системы. Теперь компании могут использовать гибкие возможности для ускоренного извлечения ценной аналитической информации из имеющихся данных, независимо от их источника.

Обычно программные комплексы с открытым исходным кодом для углубленного анализа данных разрабатываются без учета потребностей бизнес-аналитиков - для их использования, разворачивания и сопровождения необходима специальная подготовка. Несмотря на то, что средства углубленного анализа адаптированы для работы с Hadoop, они изначально не предназначались для непосредственного использования на этой платформе, в связи с чем для их работы, как правило, необходима выделенная платформа извлечения данных. Подобные решения ограничены в возможностях масштабирования по количеству пользователей, объемам данных и вариантам использования.

В составе Teradata Aster Analytics инструменты анализа текстовых, траекторных, графических и статистических данных, средства машинного обучения, объединенные в едином интерфейсе и использующие общий синтаксис. Функции предоставляют гибкие возможности Aster Analytics on Hadoop:

  • Позволяет расширить сферу применения и эффективность использования озера данных Hadoop. Aster Analytics открывает доступ к Hadoop для рядовых бизнес-аналитиков, имеющих навыки работы с SQL и R. Продукт Aster позволяет расширить круг пользователей, выполняющих анализ данных.
  • Работает непосредственно на платформе Hadoop, вместо того чтобы выгружать данные из Hadoop на аналитический сервер. Пользователи могут повысить скорость процесса обработки, сокращая при этом издержки, уменьшая простои и риски, связанные с обеспечением безопасного перемещения данных.
  • Оперативное использование аналитических инструментов на платформе Hadoop: пользователи могут запускать обработку данных в выделенной и рабочей среде на том же кластере Hadoop и для тех же данных. Кроме того, в Aster имеется центр приложений для содействия аналитикам в создании веб-интерфейсов для корпоративных пользователей.[Источник 1]

Teradata Aster Analytics AWS

Внедрение технологий Teradata Aster Analytics on Amazon Web Services[2], по мнению компании-разработчика, это:

  • Ускорение окупаемости инвестиций: компании могут быстро создать выделенную среду для анализа данных в облаке и воспользоваться встроенными в Aster средствами анализа на основе SQL, чтобы ускорить процесс разработки. Если модель оказывается эффективной, достаточно лишь «запустить в производство» аналитические данные, что и в облаке.
  • Расширенные возможности анализа данных дают аналитику набор средств многофункционального анализа требуемого уровня для экспериментов и итерации больших объемов данных без ограничений по времени.
  • Финансовая выгода – компании могут экспериментировать со встроенными функциями углубленного анализа и соответствующими информационными активами без необходимости расходования средств на приобретение, настройку и внедрение оборудования.

AWS позволяет запускать самоуправляемую систему MPP экземпляра Aster непосредственно в общедоступном облаке AWS. Являясь автономной средой, Teradata Aster Analytics в AWS поставляется в виде IaaS и предлагает множество мегабайтных экземпляров Amazon EC2 в AWS Marketplace для набора продуктов Aster Analytics в AWS. AWS Marketplace - это интернет-магазин, который поможет вам найти, купить и сразу же начать использовать программное обеспечение и услуги.

Amazon EC2 - это виртуальная вычислительная среда, позволяющая использовать интерфейсы веб-служб для запуска Teradata Aster Analytics в экземплярах AWS с операционной системой Linux SLES 11 SP3, загрузки их в пользовательскую среду приложений и управления разрешениями на доступ к сети.

Запуск Teradata Aster Analytics в AWS аналогичен запуску кластера Aster в локальном центре обработки данных. Для администратора базы данных нет никаких различий между этими двумя средами. Однако есть ряд соображений AWS, касающихся настройки программного обеспечения, переноса данных, безопасности и резервного копирования данных, связанных с управлением системой, которые объясняются в этом руководстве.

AMI - это шаблон, который вы используете для запуска виртуального сервера в публичном облаке AWS, называемого экземпляром. Экземпляр запускается из AMI, и вы можете запустить столько экземпляров из AMI, сколько вам нужно. Teradata Aster предоставляет предварительно сконфигурированные AMI для Teradata Aster Analytics в AWS на AWS Marketplace, чтобы вы могли сразу приступить к работе.[Источник 2]

Примечания

Источники

  1. Описание Teradata Aster Analytics // Официальный сайт Tadviser. [2005-2019]. URL: http://www.tadviser.ru/index.php/Продукт:Teradata_Aster_Analytics_on_Hadoop (дата обращения: 21.02.2019).
  2. Документация Amazon Web Service // Официальный сайт Teradata Aster Analytics. [2019]. URL: https://docs.teradata.com/reader/rkQwquCho1rksErenxAhpw/NrRmbB1b9vth7qroVS6q7Q (дата обращения: 21.02.2019).