Aster Data Systems

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 13:56, 8 февраля 2019.
Teradata Aster Analytics
Public, Part of Teradata
Industry Advanced Analytics
Founded 2005 in San Carlos, California
Products Teradata Aster Analytics
Parent Teradata
Website www.teradata.com/Teradata-Aster/overview

Aster Data Systems была компанией программного обеспечения для управления данными и анализа, штаб-квартира которой находится в Сан-Карлосе, штат Калифорния. Он был основан в 2005 году и приобретен Teradata Corporation[1]в 2011 году.

История

Aster Data была основана в 2005 году аспирантами Стэнфордского университета Джорджем Кандеей, Майанком Бавой и Тассо Аргиросом. Она получила финансирование от First Round Capital, Sequoia Capital, Institutional Venture Partners, Cambrian Ventures, Jafco Ventures, а также инвесторов из Англии, включая Раджева Мотвани, Рона Конвей и Дэвида Черитона. Он получил первый раунд финансирования в размере 5 млн. Долл. США в 2005 году, затем второй раунд в размере 17 млн. Долл. США в феврале 2009 года и третий раунд в размере 30 млн. Долл. США в сентябре 2010 года.

Aster была упомянута в 2010 году редактором Intelligent Enterprise. Он занял седьмое место в 2011 году венчурных компаний Wall Street Journal. Аргирос (главный технический директор того времени) был отмечен в качестве технологического пионера информационных технологий и новых средств массовой информации Всемирным экономическим форумом в 2011 году.

Teradata Corporation приобрела 11-процентную долю участия в Aster Data Systems в сентябре 2010 года. 3 марта 2011 года Teradata Corporation согласилась заплатить дополнительно 263 миллиона долларов за оставшуюся долю собственности, за вычетом долгов и других расходов. Приобретение завершилось в апреле 2011 года. В сентябре 2011 года была анонсирована версия продукта для компьютера, с предварительно настроенным программным обеспечением, поставляемым с оборудованием. Aster Data провела выставку «Анализ данных» на 2012 год, состоящую из региональных мероприятий.

В октябре 2012 года Aster анонсировала вторую версию своего устройства. В дополнение к программному обеспечению базы данных Aster было доступно еще одно устройство с узлами, использующими дистрибутив Hortonworks Apache Hadoop.

В октябре 2013 года была анонсирована версия 6 программного обеспечения базы данных Aster. Он поддерживает технологию базы данных графов и файловую систему, которая, по словам компании, совместима с распределенной файловой системой Hadoop. После того, как Бава покинул компанию, в 2014 году он был назван молодым успехом Индийским технологическим институтом в Бомбее (из которого он окончил в 1999 году).

В июне 2014 года Teradata Corporation анонсировала продукт с использованием языка программирования R. В феврале 2015 года Teradata Corporation анонсировала «AppCenter» с использованием технологии Aster. В октябре 2015 года Teradata Corporation анонсировала набор аналитических методов и приложений для работы на Apache Hadoop[2], продаваемых для Интернета. В 2016 году Aster Analytics была доступна на Amazon AWS Marketplace для самообслуживания. Он стал доступен на Microsoft Azure Marketplace в 2017 году. [Источник 1].

Продукты и услуги

Aster Data System предлагает приложение для аналитики: nCluster - программный продукт, который используется в качестве системы управления базами данных с параллельной обработкой. В октябре 2012 года Aster анонсировала вторую версию своего устройства. В дополнение к программному обеспечению базы данных Aster было доступно еще одно устройство с узлами, на которых запущен дистрибутив Hortonworks Apache Hadoop. В октябре 2013 года была объявлена 6-я версия программного обеспечения базы данных Aster. Он поддерживает технологию использования графов в базах данных и файловую систему, которая, по словам компании, совместима с распределенной файловой системой Hadoop. В июне 2014 года Teradata анонсировала продукт с использованием языка программирования R. В феврале 2015 года Teradata анонсировала «AppCenter» с использованием технологии Aster. В октябре 2015 года Teradata анонсировала набор аналитических методов и приложений для работы на Apache Hadoop, предназначенных для работы в Интернете.

Клиенты

По состоянию на октябрь 2008 года у компании было 5 известных клиентов, хотя она заявляла о намного большем числе клиентов в публичных интервью. Когда Aster Data Systems вышли из скрытого режима в мае 2008 года, MySpace уже использовала платформу «n» Cluster на более чем 100 узлах, способных анализировать 360 терабайт данных. Рекламная сеть Aggregate Knowledge Pique Discovery Network, Acerno, ShareThis и Inside Media - это другие раскрытые клиенты. [Источник 2]. https://www.teradata.com/Consulting

Информация о nCluster

Aster «n» Cluster, программный продукт, разработанный компанией, представляет собой аналитическую систему управления базами данных с параллельной обработкой (MPP), которая работает на кластере товарных серверов. Архитектура кластера Aster «n» оптимизирована для хранилищ данных и аналитических приложений (также называемых OLAP - Online Analytic Processing, в отличие от OLTP - Online Transaction Processing). Его заявленные преимущества включают в себя возможность обеспечения высокой производительности и масштабируемости. Компания также утверждает, что база данных включает в себя автоматическое обнаружение отказов и возможности самовосстановления для обеспечения высокой доступности и обеспечения одним щелчком мыши для управления. Aster Data Systems разработала nCluster для создания высокопроизводительной базы данных, которая работает на стандартных серверах x86, которые могут масштабироваться до нескольких петабайт данных с низкой рабочей силой. Как и другие склады MPP нового поколения, Aster использует репликацию данных на двух или более кластерных серверах для обеспечения отказоустойчивости. Несколько более однозначно, продукт имеет возможность выполнять многие административные задачи, такие как перебалансировка кластера, без использования базы данных в автономном режиме. Основной набор инструментов базы данных nCluster:

  • Визуальная аналитика
  • FluidShell
  • Инструмент запросов и анализа
  • Сетка и сводные диаграммы
  • Редактор табличных данных
  • Инструменты импорта и экспорта
  • Моделирование отношений объектов
  • Визуальный конструктор запросов

Таким образом, nCluster подходит для решения множества задач. [Источник 3].

Планирование запросов

Для реализации инфраструктуры SQL/MR в nCluster потребуется определить взаимодействия SQL/MR-функции с подсистемами планирования и выполнения запросов реляционной СУБД. SQL/MR-функции являются динамически полиморфными в том смысле, что их входная и результирующая схемы зависят от контекста вызова. Пользователь определяет входную и результирующую схемы в течение фаз планирования запроса – эта задача возложена на планировщик запросов в "королевском" узле. Планировщик запросов получает дерево грамматического разбора запроса. Он устанавливает входную и результирующую схемы вызовов SQL/MR-функций при обходе этого дерева снизу-вверх. Если при этом обходе встречается вызов некоторой SQL/MR-функции, планировщик использует уже известную схему входного отношения – вместе с разобранными разделами аргументов, заданными при вызове этой функции, – для инициализации функции путем вызова ее подпрограммы инициализации. Подпрограмма инициализации должна определиться со столбцами результирующей таблицы, которая будет произведена основной (runtime) подпрограммой функции во время выполнения запроса.Например: в Java API подпрограмме инициализации соответствует конструктор класса, реализующего интерфейс функции над строками или разделами, а основной подпрограммой является метод, определяемый этим интерфейсом.

Выполнение запросов

SQL/MR-функции выполняются параллельно во всех узлах nCluster, и это выполнение также распределяется в нескольких потоках управления в каждом узле. Поскольку модель программирования, основанная на подходе MapReduce, не зависит от степени параллелизма, система может контролировать уровень параллелизма прозрачным образом, исходя из возможности использования доступных аппаратных ресурсов. В среде SQL/MR при вызове функции просто образуются ее экземпляры, по одному на каждый доступный поток управления. Входные строки распределяются между этими потоками управления, а результирующие строки собираются от всех задействованных потоков.

Параллельная загрузка и трансформация

SQL/MR-функции можно также использовать для чтения и преобразования данных из внешних источников. Пусть есть сценарий, в котором сотни торговых площадок посылают в основной офис файлы с разделенными запятыми данными о дневном обороте, и эти данные требуется загрузить в nCluster. Распространенное решение состоит в том, что для загрузки данных используется некоторый внешний процесс. В nCluster можно выполнить преобразования данных внутри кластера, используя SQL/MR-функцию, которая принимает на входе набор URL, идентифицирующих внешние файлы, подлежащие загрузке, и раздел аргументов с определениями ожидаемой входной схемы и желательной результирующей схемы. [Источник 4].

Заключение

В настоящее время в результате некоторых экономических трудностей компания приостановила разработку программного обеспечения.

Примечания

Источники

  1. Википедия - свободная энциклопедия // Wiki [2017—2017]. Дата обновления: 15.06.2015. URL: https://en.wikipedia.org/wiki/Aster_Data_Systems(дата обращения: 30.01.2019)
  2. About Teradata // Aster Data Systems [2012—2019]. Дата обновления: 12.08.2017. URL: https://www.teradata.com/Consulting (дата обращения: 30.01.2019)
  3. Словари и энциклопедии на Академике // Aster Data Systems [2017—2019]. Дата обновления: 19.03.2016. URL: https://en.academic.ru/dic.nsf/enwiki/10889544 (дата обращения: 30.01.2019)
  4. About nCluster // Teradata [2017—2019]. Дата обновления: 22.09.2016. URL: sql.fliplinux.com/teradata-aster-ncluster_export.html (дата обращения: 30.01.2019)