Arenadata DB
Мощная распределенная аналитическая база данных для больших проектов

150 000 бонусных рублей на тест
Протестируйте VK Data Lakehouse в облаке с поддержкой наших архитекторов

Быстро выполняйте сложные аналитические запросы с Arenadata DB на основе Greenplum
Arenadata DB — аналитическая база данных на основе Greenplum с открытым исходным кодом. Это массивно-параллельная СУБД, обладающая линейной масштабируемостью. Применяется в критически важных системах, работающих с большими объемами данных: объем данных в базе не ограничен, и она работает на 20% быстрее других СУБД.
Arenadata DB как сервис — быстрое кластерное решение, которое позволяет в несколько кликов развернуть базу для хранения и обработки больших данных, не вкладываясь в собственную инфраструктуру и ее поддержку.
Почему Greenplum?
Может работать с данными из нескольких источников с минимальной предобработкой
Поддерживает реляционную модель данных, легко интегрируется с PostgreSQL и другими реляционными решениями
Изолирует разные типы нагрузок друг от друга, за счет чего хорошо выполняет параллельные операции
Быстро обрабатывает сложные аналитические запросы благодаря MPP-архитектуре (Massively Parallel Processing)
Позволяет анализировать данные в режиме реального времени с последующим прогнозированием
Предоставляет доступ к данным через интерфейс для интеграции с другими аналитическими решениями
Полностью управляемая база данных
В нашу зону ответственности входит вся IT инфраструктура, хостинг Arenadata DB, администрирование, обеспечение высокой доступности и соответствия требованиям, а вы управляете данными и извлекаете из них пользу
Enterprise Trial
Получите 3 месяца бесплатного использования Enterprise–версии Arenadata DB

Преимущества Arenadata DB в облаке
Готовая БД в облаке
Не надо покупать серверы, строить и обслуживать инфраструктуру
Совместимость с PostgreSQL
Простой перенос данных из реляционных СУБД без перестройки логики работы с данными
Любые данные
Может быть основой для Data Lake и принимать данные с минимальной обработкой
Масштабирование
Не думайте о конфигурациях машин, просто выбирайте необходимый объем: от гигабайт до сотен терабайт
Снижение TCO
Не платите за лицензию, только за используемые мощности
Интеграция с Big Data
Легко подключить инструменты анализа в сервисе Cloud Big Data от VK (Hadoop, Spark, Airflow)
Обучающий видеоролик
Применения Greenplum в вашем бизнесе
Arenadata DB — корпоративная база данных, которая может использоваться банками, финансовыми и страховыми компаниями, телекомом, госорганами, промышленными предприятиями, ритейлом, логистикой и другими организациями в качестве основного хранилища данных и аналитической платформы
Для корпоративной аналитики от BI до AI
Обладает расширенными возможностями обработки транзакций и поддержкой потоковых данных, справляется с аналитическими нагрузками от бизнес-аналитики до машинного обучения
Хранение и обработка больших данных
Хранит и обрабатывает от единиц до сотен терабайт данных. Подходит для предиктивной аналитики, построения корпоративных хранилищ данных, отчетности и решения других задач, связанных с массивами данных
Защита целостности данных
Неизменность данных и высокая доступность — идеально подходит для критичных систем, где потеря данных недопустима. Резервное копирование и аварийное восстановление гарантируют сохранность информации компании
Три версии Arenadata DB в облаке
Community
Версия с ограничением по функциональности и использованию в рамках Community-лицензии
Enterprise Trial
Полнофункциональная версия Arenadata DB с поддержкой на уровне виртуальных машин
3 месяца бесплатно
Enterprise
Полнофункциональная версия с технической поддержкой базы данных
лучший выбор
Другие базы данных
MySQL
Реляционная база данных, подходит для небольших и средних интернет-проектов
PostgreSQL
Реляционная база данных для масштабных проектов и данных, где недопустимы ошибки
MongoDB
Документная база данных, подходит для хранения несвязанных данных и разных типов контента
Redis
Высокопроизводительная БД для быстрой обработки запросов и работы в реальном времени
ClickHouse
Аналитическая база данных для хранения и обработки исторических данных
Попробуйте наши сервисы
После активации аккаунта мы свяжемся с вами и начислим до 12 000 рублей на ваш счет VK Cloud, чтобы вы смогли протестировать сервис в течение 60 дней

FAQ
Что такое Arenadata DB (ADB)?
Arenadata DB (ADB) — кластерная реляционная СУБД, построенная на MPP-системе Greenplum, использующей в своей основе PostgreSQL. Она предназначена для хранения и обработки больших объемов информации. СУБД работает на нескольких (от двух до сотен) серверах, равномерно распределяя нагрузку и данные между ними. При этом не обязательно знать, сколько и каких серверов используется, можно работать с СУБД как с обычной, некластерной системой.
Какие задачи решает Arenadata DB?
ADB — аналитическая СУБД, которая хорошо справляется с небольшим (до 300) числом одновременных запросов, каждый их которых может быть достаточно сложным. Такие запросы часто возникают:
- при использовании BI-систем
- у продвинутых ad-hoc SQL- и Python-аналитиков
- при решении задач с помощью Machine Learning-алгоритмов
- в других видах отчетности
В каких бизнес-сценариях чаще всего используется ADB?
Применение Arenadata DB не ограничивается конкретными сценариями — везде, где есть место аналитике больших данных, СУБД помогает достигать результатов. Но наиболее эффективные области применения ADB — это:
- любые типы отчетности (например, операционная, управленческая, обязательная регуляторная)
- глубокий ad-hoc-анализ
- работа систем маркетинговых кампаний
- различный скоринг
- системы лояльности
- предсказание спроса, прогнозирование остатков
- анализ поведения пользователей
- «золотая запись» о клиентах
Когда не следует использовать ADB?
Если к СУБД предполагается большое число параллельных запросов (более 300), возможно, более оптимальным будет использовать ADB совместно с другой СУБД — например, с ClickHouse.
Где я могу найти документацию?
Документация к СУБД Greenplum расположена по <a href="http://docs.greenplum.org" target="_blank" style="color:#0187F6;">ссылке</a>.
Как шардируются данные по серверам?
По умолчанию все таблицы равномерно распределяются по серверам случайным образом. Поэтому в работе каждого запроса всегда используются все сегменты.
Дополнительно при создании таблицы можно указать ее ключ распределения по серверам (одно или несколько полей). В таком случае все соединения с указанной
таблицей по этому полю (или полям) будут происходить быстрее.
<a href="http://docs.greenplum.org/6-1/admin_guide/distribution.html" target="_blank" style="color:#0187F6;">Подробнее о распределении данных в СУБД</a>
Поддерживается ли колоночное хранение?
Да, поддерживается как строковое, так и колоночное хранение данных в таблицах. Для аналитической нагрузки предпочтительно колоночное хранение. Также можно создавать полиморфные таблицы, где часть данных (партиция) хранится строково, а часть — колоночно.
<a href="http://docs.greenplum.org/6-1/ref_guide/sql_commands/CREATE_TABLE.html" target="_blank" style="color:#0187F6;">Подробнее в документации</a>
Поддерживается ли сжатие?
Поддерживаются следующие алгоритмы сжатия: ZSTD (предпочтительный), ZLIB, RLE. Сжатие применяется на таблицу, партицию или даже отдельный столбец. Arenadata рекомендует использовать ZSTD уровня 1.
Какие стандарты поддерживает СУБД?
ADB является ANSI SQL-совместимой системой: подробная информация доступна в <a href="http://docs.greenplum.org/6-1/ref_guide/feature_summary.html" target="_blank" style="color:#0187F6;">документации</a>.
Совместим ли синтаксис и протокол с PostgreSQL?
Да, примерно на 95% совместим. Вы можете использовать стандартные PostgreSQL-драйверы (JDBC, ODBC) для работы с ADB. Общее правило — все ПО, которое работает с PostgreSQL, работает и с ADB.
<a href="http://docs.greenplum.org/6-1/ref_guide/feature_summary.html#topic8" target="_blank" style="color:#0187F6;">Подробнее о совместимости с PostgreSQL</a>.
Документация
Не нашли ответ на свой вопрос?
Задайте его нам на портале поддержки, и мы оперативно ответим
