Все продукты
Все сервисы VK Cloud

Arenadata DB

Мощная распределенная аналитическая база данных для больших проектов
original_arenadata_hero_img_desktop_2x_b61c9ea0b1.webp

150 000 бонусных рублей на тест

Протестируйте VK Data Lakehouse в облаке с поддержкой наших архитекторов
Group 2087326571.png

Быстро выполняйте сложные аналитические запросы с Arenadata DB на основе Greenplum

Arenadata DB — аналитическая база данных на основе Greenplum с открытым исходным кодом. Это массивно-параллельная СУБД, обладающая линейной масштабируемостью. Применяется в критически важных системах, работающих с большими объемами данных: объем данных в базе не ограничен, и она работает на 20% быстрее других СУБД. Arenadata DB как сервис — быстрое кластерное решение, которое позволяет в несколько кликов развернуть базу для хранения и обработки больших данных, не вкладываясь в собственную инфраструктуру и ее поддержку.

Почему Greenplum?

Может работать с данными из нескольких источников с минимальной предобработкой
Поддерживает реляционную модель данных, легко интегрируется с PostgreSQL и другими реляционными решениями
Изолирует разные типы нагрузок друг от друга, за счет чего хорошо выполняет параллельные операции
Быстро обрабатывает сложные аналитические запросы благодаря MPP-архитектуре (Massively Parallel Processing)
Позволяет анализировать данные в режиме реального времени с последующим прогнозированием
Предоставляет доступ к данным через интерфейс для интеграции с другими аналитическими решениями

Полностью управляемая база данных

В нашу зону ответственности входит вся IT инфраструктура, хостинг Arenadata DB, администрирование, обеспечение высокой доступности и соответствия требованиям, а вы управляете данными и извлекаете из них пользу

Enterprise Trial

Получите 3 месяца бесплатного использования Enterprise–версии Arenadata DB
Одно пространство для бизнеса  и государства.png

Преимущества Arenadata DB в облаке

Готовая БД в облаке

Готовая БД в облаке

Не надо покупать серверы, строить и обслуживать инфраструктуру
Совместимость с PostgreSQL

Совместимость с PostgreSQL

Простой перенос данных из реляционных СУБД без перестройки логики работы с данными
Любые данные

Любые данные

Может быть основой для Data Lake и принимать данные с минимальной обработкой
Масштабирование

Масштабирование

Не думайте о конфигурациях машин, просто выбирайте необходимый объем: от гигабайт до сотен терабайт
Снижение TCO

Снижение TCO

Не платите за лицензию, только за используемые мощности
Интеграция с Big Data

Интеграция с Big Data

Легко подключить инструменты анализа в сервисе Cloud Big Data от VK (Hadoop, Spark, Airflow)
Обучающий видеоролик
Group 2087326386.png

Применения Greenplum в вашем бизнесе

Arenadata DB — корпоративная база данных, которая может использоваться банками, финансовыми и страховыми компаниями, телекомом, госорганами, промышленными предприятиями, ритейлом, логистикой и другими организациями в качестве основного хранилища данных и аналитической платформы

Для корпоративной аналитики от BI до AI

Обладает расширенными возможностями обработки транзакций и поддержкой потоковых данных, справляется с аналитическими нагрузками от бизнес-аналитики до машинного обучения

Хранение и обработка больших данных

Хранит и обрабатывает от единиц до сотен терабайт данных. Подходит для предиктивной аналитики, построения корпоративных хранилищ данных, отчетности и решения других задач, связанных с массивами данных

Защита целостности данных

Неизменность данных и высокая доступность — идеально подходит для критичных систем, где потеря данных недопустима. Резервное копирование и аварийное восстановление гарантируют сохранность информации компании

Три версии Arenadata DB в облаке

Community

Версия с ограничением по функциональности и использованию в рамках Community-лицензии

Enterprise Trial

Полнофункциональная версия Arenadata DB с поддержкой на уровне виртуальных машин

3 месяца бесплатно

Enterprise

Полнофункциональная версия с технической поддержкой базы данных

лучший выбор

Другие базы данных

MySQL

MySQL

Реляционная база данных, подходит для небольших и средних интернет-проектов
PostgreSQL

PostgreSQL

Реляционная база данных для масштабных проектов и данных, где недопустимы ошибки
MongoDB

MongoDB

Документная база данных, подходит для хранения несвязанных данных и разных типов контента
Redis

Redis

Высокопроизводительная БД для быстрой обработки запросов и работы в реальном времени
ClickHouse

ClickHouse

Аналитическая база данных для хранения и обработки исторических данных

Попробуйте наши сервисы

После активации аккаунта мы свяжемся с вами и начислим до 12 000 рублей на ваш счет VK Cloud, чтобы вы смогли протестировать сервис в течение 60 дней
Воркспейс в облаке.png

FAQ

Что такое Arenadata DB (ADB)?

Arenadata DB (ADB) — кластерная реляционная СУБД, построенная на MPP-системе Greenplum, использующей в своей основе PostgreSQL. Она предназначена для хранения и обработки больших объемов информации. СУБД работает на нескольких (от двух до сотен) серверах, равномерно распределяя нагрузку и данные между ними. При этом не обязательно знать, сколько и каких серверов используется, можно работать с СУБД как с обычной, некластерной системой.

Какие задачи решает Arenadata DB?

ADB — аналитическая СУБД, которая хорошо справляется с небольшим (до 300) числом одновременных запросов, каждый их которых может быть достаточно сложным. Такие запросы часто возникают: - при использовании BI-систем - у продвинутых ad-hoc SQL- и Python-аналитиков - при решении задач с помощью Machine Learning-алгоритмов - в других видах отчетности

В каких бизнес-сценариях чаще всего используется ADB?

Применение Arenadata DB не ограничивается конкретными сценариями — везде, где есть место аналитике больших данных, СУБД помогает достигать результатов. Но наиболее эффективные области применения ADB — это: - любые типы отчетности (например, операционная, управленческая, обязательная регуляторная) - глубокий ad-hoc-анализ - работа систем маркетинговых кампаний - различный скоринг - системы лояльности - предсказание спроса, прогнозирование остатков - анализ поведения пользователей - «золотая запись» о клиентах

Когда не следует использовать ADB?

Если к СУБД предполагается большое число параллельных запросов (более 300), возможно, более оптимальным будет использовать ADB совместно с другой СУБД — например, с ClickHouse.

Где я могу найти документацию?

Документация к СУБД Greenplum расположена по <a href="http://docs.greenplum.org" target="_blank" style="color:#0187F6;">ссылке</a>.

Как шардируются данные по серверам?

По умолчанию все таблицы равномерно распределяются по серверам случайным образом. Поэтому в работе каждого запроса всегда используются все сегменты. Дополнительно при создании таблицы можно указать ее ключ распределения по серверам (одно или несколько полей). В таком случае все соединения с указанной таблицей по этому полю (или полям) будут происходить быстрее. <a href="http://docs.greenplum.org/6-1/admin_guide/distribution.html" target="_blank" style="color:#0187F6;">Подробнее о распределении данных в СУБД</a>

Поддерживается ли колоночное хранение?

Да, поддерживается как строковое, так и колоночное хранение данных в таблицах. Для аналитической нагрузки предпочтительно колоночное хранение. Также можно создавать полиморфные таблицы, где часть данных (партиция) хранится строково, а часть — колоночно. <a href="http://docs.greenplum.org/6-1/ref_guide/sql_commands/CREATE_TABLE.html" target="_blank" style="color:#0187F6;">Подробнее в документации</a>

Поддерживается ли сжатие?

Поддерживаются следующие алгоритмы сжатия: ZSTD (предпочтительный), ZLIB, RLE. Сжатие применяется на таблицу, партицию или даже отдельный столбец. Arenadata рекомендует использовать ZSTD уровня 1.

Какие стандарты поддерживает СУБД?

ADB является ANSI SQL-совместимой системой: подробная информация доступна в&nbsp; <a href="http://docs.greenplum.org/6-1/ref_guide/feature_summary.html" target="_blank" style="color:#0187F6;">документации</a>.

Совместим ли синтаксис и протокол с PostgreSQL?

Да, примерно на 95% совместим. Вы можете использовать стандартные PostgreSQL-драйверы (JDBC, ODBC) для работы с ADB. Общее правило — все ПО, которое работает с PostgreSQL, работает и с ADB. <a href="http://docs.greenplum.org/6-1/ref_guide/feature_summary.html#topic8" target="_blank" style="color:#0187F6;">Подробнее о совместимости с PostgreSQL</a>.

Есть ли транзакции?

Да, ADB — ACID-система. Уровень изоляции транзакций — Serializable.

Есть ли проекции и индексы?

Есть три типа индексов и материализованные представления.

Какие процедурные языки поддерживаются?

Поддерживаются функции на языках SQL (PLpg/SQL), Python, R, Java, Perl.

Как правильно загружать данные в СУБД?

Небольшие объемы можно загружать через стандартный PostgreSQL-интерфейс (например, JDBC или ODBC). Большие объемы эффективней грузить через специальный загрузчик (GPFDIST), который отправляет данные в СУБД параллельно. <a href="http://docs.greenplum.org/6-1/admin_guide/external/g-using-the-greenplum-parallel-file-server--gpfdist-.html" target="_blank" style="color:#0187F6;">Подробнее о параллельной загрузке</a>.

Какой максимальный объем данных можно хранить в СУБД?

Объем данных в СУБД практически не ограничен. Ограничения по объему данных в отдельных таблицах, строках и полях ниже: <table border="1"><thead><tr><th>Параметр</th><th>Лимит</th></tr></thead><tbody><tr><td>Максимальный размер базы данных</td><td>Нет ограничений</td></tr><tr><td>Максимальный размер таблицы</td><td>Нет ограничений, 128 Тб на раздел (партицию)/сегмент</td></tr><tr><td>Максимальный размер строки</td><td>&gt; 1 Гб (приблизительно)</td></tr><tr><td>Максимальный размер поля</td><td>1 Гб</td></tr><tr><td>Максимальный размер BLOB</td><td>1 Гб (Используйте тип данных BYTEA, нет BLOB)</td></tr><tr><td>Максимальное количество строк в таблице</td><td>2^48</td></tr><tr><td>Максимальное количество столбцов в таблице</td><td>1600</td></tr><tr><td>Максимальное количество индексов в таблице</td><td>Без ограничений</td></tr><tr><td>Максимальное количество баз данных/пользователей</td><td>Без ограничений</td></tr><tr><td>Максимальное количество таблиц в базе данных</td><td>4200 миллионов</td></tr><tr><td>Максимальное количество столбцов в представлении</td><td>1664</td></tr><tr><td>Максимальное количество столбцов в индексе</td><td>Без ограничений</td></tr><tr><td>Максимальное количество ограничений уровня таблицы на таблицу</td><td>Без ограничений</td></tr><tr><td>Максимум активных параллельных транзакций</td><td>Без ограничений</td></tr><tr><td>Максимальный размер дескриптора формата данных</td><td>63 символа</td></tr><tr><td>Максимальный размер имени базы данных, пользователя, таблицы, представления, индекса, триггера, UDF, UDT, хранимой процедуры, ограничения и столбца</td><td>63 символа</td></tr><tr><td>Максимальное количество сессий на parsing engine</td><td>Нет концепции Parsing Engine, кроме узла masterDB. Без фиксированного лимита, до нескольких сотен.</td></tr><tr><td>Максимальное количество столбцов на первичный и вторичный индекс</td><td>32</td></tr></tbody></table>

Не нашли ответ на свой вопрос?

Задайте его нам на портале поддержки, и мы оперативно ответим
Задать вопрос