Объяснение больших данных

Объяснение больших данных

Что такое большие данные?

Современные предприятия собирают огромные объемы данных из различных источников, которые часто необходимо анализировать в реальном времени. Большими называются данные, которые слишком большие, слишком быстрые или слишком сложные, чтобы их можно было обрабатывать с помощью традиционных технологий.

Три «V» больших данных

Хотя концепция больших данных была сформулирована относительно давно, отраслевой аналитик Даг Лейни (Doug Laney) первым озвучил идею «трех V» больших данных в 2001 году:

  • Объем (Volume): количество данных, подлежащих обработке (обычно большое, измеряется в гигабайтах, экзабайтах и больше)
  • Разнообразие (Variety): самые разные типы данных, структурированных и нет, поступающие в формате потоковой передачи из множества различных источников
  • Скорость (Velocity): скорость потоковой передачи новых данных в систему

Некоторые эксперты по данным расширяют определение, добавляя четвертые, пятые и другие V. Четвертые и пятые V:

  • Достоверность (Veracity): точность, прецизионность и надежность данных
  • Ценность (Value): какова ценность данных для бизнеса? 

Хотя список можно расширить до 42 V, именно эти пять факторов чаще всего упоминаются для определения больших данных.

Преимущества размещения больших данных на all-flash массивах

Преимущества использования all-flash СХД для больших данных:

  • Более высокая скорость (55–180 IOPS для HDD по сравнению с 3000–40 000 IOPS для SSD)
  • Массовый параллелизм с возможностью использования более чем 64 000 очередей для операций ввода/вывода.
  • Производительность и надежность NVMe

Проведите тест-драйв FlashBlade

Опробуйте инстанс Pure1® с самообслуживанием для управления Pure FlashBlade™, самого передового решения в отрасли, предоставляющего файловое хранилище и хранилище объектов с горизонтальным масштабированием.

Почему стоит выбрать Pure Storage для удовлетворения потребностей, связанных с большими данными?

Объем, разнообразие и скорость больших данных относительны и постоянно меняются. Если вы хотите, чтобы ваши данные оставались большими и быстрыми, необходимо согласованно инвестировать в новейшие технологии хранения данных. Успехи в развитии флэш-памяти позволили создать специальные решения all-flash СХД для всех уровней данных. Вот как компания Pure Storage® может помочь усилить ваш канал для анализа больших данных : 

  • Все преимущества all-flash массивов 
  • Консолидация в единый производительный Data Hub, который может с высокой пропускной способностью обрабатывать данные, поступающие в режиме потоковой передачи из различных источников
  • Настоящая бесперебойная система Evergreen™ обновляется без простоев и без переноса данных
  • Упрощенная система управления данными, сочетающая в себе облачную экономику с on-premise управлением и высокой эффективностью.
  • Быстрая и эффективная флэш-СХД с горизонтальным масштабированием с помощью FlashBlade®
800-379-7873 +44 20 3870 2633 +43 720882474 +32 (0) 7 84 80 560 +33 9 75 18 86 78 +49 89 12089 253 +353 1 485 4307 +39 02 9475 9422 +31 (0) 20 201 49 65 +46-101 38 93 22 +45 2856 6610 +47 2195 4481 +351 210 006 108 +966112118066 +27 87551 7857 +34 51 889 8963 +41 31 52 80 624 +90 850 390 21 64 +971 4 5513176 +7 916 716 7308 +65 3158 0960 +603 2298 7123 +66 (0) 2624 0641 +84 43267 3630 +62 21235 84628 +852 3750 7835 +82 2 6001-3330 +886 2 8729 2111 +61 1800 983 289 +64 21 536 736 +55 11 2655-7370 +52 55 9171-1375 +56 2 2368-4581 +57 1 383-2387