Η EMC Corporation παρουσίασε το Federation Business Data Lake, μια πλήρως σχεδιασμένη λύση η οποία περιλαμβάνει κορυφαίες τεχνολογίες storage και Big Data analytics από την EMC Information Infrastructure, την Pivotal, και τη VMware, και έχει στόχο να βοηθήσει τους πελάτες να αξιοποιήσουν όσα μπορεί να τους προσφέρει ο καινούριος κόσμος των Big Data, ώστε να ανοίξει ο δρόμος για τη διαμόρφωση νέων, σημαντικά διαφορετικών επιχειρηματικών μοντέλων.

Με δυνατότητα υλοποίησης σε διάστημα μόλις επτά ημερών1, το Federation Business Data Lake απλοποιεί σε σημαντικό βαθμό την εξαιρετικά πολύπλοκη διαδικασία της δημιουργίας ενός Data Lake. Έχει σχεδιαστεί με γνώμονα την ταχύτητα, την επεκτασιμότητα και τη δυνατότητα της ίδιας της επιχείρησης να εξυπηρετεί τις ανάγκες της (self-service), ώστε να μπορεί να παίρνει πιο εμπεριστατωμένες επιχειρηματικές αποφάσεις, χρησιμοποιώντας τα Big Data analytics. Το Federation Business Data Lake εντάσσεται στα Enterprise Hybrid Cloud Solution, ως μια converged λύση του EMC Federation που επαναπροσδιορίζει την υποδομή ΙΤ, με στόχο την επίτευξη μεγαλύτερης ταχύτητας κι ευελιξίας στην ανάπτυξη Hybrid Clouds και Data Lakes.

Οι απίστευτες δυνατότητες των Big Data βασίζονται, κυρίως και πριν απ’ όλα, στην αύξηση των data που προέρχονται από παραδοσιακές ή περισσότερο σύγχρονες εφαρμογές, από αισθητήρες και από έξυπνες συσκευές, καθώς επίσης και στον τεράστιο όγκο των δεδομένων που δημοσιοποιούνται, για παράδειγμα, μέσα από τα κοινωνικά δίκτυα. Οι οργανισμοί αποκτούν πλέον την ικανότητα να συλλέγουν και να επεξεργάζονται τα δεδομένα αυτά, χάρη στην ανάπτυξη προσιτών συστημάτων storage και την πρακτικά απεριόριστη δυνατότητα επεξεργασίας, αλλά και στην ανάδειξη νέων τεχνολογιών που επιτρέπουν, μέσα από νέα προϊόντα κι εφαρμογές, την ανάλυση σε πραγματικό χρόνο και τη μετάφραση όλων των παραπάνω σε συγκεκριμένες ενέργειες. Αυτές οι τεχνολογίες αποθήκευσης και ανάλυσης, μαζί με τον τεράστιο όγκο των δεδομένων, συνδυάζονται για να δημιουργήσουν ένα Business Data Lake.

Τα Business Data Lakes μετατρέπονται σταδιακά σε μία από τις κορυφαίες προτεραιότητες μιας επιχείρησης, καθώς έρχονται να συμπληρώσουν το κρίσιμο κενό του παραδοσιακού data warehousing. Ένα Business Data Lake περιέχει structured και unstructured data που προέρχονται από μια μεγάλη γκάμα πηγών, ενώ επίσης διαθέτει και τα απαραίτητα εργαλεία ανάλυσης (analytics) τα οποία εστιάζουν στο πώς θα κτίσουν μοντέλα ικανά να προβλέπουν το μέλλον. Οι εταιρείες με αξιόλογα Data Lakes εκμεταλλεύονται τα δεδομένα και τα predictive μοντέλα που έχουν στη διάθεσή τους, για να σχεδιάσουν νέα προϊόντα, εφαρμογές και επιχειρηματικά μοντέλα που τους επιτρέπουν να ορίσουν εκ νέου τους κανόνες και να αποκτήσουν – ή να διευρύνουν- το ρόλο του “Ηγέτη της Αγοράς ” στην οποία δραστηριοποιούνται.

Ένα εξαιρετικά αποτελεσματικό Business Data Lake θα πρέπει να μπορεί να προσφέρει τρεις κρίσιμες λειτουργίες:

Αποθήκευση δεδομένων (Store): να μπορεί να αποθηκεύει structured και unstructured data από πολλές διαφορετικές πηγές, τα οποία μπορούν να αξιοποιηθούν σε κάθε είδους ανάλυση, και να πετυχαίνει τη βέλτιστη ισορροπία μεταξύ χωρητικότητας και απόδοσης, ανάλογα με τις ιδιαίτερες απαιτήσεις κάθε εφαρμογής (use case).

Ανάλυση δεδομένων: να προσφέρει σύγχρονα εργαλεία διαχείρισης και ανάλυσης δεδομένων, για κάθε είδος ανάλυσης, όπως Hadoop-based, In-Memory No-SQL και Scale-out MPP.

Ανάδειξη & αξιοποίηση (Surface & Act): να προσφέρει σε χρήστες και σε εφαρμογές data που τους δίνουν τη δυνατότητα να πραγματοποιούν αλλαγές και να επηρεάζουν τη διαδικασία λήψης κρίσιμων αποφάσεων.

Μέχρι τώρα, η δημιουργία ενός αποτελεσματικού Data Lake είναι μια δύσκολη και σύνθετη υπόθεση. Οι οργανισμοί IT που ενδιαφέρονται να αναπτύξουν ένα αξιόλογο Data Lake θα πρέπει να εγκαταστήσουν και να διαμορφώσουν την κατάλληλη πλατφόρμα analytics, μαζί με το αντίστοιχο storage που ενδείκνυται για κάθε use case, από Hadoop μέχρι real-time. Από τη στιγμή που θα έχει δημιουργηθεί το περιβάλλον, θα πρέπει να μεταφερθούν σε αυτό όλα τα δεδομένα, και να οριστούν τα κατάλληλα δικαιώματα πρόσβασης και ο τρόπος διαχείρισης (governance) κάθε ξεχωριστού data set. Το τελευταίο αυτό στάδιο αποτελεί μια ιδιαίτερα σύνθετη και χρονοβόρα διαδικασία, η οποία δεν συχνά εμποδίζει τους ανθρώπους του IT να ανταποκρίνονται ικανοποιητικά στις ανάγκες των εσωτερικών τους πελατών.

 Η λύση του Federation Business Data Lake

Η λύση του Federation Business Data Lake Solution διευκολύνει τους οργανισμούς που θέλουν να προχωρήσουν στην ανάπτυξη ενός Business Data Lake. Τα βασικά προϊόντα των EMC Federation of Companies, EMC Information Infrastructure, Pivotal και VMware βρίσκονται πίσω από τις κύριες λειτουργίες του Federation Business Data Lake, ανάλογα με τις κατά περίπτωση ανάγκες – Store, Analyze, Surface & Act.

Το Federation Business Data Lake είναι μια πλήρως σχεδιασμένη λύση η οποία μπορεί να γίνει αυτόματα και πολύ γρήγορα provisioned στο IT ενός οργανισμού, ώστε αυτό να αποκτήσει ηγετική θέση στην κάλυψη όλων των απαιτήσεων μιας σύγχρονης επιχείρησης. Τα εργαλεία ανάλυσης (analytics layer) είναι εντελώς virtualized, με εφαρμογές VMware που τρέχουν σε Vblocks με προκαθορισμένα analytics use cases, αυτόματο provisioning και αυτόματη παραμετροποίηση. Το Data Lake Storage Foundation βασίζεται στην οικογένεια EMC Isilon, η οποία εξασφαλίζει την ιδανική ισορροπία ανάμεσα στη χωρητικότητα και τις επιδόσεις.

Το analytics layer αποτελείται από τη σουίτα Pivotal Big Data, το PivotalHD και το HAWQ, την κορυφαία μηχανή SQL-on-Hadoop στον κόσμο. Η Pivotal Big Data Suite προσφέρει enterprise-class SQL, το οποίο με τη σειρά του εξασφαλίζει απρόσκοπτη ενοποίηση και συνεργασία με κορυφαίες πλατφόρμες ανάλυσης, όπως οι SAS, Tableau και άλλες, πάνω από data αποθηκευμένα σε Hadoop. Η EMC προσφέρει, επίσης, δύο πρόσθετα Business Data Lakes, ώστε οι πελάτες να μπορούν να επιλέγουν το Hadoop distribution που θέλουν σήμερα (π.χ. Cloudera ή Hortonworks), αλλά και οποιοδήποτε Open Data Platform-based Hadoop distribution στο μέλλον.

EMC Data Lake Services

Μαζί με το Federation Business Data Lake διατίθεται και μια πλήρης σουίτα υπηρεσιών και εκπαιδευτικού υλικού, ώστε οι πελάτες της EMC να μπορούν, ανεξαρτήτως της εμπειρίας τους, να υλοποιούν τις λύσεις που τους ταιριάζουν καλύτερα, να διαπιστώνουν την αξία που τους προσφέρουν και να εντοπίζουν πολύ γρήγορα τις περιπτώσεις όπου τα Big Data μπορούν να φανούν χρήσιμα. Μεταξύ άλλων, οι υπηρεσίες αυτές περιλαμβάνουν:

EMC Technology Onboarding Service: Για τους πελάτες που είναι έτοιμοι να προχωρήσουν στην ανάπτυξη ενός Data Lake, το EMC Technology Onboarding Service προσφέρει ένα πλήρες πακέτο συμβουλευτικών υπηρεσιών σχετικά με την εγκατάσταση και την ανάπτυξη του Federation Business Data Lake, τη βελτιστοποίηση των εργαλείων analytics και την κατάλληλη προσαρμογή των προδιαγραφών των data.

EMC Proof of Value Service: Για τους πελάτες οι οποίοι γνωρίζουν πού θα χρησιμοποιήσουν το Data Lake αλλά χρειάζονται βοήθεια στο πώς να αξιοποιήσουν τα τελευταία εργαλεία ανάλυσης των big data και τις πιο πρόσφατες τεχνικές ανάπτυξης των αντίστοιχων εφαρμογών, η υπηρεσία Proof of Value τους βοηθά να υπολογίσουν το ROI ενός συγκεκριμένου business case χρησιμοποιώντας πραγματικά δεδομένα.

EMC Big Data Vision Workshop: Για τους πελάτες που είναι αναποφάσιστοι ως προς το πώς θα ενσωματώσουν τα Big Data στην επιχειρηματική τους στρατηγική, το EMC Big Data Vision Workshop έρχεται να τους βοηθήσει να αναλύσουν τη στρατηγική και τους επιχειρηματικούς τους στόχους, και στη συνέχεια, μέσα από ένα πιλοτικό case, τους βοηθά να ξεκινήσουν το ταξίδι τους στον κόσμο των Big Data.

Education Services: Εκτός από τα παραπάνω, η EMC προσφέρει υπηρεσίες εκπαίδευσης και πιστοποίησης για την ανάπτυξη βασικών, αλλά και πιο προχωρημένων λύσεων Big Data, για την κατανόηση των εννοιών του σύγχρονου Data Science, και για την απόκτηση των δεξιοτήτων που θα πρέπει να διαθέτει μια επιχείρηση ή ένας επαγγελματίας των Big Data.

1Βασισμένο σε ένα Business Data Lake του 1PB. Περιλαμβάνει την ανάπτυξη converged υποδομών, Hadoop, structured data και εργαλείων real-time analytics για την ανάλυση των δεδομένων.