Big Data, jego wpływ na procesy informacyjne w zarządzaniu
Wykonały:
Nela Rojczyk
Edyta Młynarczyk
Wstęp
W branży informatycznej, początku drugiej dekady XXI wieku, z pewnością będzie się kojarzyć z terminem Big Data. W ciągu ostatnich kilku lat nastąpiła rewolucja w powszechnym udostępnianiu w mediach społecznościowych, informacji na praktycznie każdy temat.
Codziennie wytarzamy więcej informacji niż niegdyś cała ludzkość przez wieki. W 2010 roku Eric Schmidt, ówczesny prezes Google'a, oszacował, że ludzkość od początku cywilizacji do 2003 r. wytworzyła 5 eksabajtów danych.1 Dziś tyle nowych danych pojawia się co dwa dni. W lipcu 2012 r. każdej minuty do sieci trafiło 48 godzin nagrań umieszczonych na YouTube, pojawiało się niemal 685 tys. wpisów na Facebooku, 100 tys. na Twitterze, uruchomiano 571 nowych stron w internecie. Za taki przyrost danych odpowiadają social media – popularny polski serwis www.nk.pl buduje hurtownię danych od 3lat, a zajmuje ona już 500 TB. Użytkownicy serwisu każdego dnia dodają do liczby kolejne 1,5 TB. 2
Co to jest Big Data ?
Według McKinsey „Big Data" to zbiór danych, których rozmiar przekracza możliwości klasycznych narzędzi do składowania, analizy i zarządzania danymi.3
Big Data to dane, których charakter uniemożliwia użycie klasycznych systemów bazodanowych, wymagające alternatywnych metod przetwarzania, składowania i analiz. Technologie i techniki pozwalające organizacji efektywnie składować przetwarzać i analizować wszystkie potrzebne dane. To dynamicznie rozwijająca się metoda analizy danych, która znajduję zastosowanie w biznesie, samorządach i polityce, to ogromne zbiory danych liczonych w terabajtach lub petabajtach.
Big Data analizuje zatem różnorodne, zawarte w dużych bazach, istotne informacje. W Efekcie uzyskujemy wiedzę, która pomoże podjąć najlepszą możliwą decyzję.
Przykładem zastosowania tej technologii jest Nowy Jork, gdzie burmistrz Mike Bloomberg powołał jednostkę zajmująca się Big Data. Władze Nowego Jorku gromadzą mnóstwo rozmaitych informacji o mieście : ilość budynków, ich stanie technicznym i rodzaju prowadzonej w nich działalności gospodarczej, rozmieszczeniu punktów wi-fi, liczbie przestępstw w poszczególnych rejonach, liczbie mieszkańców w danej dzielnicy i ich przynależności etycznej, płaconych przez ich podatkach i szkołach, w których uczą się ich dzieci. W efekcie podwojono skuteczność w wykrywaniu sklepów sprzedających nielegalny tytoń, przyspieszono proces usuwania drzew zniszczonych przez huragan Sandy, skierowano inspektorów budowlanych w miejsca, gdzie istniało wysokie prawdopodobieństwo wystąpienia pożarów. Big data prowadzi więc do sprawniejszego i bardziej efektywnego zarządzania miastem. 4
Według firmy Forrester „Big Data" to koncepcja rozważania problemów danych w czterech wymiarach, zwanych 4V:
volume – ilość danych;
variety – różnorodność danych;
velocity – szybkość pojawiania się nowych danych i ich analizy w czasie rzeczywistym;
value – wartość danych;5
Pierwszą z cech, które wyróżniają Big Data jest volume , czyli ilośc danych. Obecnie największym klastrem Hadoop, jednej z najważniejszych technologii Big Data, jest instalacja w portalu Facebook. W 2012 r. przekroczyła ona 120 petabajtów, dodatkowo charakteryzuje się ona znaczącą dynamiką przyrostu ilości danych - w 2010 r. w facebookowym Hadoopie znajdowało się "zaledwie" ponad 30 petabajtów. 6
Następnie variety- przechodzą z wielu różnych, niespójnych ze sobą źródeł, Różnorodność danych poddawanych analizie nie ogranicza się jedynie do podłączenia wielu systemów transakcyjnych. W Big Data chodzi o połączenie wielu typów danych - ustrukturyzowanych i nieustrukturyzowanych, wewnętrznych i zewnętrznych, historycznych i aktualnych.
Velocity to szybkość pojawiania się nowych danych i ich analizy w czasie rzeczywistym. Nowe dane napływają i zmieniają się nieustannie. Aby wyciągnąć z nich prawidłowe wnioski należy je też na bieżąco analizować, dlatego analiza Big Data przeprowadzana jest w czasie zbliżonym do rzeczywistego. Kluczami do oceny potrzeb w zakresie szybkości analizy Big Data są procesy biznesowe i wymagania użytkowników.7
Z całej masy nieistotnych informacji analiza big data wyodrębnia te najważniejsze (value). Wartość to zdecydowanie najistotniejsza cecha wyróżniająca dla Big Data, zarówno w kontekście kosztu pozyskania technologii, jak i korzyści, jakie organizacje mogą uzyskać w wyniku jej stosowania.8 Koszt technologii jest ważną różnicą w porównaniu z systemami z przeszłości, ponieważ poszczególne elementy układanki Big Data istniały od lat, tyle że nie były powszechnie dostępne dla przeciętnej firmy. Wartość odnosi się również do korzyści, jakie osiągają firmy i organy administracji w wyniku implementacji Big Data w zakresie redukcji kosztów kapitałowych, wydajności operacyjnej czy udoskonalenia procesów biznesowych.
2. Poprawić wyniki misji
3. Zidentyfikować i zmniejszyć nieefektywność
4. Eliminacji odpadów, oszustw i nadużyć
5. Poprawy wydajności
6. Zwiększyć zwrot z inwestycji, cięcia całkowity koszt posiadania
7. Zwiększenia przejrzystości i usługi
8. Zmniejszenia zagrożeń dla bezpieczeństwa i przestępczości
Poprzez wykorzystanie nowych technologii Big Data , organizacje mogą odpowiadać na pytania sekundach zamiast dniach i dniach zamiast miesięcy.10
Skąd się bierze Big Data?
Big Data często sprowadzała się do trzech głównych odmian:
Dane- obejmują dane z faktur, zleceń płatności, zapisów i przechowywania zapisów dostaw,
Dane- zebrane z urządzeń przemysłowych (np. samolotów najnowszej generacji produkować kilka terabajtów danych na jednym locie transatlantyckim), w czasie rzeczywistym danych z czujników (w tym czujników w smartfonie lub monitora pracy serca) oraz dzienniki internetowe, które śledzą zachowanie użytkownika w Internecie.
Społeczne danych może to być dane pochodzące z mediów społecznych, takich jak Facebook Likes, Tweetów i widoki z YouTube. 11
15 firm działających z Big Data:
IBM- autorzy raportu Wikibon szacują, że IBM zarobił w 2012 roku na produktach i usługach związanych z Big Data aż 1,3 mld dolarów.
HP była drugą największą firmą dostarczającą rozwiązania Big Data w roku 2012, z dochodem sięgającym 664 mln dolarów.
Teradata- klasyfikuje się na trzecim miejscu największych dostawców Big Data w 2012 roku, z dochodem na poziomie 435 mln dolarów.
MapR- współpracuje z platformą Cloud Amazon oraz Google Compute Engine. Firma była czwarta wśród dostawców specjalizujących się tylko w Big Data, z przychodem na poziomie 23 mln dolarów przychodu
Oracle- Jest piątym, największy dostawca Big Data w 2012 roku, z dochodem 415 mln dolarów.
SAP - uplasował się na 6 pozycji z dochodem 368 mln dolarów.
EMC- pomaga firmom przechowywać i analizować Big Data. EMC było 7 największym dostawcą Big Data w 2012 roku, z przychodami na poziomie 336 mln dolarów.
Amazon- jest znany przede wszystkim ze swoich platform cloud dla sektora enterprise, ale w swojej ofercie posiada także szereg produktów Big Data.
Microsoft- firma zajęła dziewiąte miejsce wśród największych dostawców usług Big Data w 2012 roku, z przychodem na poziomie 196 mln dolarów.
Google- oferta Big Data od Google obejmuje m.in. BigQuery, platformę analityczną Big Data opartą na chmurze. Firma posiadała 36 mln dolarów przychodów związanych z Big Data w zeszłym roku.
VMware jest najlepiej znany ze swoich rozwiązań chmurowych oraz związanych z wirtualizacją, ale zyskuje także duże znaczenie w świecie Big Data. VMware zanotował w kategorii Big Data, w 2012 roku, przychód na poziomie 32 mln dolarów.
Cloudera jest na liście najlepszych dostawców rozwiązań Big Data z ponad 141 mln
Hortonworks- jest kolejnym dostawcą Hadoop. Firma otrzymała ponad 70 mln dolarów kapitału na rozpoczęcie inwestycji.
Splunk miał największy udział w rynku wśród wszystkich firm zajmujących się wyłącznie Big Data. Według Wikibon, jego przychód z 2012 roku szacowany jest na 186 milionów dolarów. Firma specjalizuje się w analizach danych z urządzeń.
10Gen- posiada inwestorów strategicznych tj. Intel, Red Hat bądź In-Q-Tel. W zeszłym roku 10Gen był trzeci wśród dostawców typu „tylko Hadoop i NoSQL”, z 36 mln dolarów przychodu.12
Zakończenie
Podsumowując świat Big Data to nie tylko technologia i dane, to przede wszystkim umiejętne ich wbudowanie w procesy biznesowe. Każdego dnia tworzymy 2,5 trylionów bajtów danych - tyle, że 90% danych w dzisiejszym świecie zostało stworzone w ciągu ostatnich dwóch lat. Zdobywanie danych w obecnych czasach stało się bardzo proste. Gromadzenie jednak olbrzymich ilości danych nie zawsze prowadzi do zdobywania odpowiednich informacji. Era big data niesie ze sobą także poważne wyzwania związane z polityką prywatności osób i organizacji, własnością intelektualną i bezpieczeństwem danych.
Literatura:
Broda M. :Big Data Marketing - jak automatyzować marketing w oparciu o gromadzone dane behawioralne i transakcyjne. [http://nowymarketing.pl/a/1319 big-data-marketing-jak-automatyzowac-marketing-w-oparciu-ogromadzone-dane-behawioralne-i-transakcyjne]. Kwiecień 02, 2013.
Collett S.: 15 najpotężniejszych firm Big Data [http://www.computerworld.pl/ galeria/68115/16/15.najpotezniejszych.firm.Big.Data.html]. 3 grudnia, 2013
Mazur M.: Big Data dla każdego [http://www.erp-view.pl/business_intelligence/ big_data_dla_kazdego.html]. Lipiec 23, 2013
Michał M.: Co to jest Big Data? [http://blog.ipresso.pl/2013/07/co-to-jest-big-data/]. Lipiec 31, 2013
Olavsrud T.: How to Use Big Data to Make Faster and Better Business Decisions
[http://www.computerworld.com/s/article/print/9235604/How_to_Use_Big_Data_to_Make_Faster_and_Better_Business_Decisions?taxonomyNa]. January 11, 2013
Penkalla A. : Big Data już dziś napędza biznes. []. Kwiecień 04, 2013.
Płaza P. : Big Data - żyjemy na podsłuchu. Dzięki inwigilacji wiedzie się nam wygodniej. [http://technologie.gazeta.pl/internet/1,104665,13830802,Big_Data___ zyjemy_na_podsluchu__Dzieki_inwigilacji.html ]. Kwiecień 29, 2013.
Słoniewski T. : Od BI do „Big Data” [http://it-manager.pl/video]. Wrzesień 11, 2012
StateTech Staff : 8 Benefits of Big Data for State and Local Governments
[http://www.statetechmagazine.com/article/2013/05/8-benefits-big-data-state-and-local-governments]. Maj 30, 2013
Płaza P. : Big Data - żyjemy na podsłuchu. Dzięki inwigilacji wiedzie się nam wygodniej.[ ]. Kwiecień 29, 2013.↩
Penkalla A. : Big Data już dziś napędza biznes. [http://www.computerworld.pl/artykuly/389572/Big. Data.juz.dzis.napedza.biznes.html]. Kwiecień 04, 2013.↩
Broda M. :Big Data Marketing - jak automatyzować marketing w oparciu o gromadzone dane behawioralne i transakcyjne. [http://nowymarketing.pl/a/1319 big-data-marketing-jak-automatyzowac-marketing-w-oparciu-ogromadzone-dane-behawioralne-i-transakcyjne]. Kwiecień 02, 2013.↩
Michał M.: Co to jest Big Data? [http://blog.ipresso.pl/2013/07/co-to-jest-big-data/]. Lipiec 31, 2013↩
Broda M. :Big Data Marketing - jak automatyzować marketing w oparciu o gromadzone dane behawioralne i transakcyjne. [http://nowymarketing.pl/a/1319 big-data-marketing-jak-automatyzowac-marketing-w-oparciu-ogromadzone-dane-behawioralne-i-transakcyjne]. Kwiecień 02, 2013.↩
6,7 Słoniewski T. : Od BI do „Big Data” [http://it-manager.pl/video]. Wrzesień 11, 2012↩
Mazur M.: Big Data dla każdego [http://www.erp-view.pl/business_intelligence/ big_data_dla _kazdego .html]. Lipiec 23, 2013↩
StateTech Staff : 8 Benefits of Big Data for State and Local Governments []. Maj 30, 2013↩
Olavsrud T.: How to Use Big Data to Make Faster and Better Business Decisions [http://www.computerworld.com/s/article/print/9235604/How_to_Use_Big_Data_to_Make_Faster_and_Better_Business_Decisions?taxonomyNa]. January 11, 2013↩
Michał M.: Co to jest Big Data? [http://blog.ipresso.pl/2013/07/co-to-jest-big-data/]. Lipiec 31, 2013↩
Collett S.: 15 najpotężniejszych firm Big Data [http://www.computerworld.pl/galeria/ 68115/16/15. najpotezniejszych.firm.Big.Data.html]. 3 grudnia, 2013↩