Co to jest Big趖a

Co to jest Big Data ?
Big Data to du偶e zbiory danych, kt贸rych rozmiar i zmieniaj膮ce si臋 parametry (niestrukturalno艣膰) uniemo偶liwiaj膮 tradycyjne nimi zarz膮dzanie i analiz臋. Dane, kt贸rych charakter uniemo偶liwia u偶ycie klasycznych system贸w bazodanowych, wymagaj膮ce alternatywnych metod przetwarzania, sk艂adowania i analiz. Technologie i techniki pozwalaj膮ce organizacji efektywnie sk艂adowa膰 przetwarza膰 i analizowa膰 wszystkie potrzebne dane. to dynamicznie rozwijaj膮ca si臋 metoda analizy danych, kt贸ra znajduj臋 zastosowanie w biznesie, samorz膮dach i polityce, to ogromne zbiory danych liczonych w terabajtach lub petabajtach.

Czy Big Data s膮 spo艂ecznie odpowiedzialne -

Bez w膮tpienia mo偶liwe jest wykorzystanie Big Data do wielu spo艂ecznie u偶ytecznych cel贸w. Mog膮 i s膮 to: walka z rakiem, rozszyfrowanie genomu, badania astronomiczne, zwalczanie terroryzmu (przy pami臋taniu o ca艂ej kontrowersyjno艣ci i delikatno艣ci tej kwestii), badania dotycz膮ce mechaniki kwantowej, przeciwdzia艂anie korkom w wielkich metropoliach ameryka艅skich i azjatyckich

Andrew Sutherland, wiceprezes dzia艂u technologii na Europ臋, Bliski Wsch贸d i Afryk臋 w firmie Oracle, wyja艣nia: "Zjawisko Big Data polega na tym, 偶e zasoby informacji maj膮 jednocze艣nie kilka cech: du偶膮 obj臋to艣膰 informacji, pr臋dko艣膰 zmian, strumienie informacji z r贸偶nych 藕r贸de艂 o r贸偶nej charakterystyce oraz potencjalnie du偶膮 warto艣膰 dla firmy. Do sprawnej pracy z takimi zasobami niezb臋dne s膮 specjalne narz臋dzia"

Big Data analizuje zatem r贸偶norodne, zawarte w du偶ych bazach, istotne informacje. W Efekcie uzyskujemy wiedz臋, kt贸ra pomo偶e podj膮膰 najlepsz膮 mo偶liw膮 decyzj臋.

.Przyk艂adem zastosowania tej technologii jest Nowy Jork, gdzie burmistrz Mike Bloomberg powo艂a艂 jednostk臋 zajmuj膮ca si臋 Big Data. W艂adze Nowego Jorku gromadz膮 mn贸stwo rozmaitych informacji o mie艣cie : ilo艣膰 budynk贸w, ich stanie technicznym i rodzaju prowadzonej w nich dzia艂alno艣ci gospodarczej, rozmieszczeniu punkt贸w wi-fi, liczbie przest臋pstw w poszczeg贸lnych rejonach, liczbie mieszka艅c贸w w danej dzielnicy i ich przynale偶no艣ci etycznej, p艂aconych przez ich podatkach i szko艂ach, w kt贸rych ucz膮 si臋 ich dzieci,.

Informacje te zawarte s膮 w wielu odr臋bnych, niesp贸jnych ze sob膮 bazach danych. Dopiero big data pozwoli艂o- przez ich po艂膮czenie i analiz臋 na wyci膮gni臋cie odpowiednich wniosk贸w.

W efekcie podwojono skuteczno艣膰 w wykrywaniu sklep贸w sprzedaj膮cych nielegalny tyto艅, przyspieszono proces usuwania drzew zniszczonych przez huragan Sandy, skierowano inspektor贸w budowlanych w miejsca, gdzie istnia艂o wysokie prawdopodobie艅stwo wyst膮pienia po偶ar贸w. Big data prowadzi wi臋c do sprawniejszego i bardziej efektywnego zarz膮dzania miastem.

Na potrzeby Big Data (cho膰 niekt贸rzy teoretycy wskazuj膮, 偶e w praktyce jest to zjawisko niedefiniowalne) ukuto tak偶e bardzo 艂adnie wygl膮daj膮c膮 (zw艂aszcza w wydawnictwach niespecjalistycznych) definicj臋 "4 Vs". Mianowicie, Big Data to szereg poj臋膰 i dzia艂a艅 zwi膮zanych z pozyskiwaniem, utrzymywaniem i operowaniem na danych charakteryzuj膮cych si臋:

  1. wyst臋powaniem w du偶ej ilo艣ci (volume),

  2. du偶ym zr贸偶nicowaniem (variety),

  3. du偶膮 zmienno艣ci膮 (velocity),

  4. istotn膮 warto艣ci膮 (value).

volume- ilo艣c danych jest pierwsz膮 z cech, kt贸re wyr贸偶niaj膮 Big Data. Obecnie najwi臋kszym klastrem Hadoop, jednej z najwa偶niejszych technologii Big Data, jest instalacja w portalu Facebook. W 2012 r. przekroczy艂a ona 120 petabajt贸w, dodatkowo charakteryzuje si臋 ona znacz膮c膮 dynamik膮 przyrostu ilo艣ci danych - w 2010 r. w facebookowym Hadoopie znajdowa艂o si臋 "zaledwie" ponad 30 petabajt贸w.

variety- przechodz膮 z wielu r贸偶nych, niesp贸jnych ze sob膮 藕r贸de艂, R贸偶norodno艣膰 danych poddawanych analizie nie ogranicza si臋 jedynie do pod艂膮czenia wielu system贸w transakcyjnych. W Big Data chodzi o po艂膮czenie wielu typ贸w danych - ustrukturyzowanych i nieustrukturyzowanych, wewn臋trznych i zewn臋trznych, historycznych i aktualnych. Mo偶liwo艣膰 tworzenia tego typu analiz jest jednym z podstawowych kryteri贸w rozr贸偶nienia mi臋dzy Big Data a klasyczn膮 analityk膮. Nastr臋cza ono tak偶e istotnych problem贸w z uwagi na jako艣膰, integracj臋 oraz prezentacj臋 danych.

velocity- analiza danych prowadzona jest w czasie zbli偶onym do rzeczywistego , Wbrew pozorom, Big Data nie zawsze oznacza analizy w czasie rzeczywistym. Przetwarzanie danych w systemach Big Data odbywa膰 si臋 mo偶e na r贸偶ne sposoby - od przetwarzania wsadowego (batch processing), w kt贸rym dane 艂adowane s膮 do systemu w okre艣lonych interwa艂ach, do ci膮g艂ego przep艂ywu danych z system贸w transakcyjnych do system贸w analitycznych. Kluczami do oceny potrzeb w zakresie szybko艣ci analizy Big Data s膮 procesy biznesowe i wymagania u偶ytkownik贸w.

value- z ca艂ej masy nieistotnych informacji analiza big data wyodr臋bnia te najwa偶niejsze Warto艣膰 to zdecydowanie najistotniejsza cecha wyr贸偶niaj膮ca dla Big Data, zar贸wno w kontek艣cie kosztu pozyskania technologii, jak i korzy艣ci, jakie organizacje mog膮 uzyska膰 w wyniku jej stosowania. Koszt technologii jest wa偶n膮 r贸偶nic膮 w por贸wnaniu z systemami z przesz艂o艣ci, poniewa偶 poszczeg贸lne elementy uk艂adanki Big Data istnia艂y od lat - tyle 偶e nie by艂y powszechnie dost臋pne dla przeci臋tnej firmy. Obecn膮 sytuacj臋 wyr贸偶nia znacz膮co ni偶szy koszt pozyskania wysoko wydajnych technologii obliczeniowych i analitycznych w wyniku spadaj膮cych cen sprz臋tu komputerowego o du偶ych parametrach oraz dost臋pno艣ci oprogamowania open source w chmurze.
Warto艣膰 odnosi si臋 r贸wnie偶 do korzy艣ci, jakie osi膮gaj膮 firmy i organy administracji w wyniku implementacji Big Data w zakresie redukcji koszt贸w kapita艂owych, wydajno艣ci operacyjnej czy udoskonalenia proces贸w biznesowych.

Powy偶sze nie zapowiada jeszcze nic rewolucyjnego. Tym niemniej, w pewnym momencie kto艣 dostrzeg艂, 偶e analiza (gdy ju偶 si臋 opanuje j膮 z technicznego punktu widzenia) wielkich zbior贸w danych (zamiast wielu mniejszych zbior贸w) pozwala uzyska膰 bardzo szczeg贸艂owe i trafne informacje maj膮ce zastosowanie w wielu dziedzinach 偶ycia i biznesu. Co wi臋cej, okaza艂o si臋, 偶e wiele firm i instytucji w wyniku swojej codziennej dzia艂alno艣ci (tj. niejako mimochodem) zbiera olbrzymie ilo艣ci danych cho膰by o u偶ytkownikach internetu i ich zachowaniach, kt贸re potencjalnie mo偶na by艂oby sensownie wykorzysta膰 w celach komercyjnych. W ten spos贸b narodzi艂o si臋 w臋偶sze poj臋cie Big Data, oderwane od specyfiki technicznej i zwi膮zane z danymi, i kt贸re jest najcz臋艣ciej przywo艂ywane we wsp贸艂czesnych publikacjach prasowych.

A co big data wprowadza w innych dziedzinach ?

Sk膮d si臋聽bierze Big Data?

Na szcz臋艣cie nie jest tak, 偶e ka偶dy, kto ma pieni膮dze, mo偶e kupi膰聽nasze dane. 殴r贸d艂a danych s膮聽zazwyczaj legalne i pochodz膮 z wn臋trza danej firmy. Dla bank贸w na przyk艂ad takimi 藕r贸d艂ami b臋d膮 wszelkie nasze dzia艂ania zwi膮zane z kontem, czyli jak, kiedy i za co p艂acimy, czy dokonujemy pewnych zakup贸w regularnie, jakie mamy wp艂ywy na konto i tak dalej. Wszystkie te dane bank gromadzi w naturalny spos贸b, pokazuje nam je po zalogowaniu na konto.
殴r贸d艂a mog膮 by膰 r贸偶ne: dane dost臋pne w internecie, w tym serwisach spo艂eczno艣ciowych, ale te偶 dane z wszelkiego rodzaju system贸w informacji marketingowej czy baz danych klient贸w. Facebook nie udost臋pnia danych firmom w jaki艣 specjalny spos贸b. Mo偶na natomiast pobiera膰 dane dotycz膮ce niekt贸rych aktywno艣ci w miejscach i na profilach publicznych oraz za zgod膮 u偶ytkownika przez aplikacj臋. Warto przy tym zaznaczy膰, 偶e cz臋sto narzekamy na ustawienia prywatno艣ci "Fejsa", ale te偶 sami udost臋pniamy prawie ca艂e swoje 偶ycie. Nale偶y wi臋c odpowiedzie膰 sobie na pytanie: na ile sam zdradzam firmom, kim jestem? wi臋cej o nas mo偶na dowiedzie膰 si臋聽z wynik贸w wyszukiwania Google'a ni偶 tego, co zamieszczamy na Facebooku. Mo偶na by spyta膰: sk膮d niekt贸re firmy wiedz膮, czego szukam w Google? Niestety 鈥 sami dajemy im do tego dost臋p. Na smartfonach, gdzie instalujemy dziesi膮tki aplikacji, za ka偶dym razem wyra偶amy zgod臋 na dost臋p danej aplikacji do naszych danych. Mog膮 to by膰 nie tylko wyniki wyszukiwania, ale te偶 kontakty, sms-y czy e-maile.
Wa偶ny te偶 jest ostatni element, o kt贸rym wspomina Jan Zaj膮c: 偶e wi臋cej o nas mo偶na dowiedzie膰 si臋聽z wynik贸w wyszukiwania Google'a ni偶 tego, co zamieszczamy na Facebooku. Mo偶na by spyta膰: sk膮d niekt贸re firmy wiedz膮, czego szukam w Google? Niestety 鈥 sami dajemy im do tego dost臋p. Na smartfonach, gdzie instalujemy dziesi膮tki aplikacji, za ka偶dym razem wyra偶amy zgod臋 na dost臋p danej aplikacji do naszych danych. Mog膮 to by膰 nie tylko wyniki wyszukiwania, ale te偶 kontakty, sms-y czy e-maile.
Dalej Samcik wymienia inne sposoby wykorzystania Big Data: bank mo偶e przewidywa膰, czy dany klient si臋聽rozwiedzie albo czy b臋dzie mia艂 dziecko, czy s艂ucha rapu. Wszystko to mo偶e wp艂ywa膰 na wiarygodno艣膰聽kredytow膮 danej osoby. Innym przyk艂adem mog膮 by膰 firmy ubezpieczeniowe, kt贸re widz膮c na portalu spo艂eczno艣ciowym, 偶e ich klient lubi sporty ekstremalne, zmieni膮 swoj膮 ofert臋. Oczywi艣cie, mo偶na by rzec: to tylko kolejny spos贸b na to, 偶eby wyci膮ga膰 z nas pieni膮dze. I b臋dzie to stwierdzenie s艂uszne. Ale nie da si臋 nie zauwa偶y膰 tego, o czym pisze Maciej Samcik: 偶e Big Data mo偶e pozwoli膰 bankom na zminimalizowanie nietrafionych po偶yczek (a wszyscy pami臋tamy, jaki udzia艂 w wybuchu kryzysu mia艂y frywolnie rozdawane kredyty), a z kolei klientom oferowa膰 lepsze produkty i us艂ugi. Dzi臋ki temu banki oszcz臋dzaj膮, a klienci nie musz膮 u偶era膰 si臋 z konsultantem, kt贸ry proponuje us艂ug臋 nam kompletnie zb臋dn膮.

Big Data, mimo swojej stosunkowo kr贸tkiej historii, sprzyja dzi艣聽rozwi膮zywaniu聽wielu globalnych聽problem贸w. Firmy takie jak聽IBM, Google czy HP poprzez przetwarzanie聽i zarz膮dzanie聽danymi聽pr贸buj膮 sprosta膰聽wyzwaniom dzisiejszego 艣wiata: analizuj膮 ruch w sieci, bezpiecze艅stwo na drogach, informuj膮 o zagro偶eniach.聽Niedawno Google og艂osi艂 nawet ambitny projekt zwi膮zanych ze starzeniem si臋 cz艂owieka. Mimo to, kilka wa偶nych zagadnie艅 nadal pozostaje dla nich nieuchwytnych - z powodu braku danych lub dostatecznie szybkich komputer贸w.

Przyk艂ady Big Data

Przyk艂adowo, w kalifornijskim Oakland policja zainstalowa艂a monitory akustyczne identyfikuj膮ce strza艂y z broni. Technologia ta nazywa si臋 ShotSpotter i wykorzystuje analityk臋 Big Data do wyznaczania lokalizacji potencjalnego przest臋pstwa metod膮 triangulacji. Policja jest wysy艂ana na miejsce zdarzenia w czasie rzeczywistym. Co wi臋cej, korzy艣ci p艂yn膮ce z dost臋pu do dok艂adnych danych na temat przest臋pczo艣ci, uzyskiwanych w czasie rzeczywistym, si臋gaj膮 daleko poza prac臋 organ贸w 艣cigania: mapy termiczne Trulia Local wy艣wietlaj膮 dane z bie偶膮cych raport贸w dotycz膮cych przest臋pczo艣ci, pomagaj膮c osobom zamierzaj膮cym kupi膰 dom w wyborze odpowiedniej, bezpiecznej lokalizacji.

Monitoring dziecka: skuteczne informowanie o zagini臋ciach

Zg艂oszenie zagini臋cia dziecka jest dzi艣 du偶o prostsze ni偶 kiedy艣, na przyk艂ad poprzez system Amber Alert wprowadzony niedawno r贸wnie偶 w Polsce. Problem polega jednak na tym, 偶e te powiadomienia maj膮 miejsce ju偶 po fakcie. Dost臋pna jest ju偶 technologia 艣ledzenia bie偶膮cej lokalizacji dziecka, chocia偶by na smartfonach, kt贸re s膮 w stanie przes艂a膰 rodzicowi informacje o miejscu pobytu ich pociechy za po艣rednictwem takich us艂ug jak Google Location Reporting . Z kolei aplikacje Volkswagena Car-Net czy Forda MyKey powiadamiaj膮 o opuszczeniu przez nastolatka prowadz膮cego samoch贸d okre艣lonego, wyznaczonego obszaru przy pomocy tzw. geofencingu.

G艂贸wnymi korzy艣ciami z wykorzystaniem Big Data jakie organizacj臋 chc膮 osi膮gn膮膰 to:
1. Podejmowa膰 lepsze decyzje szybciej

2. Poprawi膰 wyniki misji

3. Zidentyfikowa膰 i zmniejszy膰 nieefektywno艣膰

4. Eliminacji odpad贸w, oszustw i nadu偶y膰

5. Poprawy wydajno艣ci

6. Zwi臋kszy膰 zwrot z inwestycji, ci臋cia ca艂kowity koszt posiadania

7. Zwi臋kszenia przejrzysto艣ci i us艂ugi

8. Zmniejszenia zagro偶e艅 dla bezpiecze艅stwa i przest臋pczo艣ci

dla kogo Big Data ?
Z Big Data b臋d膮 korzysta艂y przede wszystkim firmy, kt贸re musz膮 personalizowa膰 dzia艂ania marketingowe, a maj膮 tak du偶o klient贸w, 偶e ka偶de nowe 藕r贸d艂o informacji poprawi efektywno艣膰 sprzeda偶ow膮. Wa偶nym trendem jest tak偶e wykorzystanie medi贸w spo艂eczno艣ciowych w r贸偶nych celach.
Przecie偶 ka偶dy przelew na nasze konto, ka偶da p艂atno艣膰 kart膮, to kawa艂ek wiedzy o nas, kt贸ry dobrowolnie oddajemy bankowcom

W krajach Europy Zachodniej oraz w Stanach Zjednoczonych dane by艂y gromadzone i analizowane od kilkudziesi臋ciu lat. W Polsce sta艂o si臋 to mo偶liwe dopiero po nastaniu gospodarki wolnorynkowej, st膮d system Big Data dopiero od niedawna jest obecny w naszym kraju. Mo偶na jednak zauwa偶y膰 rosn膮ce zainteresowanie t膮 form膮 analizy danych ze strony r贸偶nego rodzaju instytucji, zw艂aszcza tych prowadz膮cych dzia艂alno艣膰 kredytow膮. Dzi臋ki informacjom zdobytym np. na portalach spo艂eczno艣ciowych lub poprzez pliki cookies s膮 one w stanie dostosowa膰 sw贸j produkt b膮d藕 us艂ug臋 do konkretnej osoby. W znacznie lepszym stopniu mog膮 r贸wnie偶 pozna膰, jakie jest ryzyko zwi膮zane z danym klientem. Przedsi臋biorstwa, w tym instytucje sektora bankowego dostrzeg艂y wielkie mo偶liwo艣ci, kt贸re daje szczeg贸艂owa analiza danych o klientach. Dzi臋ki zastosowaniu inteligentnych modeli analitycznych, dzia艂aj膮cych w oparciu o ide臋 Big Data, kt贸re posiadaj膮 umiej臋tno艣膰 uczenia si臋, s膮 one w stanie niemal b艂yskawicznie zareagowa膰 na gorsz膮 jako艣膰 otrzymywanych danych, a w razie potrzeby mog膮 wprowadzi膰 niezb臋dne zmiany w modelu.

15 firm dzia艂aj膮cych z Big Data
IBM
IBM by艂 w 2012 roku najwi臋kszym dostawc膮 rozwi膮za艅 Big Data pod k膮tem przychod贸w 鈥 wynika z raportu Wikibon. Autorzy raportu szacuj膮, 偶e IBM zarobi艂 w 2012 roku na produktach i us艂ugach zwi膮zanych z Big Data a偶 1,3 mld dolar贸w. W szacunkach zosta艂y uwzgl臋dnione serwery, pami臋ci masowe, oprogramowanie baz danych, a tak偶e aplikacje analityczne i us艂ugi powi膮zane. Najbardziej znanymi produktami s膮 platformy baz danych takie jak DB2, Informix czy InfoSphere oraz aplikacje analityczne Cognos i SPSS. IBM wspiera tak偶e otwart膮 platform臋 analityczn膮 danych Hadoop.

HP
HP by艂a drug膮 najwi臋ksz膮 firm膮 dostarczaj膮c膮 rozwi膮zania Big Data w roku 2012, z dochodem si臋gaj膮cym 664 mln dolar贸w. Ten dostawca r贸wnie偶 oferuje szeroki zakres sprz臋tu komputerowego, oprogramowania i us艂ug, z czego najbardziej znan膮 jest platforma analityczna Vertica.

Teradata
Teradata klasyfikuje si臋 na trzecim miejscu najwi臋kszych dostawc贸w Big Data w 2012 roku, z dochodem na poziomie 435 mln dolar贸w. Teradata znana jest z platform sprz臋towych oraz baz danych i oprogramowania analitycznego. Oferuje r贸wnie偶 specyficzne narz臋dzia analityczne dla sprzeda偶y detalicznej oraz bran偶y transportowej. 鈥

Oracle
Podczas gdy Oracle s艂ynie ze swoich flagowych baz danych, okazuje si臋, 偶e to r贸wnie偶 du偶y gracz w 艣wiecie Big Data. To Oracle Big Data Appliance 艂膮czy w jeden ekosystem serwer Intel, dystrybucj臋 Cloudera dla Hadoopa oraz baz臋 danych NoSQL Oracle. Jest to pi膮ty, najwi臋kszy dostawca Big Data w 2012 roku, z dochodem 415 mln dolar贸w.

SAP
SAP oferuje rozmaite narz臋dzia analityczne, lecz znany jest przede wszystkim z implementacji przetwarzania danych w pami臋ci RAM, czyli SAP HANA. Firma SAP uplasowa艂a si臋 na 6 pozycji z dochodem 368 mln dolar贸w. 鈥

EMC
EMC pomaga firmom przechowywa膰 i analizowa膰 Big Data, posiada r贸wnie偶 think tank Marketing Science Lab, czyli zrzeszenie grupy ekspert贸w, kt贸rzy koncentruj膮 si臋 na analizie danych marketingowych. EMC w 2012 roku zas艂yn臋艂o z powo艂ania wsp贸lnie z VMware (28% udzia艂贸w) i General Electric (10% udzia艂贸w) sp贸艂ki Pivotal Initiative, kt贸ra pocz膮tkowo przej臋艂a odpowiedzialno艣膰 za cz臋艣膰 projekt贸w VMware, a docelowo przygotowa艂a projekt Pivotal One 鈥 otwart膮 platform臋 PAAS do analizy Big Data, 艂膮cz膮c膮 w sobie rozwi膮zania z Hadoopa, baz臋 danych Greenplum (EMC) oraz narz臋dzia bibliotek HAWQ. EMC by艂o 7 najwi臋kszym dostawc膮 Big Data w 2012 roku, z przychodami na poziomie 336 mln dolar贸w.

Amazon
Amazon jest znany przede wszystkim ze swoich platform cloud dla sektora enterprise, ale w swojej ofercie posiada tak偶e szereg produkt贸w Big Data, w tym oparte na Hadoop rozwi膮zanie Elastic MapReduce, baz臋 danych DynamoDB oraz magazyn danych Redshift, kt贸re s膮 kompatybilne z Amazon Web Services

Microsoft
Strategia firmy Microsoft wok贸艂 Big Data obejmuje m.in. wsp贸艂prac臋 z Hortonworks (g艂o艣nym start-upem Big Data) oraz wykorzystywaniem narz臋dzia HDInsights opartego o platform臋 danych tej samej firmy. Microsoft w ramach swojej podstawowej aktywno艣ci wok贸艂 Big Data dostarcza oczywi艣cie tak偶e SQL Server. Firma zaj臋艂a dziewi膮te miejsce w艣r贸d najwi臋kszych dostawc贸w us艂ug Big Data w 2012 roku, z przychodem na poziomie 196 mln dolar贸w. -

Google
Oferta Big Data od Google obejmuje m.in. BigQuery, platform臋 analityczn膮 Big Data opart膮 na chmurze. Firma posiada艂a 36 mln dolar贸w przychod贸w zwi膮zanych z Big Data w zesz艂ym roku.

VMware
VMware jest najlepiej znany ze swoich rozwi膮za艅 chmurowych oraz zwi膮zanych z wirtualizacj膮, ale zyskuje tak偶e du偶e znaczenie w 艣wiecie Big Data, m.in. dzi臋ki takim projektom jak rozszerzenia 鈥濾Mware vSphere Big Data Extensions鈥, kt贸re pozwalaj膮 za pomoc膮 vSphere rozwija膰 Hadoopa i dostosowywa膰 jego funkcje do potrzeb du偶ych organizacji. VMware zanotowa艂 w kategorii Big Data, w 2012 roku, przych贸d na poziomie 32 mln dolar贸w, niemal偶e tyle co Goo 鈥

: Cloudera
Cloudera jest na li艣cie najlepszych dostawc贸w rozwi膮za艅 Big Data z ponad 141 mln dolarami z funduszu venture capital i nazwiskami za艂o偶ycieli, kt贸rzy pracowali w takich firmach jak Google, Facebook, Oracle czy Yahoo. Firma jako pierwsze wdro偶y艂a Hadoopa dla klient贸w korporacyjnych w 2008 roku. 鈥

Hortonworks
Hortonworks jest kolejnym dostawc膮 Hadoop. Firma otrzyma艂a ponad 70 mln dolar贸w kapita艂u od venture capital na rozpocz臋cie inwestycji, po oddzieleniu od Yahoo w 2011 roku. Wydaje si臋, 偶e Hortonworks b臋dzie bezpo艣rednim konkurentem Cloudera. Firma znana jest ze swoich strategicznych partnerstw z korporacjami takimi jak Microsoft, Rackspace, Red Hat czy Teradata. 鈥

Splunk
Splunk mia艂 najwi臋kszy udzia艂 w rynku w艣r贸d wszystkich firm zajmuj膮cych si臋 wy艂膮cznie Big Data. Wed艂ug Wikibon, jego przych贸d z 2012 roku szacowany jest na 186 milion贸w dolar贸w. Firma specjalizuje si臋 w analizach danych z urz膮dze艅.

10GEN

10Gen znany jest przede wszystkim z otwartego oprogramowania MongoDB, wiod膮cej bazy danych NoSQL. Posiada inwestor贸w strategicznych tj. Intel, Red Hat b膮d藕 In-Q-Tel. W zesz艂ym roku 10Gen by艂 trzeci w艣r贸d dostawc贸w typu 鈥瀟ylko Hadoop i NoSQL鈥, z 36 mln dolar贸w przychodu. 鈥

MapR
Znany z bazy danych typu NoSQL 鈥 M7, MapR wsp贸艂pracuje z platform膮 Cloud Amazon oraz Google Compute Engine. Firma by艂a czwarta w艣r贸d dostawc贸w specjalizuj膮cych si臋 tylko w Big Data, z przychodem na poziomie 23 mln dolar贸w przychodu

Co sprawia, 偶e wielkie zbiory danych odgrywaj膮 tak du偶膮 rol臋?

Po pierwsze, dostarczaj膮 one informacji, dzi臋ki kt贸rym przedsi臋biorstwa mog膮 zapewni膰 klientom inteligentniejsze mo偶liwo艣ci podr贸偶owania

ni偶 kiedykolwiek dot膮d. Usystematyzowane dane by艂y dotychczas dzielone na odr臋bne zbiory, np. systemy czy firmy. Wykorzystanie zar贸wno nieusystematyzowanych, jak i usystematyzowanych informacji pozwala jednak uzyska膰 sp贸jniejszy wgl膮d w sytuacj臋 ca艂ej bran偶y, umo偶liwiaj膮c firmom z sektora turystycznego optymalizacj臋 proces贸w, wdra偶anie innowacji i budowanie lepszych relacji z klientami.

Po drugie, Big Data mo偶e pom贸c zwi臋kszy膰 elastyczno艣膰 podr贸偶owania oraz skoncentrowa膰 si臋 na potrzebach i preferencjach pasa偶er贸w. To ponowne powi膮zanie podr贸偶y z przyjemno艣ci膮 stanowi kluczow膮 kwesti臋 dla poprawienia do艣wiadcze艅 pasa偶er贸w

Czy Big data to Big problem ?
O bezpiecze艅stwie w kontek艣cie Big Data nale偶y my艣le膰 w dw贸ch kategoriach. Pierwsz膮 jest ryzyko zwi膮zane z bezpiecze艅stwem zasob贸w, drug膮 鈥 wykorzystanie analityki do wykrywania zagro偶e艅.
Wok贸艂 bezpiecze艅stwa rozwi膮za艅 klasy Big Data naros艂o wiele mit贸w, z kt贸rych wi臋kszo艣膰 dotyczy bezpiecze艅stwa samych rozwi膮za艅. Podstawow膮 cech膮 zasob贸w Big Data jest ich obj臋to艣膰, nierzadko liczona w terabajtach, a nawet petabajtach. Jest to ogromna ilo艣膰 informacji, kt贸r膮 trudno skopiowa膰 poza firmowe rozwi膮zania sk艂adowania danych, a zatem dzia艂y IT w firmach s艂usznie zak艂adaj膮, 偶e kompletu danych nie da si臋 szybko ukra艣膰 bez wynoszenia samych no艣nik贸w, takich jak macierze dyskowe. Drug膮 co do wa偶no艣ci cech膮 jest dynamika przyrastania danych, kt贸re s膮 dostarczane do zasob贸w szerokim strumieniem. Chocia偶 skopiowanie lub przekierowanie takiego strumienia jest bardziej prawdopodobne od kradzie偶y ca艂ych statycznych zasob贸w , radykalny wzrost ruchu prawdopodobnie spowodowa艂by przeci膮偶enie 艂膮czy, a zatem alarm. Nawet gdyby napastnikowi uda艂o si臋 pozyska膰 komplet danych, musia艂by zbudowa膰 kopi臋 艣rodowiska, co wi膮偶e si臋 z du偶ymi kosztami. Oznacza to, 偶e kradzie偶 kompletu danych z zasob贸w Big Data przez fizyczne przej臋cie samego urz膮dzenia lub pozyskanie strumienia danych jest ma艂o prawdopodobne. Nie znaczy to jednak, 偶e napastnik nie mo偶e z tych danych skorzysta膰 鈥 wystarczy, 偶e przygotuje d艂ugotrwa艂y atak, skutecznie penetruj膮c firmowe 艣rodowisko


Wyszukiwarka

Podobne podstrony:
EDoc 6 Co to jest podpis elektroniczny slajdy
Co to jest seie
Co to jest teoria wzgl臋dno艣ci podstawy geometryczne
Co to jest widmo amplitudowe sygna艂u, SiMR, Pojazdy
CO TO JEST SORBCJA, Ochrona 艢rodowiska
25. Co to jest metoda PCR i do czego s艂u偶y - Kopia, Studia, biologia
Co to jest budzet panstwa, prawo, Finanse
CO TO JEST TEORIA, POLONISTYKA, 1
Str '1 rozdz. Co to jest umys艂' Ryle, Filozofia U艢
Co to jest wada wymowy, logopedia
Lekcja 2- Co to jest szko艂a wy偶sza, studia r贸偶ne
Co to jest REIKI, Rozw贸j duchowy, Reiki
Co to jest informacja geologiczna
Co to jest integracja sensoryczna
amortyzacja spos贸b olbiczenia i co to jest
Co to jest chiptuning
CO TO JEST?KT SPO艁ECZNY
Durkheim Co to jest akt spo艂eczny
Proces piel臋gnowania om贸wienie co to jest
Co to jest Wicca, Magia, Czarostwo & Wicca

wi臋cej podobnych podstron