Czym są Big Data — proste wyjaśnienie z przykładem

Termin Big Data jest coraz częściej używany niemal na całym świecie – online i offline. I nie dotyczy to tylko komputerów. Jest on objęty ogólnym terminem zwanym technologią informacyjną(Information Technology) , który jest obecnie częścią prawie wszystkich innych technologii oraz dziedzin nauki i biznesu. Big Data to nic wielkiego. Otaczający go szum z pewnością może cię zmylić. W tym artykule przyjrzymy się, czym są Big Data . Zawiera również przykład, w jaki sposób NetFlix wykorzystał swoje dane, a raczej Big Data , aby lepiej służyć potrzebom swoich klientów.

Czym są duże zbiory danych

Czym są duże zbiory danych

Dane leżące na serwerach Twojej firmy były do ​​wczoraj tylko danymi – posortowanymi i zarchiwizowanymi. Nagle spopularyzował się slang Big Data , a teraz dane w Twojej firmie to Big Data . Termin ten obejmuje każdy element danych przechowywany do tej pory przez Twoją organizację. Obejmuje dane przechowywane w chmurach, a nawet adresy URL dodane(URLs) do zakładek. Twoja firma mogła nie zdigitalizować wszystkich danych. Być może nie masz jeszcze uporządkowanych wszystkich danych. Ale wtedy wszystkie cyfrowe, papierowe, ustrukturyzowane i nieustrukturyzowane dane w Twojej firmie to teraz Big Data .

Krótko mówiąc, wszystkie dane – niezależnie od tego, czy są skategoryzowane, czy nie – obecne na Twoich serwerach są zbiorczo nazywane BIG DATA . Wszystkie te dane można wykorzystać do uzyskania różnych wyników przy użyciu różnych rodzajów analiz. Nie jest konieczne, aby wszystkie analizy wykorzystywały wszystkie dane. Różne analizy wykorzystują różne części BIG DATA , aby uzyskać niezbędne wyniki i przewidywania.

Big Data to zasadniczo dane, które analizujesz pod kątem wyników, które możesz wykorzystać do prognoz i innych zastosowań. Używając terminu Big Data , nagle Twoja firma lub organizacja pracuje z technologią informacyjną(Information) najwyższego poziomu , aby wywnioskować różne typy wyników przy użyciu tych samych danych, które celowo lub nieumyślnie przechowywałeś przez lata.

Jak duże są Big Data

Zasadniczo wszystkie połączone dane to Big Data , ale wielu badaczy zgadza się, że Big Data – jako taka – nie może być manipulowana za pomocą zwykłych arkuszy kalkulacyjnych i zwykłych narzędzi do zarządzania bazami danych. Potrzebują specjalnych narzędzi analitycznych, takich jak Hadoop (przeanalizujemy to w osobnym poście), aby wszystkie dane można było analizować za jednym razem (może obejmować iteracje analizy).

W przeciwieństwie do powyższego, choć nie jestem ekspertem w temacie, powiedziałbym, że dane z dowolnej organizacji – dużej czy małej, zorganizowanej czy niezorganizowanej – są dla tej organizacji Big Data i organizacja może wybrać własne narzędzia do analizy dane.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Zwykle do analizy danych ludzie tworzyli różne zestawy danych w oparciu o jedno lub więcej wspólnych pól, dzięki czemu analiza staje się łatwa. W przypadku Big Data nie ma potrzeby tworzenia podzbiorów do ich analizy. Mamy teraz narzędzia, które mogą analizować dane niezależnie od ich wielkości. Prawdopodobnie te narzędzia same kategoryzują dane, nawet gdy je analizują.

Uważam, że warto wspomnieć o dwóch zdaniach z książki „Big Data” Jimmy'ego Gutermana(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-I-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Widzisz więc, że zarówno objętość, jak i analiza są ważną częścią Big Data .

Przeczytaj(Read) : Co to jest eksploracja danych?(What is Data Mining?)

Koncepcje Big Data

To kolejny punkt, w którym większość ludzi się nie zgadza. Niektórzy eksperci twierdzą, że koncepcje Big Data(Big Data Concepts) to trzy „V”:

  1. Tom
  2. Prędkość
  3. Różnorodność

Niektórzy dodają jeszcze kilka V do koncepcji:

  1. Wyobrażanie sobie
  2. Wiarygodność (niezawodność)
  3. Zmienność i
  4. Wartość

Koncepcje Big Data omówię(Big Data) w osobnym artykule, ponieważ ten post już się rozkręca. Moim zdaniem pierwsze trzy litery V wystarczą, aby wyjaśnić pojęcie Big Data .

Przykład Big Data – jak NetFlix(Big Data Example – How NetFlix) wykorzystał go do rozwiązania swoich problemów

Pod koniec 2008 roku w NetFlix wystąpiła awaria , przez co wielu klientów pozostało w ciemności. Podczas gdy niektórzy nadal mogli uzyskać dostęp do usług przesyłania strumieniowego, większość z nich nie mogła. Niektórym klientom udało się zdobyć wypożyczone płyty DVD(DVDs) , podczas gdy innym się nie udało. Post na blogu w Wall Street Journal mówi, że Netflix właśnie rozpoczął transmisję strumieniową na żądanie.

Awaria sprawiła, że ​​kierownictwo pomyślało o możliwych przyszłych problemach, a co za tym idzie; zwrócił się do Big Data . Przeanalizował obszary o dużym natężeniu ruchu, podatne punkty i przepustowość sieci itp., korzystając z tych danych i pracował nad tym, aby skrócić czas przestoju, jeśli w przyszłości pojawi się problem, który będzie miał zasięg globalny. Oto link(the link) do bloga Wall Street Journal(Wall Street Journal Blog) , jeśli chcesz zapoznać się z przykładami Big Data .

Powyższe podsumowuje czym jest Big Data w języku laika. Można to nazwać bardzo podstawowym wprowadzeniem. Planuję napisać jeszcze kilka artykułów na temat powiązanych czynników, takich jak – Koncepcje(Concepts) , Analiza(Analysis) , Narzędzia(Tools) , i zastosowania Big Data(uses of Big Data) , Big Data 3 V , itp. Tymczasem, jeśli chciałbyś coś dodać do powyższego, proszę o komentarz i udostępnienie z nami.

Przeczytaj dalej(Read next) : Co to jest pobieranie danych z sieci(Web Scraping) ?



About the author

Jestem inżynierem komputerowym z ponad 10-letnim doświadczeniem w branży oprogramowania, w szczególności w Microsoft Office. Napisałem artykuły i samouczki na różne tematy związane z pakietem Office, w tym wskazówki, jak efektywniej korzystać z jego funkcji, sztuczki do opanowania typowych zadań biurowych i nie tylko. Moje umiejętności jako pisarza sprawiają, że jestem również doskonałym źródłem informacji dla innych osób, które chcą dowiedzieć się więcej o pakiecie Office lub po prostu potrzebują szybkiej porady.



Related posts