Czym są Big Data — proste wyjaśnienie z przykładem
Termin Big Data jest coraz częściej używany niemal na całym świecie – online i offline. I nie dotyczy to tylko komputerów. Jest on objęty ogólnym terminem zwanym technologią informacyjną(Information Technology) , który jest obecnie częścią prawie wszystkich innych technologii oraz dziedzin nauki i biznesu. Big Data to nic wielkiego. Otaczający go szum z pewnością może cię zmylić. W tym artykule przyjrzymy się, czym są Big Data . Zawiera również przykład, w jaki sposób NetFlix wykorzystał swoje dane, a raczej Big Data , aby lepiej służyć potrzebom swoich klientów.
Czym są duże zbiory danych
Dane leżące na serwerach Twojej firmy były do wczoraj tylko danymi – posortowanymi i zarchiwizowanymi. Nagle spopularyzował się slang Big Data , a teraz dane w Twojej firmie to Big Data . Termin ten obejmuje każdy element danych przechowywany do tej pory przez Twoją organizację. Obejmuje dane przechowywane w chmurach, a nawet adresy URL dodane(URLs) do zakładek. Twoja firma mogła nie zdigitalizować wszystkich danych. Być może nie masz jeszcze uporządkowanych wszystkich danych. Ale wtedy wszystkie cyfrowe, papierowe, ustrukturyzowane i nieustrukturyzowane dane w Twojej firmie to teraz Big Data .
Krótko mówiąc, wszystkie dane – niezależnie od tego, czy są skategoryzowane, czy nie – obecne na Twoich serwerach są zbiorczo nazywane BIG DATA . Wszystkie te dane można wykorzystać do uzyskania różnych wyników przy użyciu różnych rodzajów analiz. Nie jest konieczne, aby wszystkie analizy wykorzystywały wszystkie dane. Różne analizy wykorzystują różne części BIG DATA , aby uzyskać niezbędne wyniki i przewidywania.
Big Data to zasadniczo dane, które analizujesz pod kątem wyników, które możesz wykorzystać do prognoz i innych zastosowań. Używając terminu Big Data , nagle Twoja firma lub organizacja pracuje z technologią informacyjną(Information) najwyższego poziomu , aby wywnioskować różne typy wyników przy użyciu tych samych danych, które celowo lub nieumyślnie przechowywałeś przez lata.
Jak duże są Big Data
Zasadniczo wszystkie połączone dane to Big Data , ale wielu badaczy zgadza się, że Big Data – jako taka – nie może być manipulowana za pomocą zwykłych arkuszy kalkulacyjnych i zwykłych narzędzi do zarządzania bazami danych. Potrzebują specjalnych narzędzi analitycznych, takich jak Hadoop (przeanalizujemy to w osobnym poście), aby wszystkie dane można było analizować za jednym razem (może obejmować iteracje analizy).
W przeciwieństwie do powyższego, choć nie jestem ekspertem w temacie, powiedziałbym, że dane z dowolnej organizacji – dużej czy małej, zorganizowanej czy niezorganizowanej – są dla tej organizacji Big Data i organizacja może wybrać własne narzędzia do analizy dane.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)
Zwykle do analizy danych ludzie tworzyli różne zestawy danych w oparciu o jedno lub więcej wspólnych pól, dzięki czemu analiza staje się łatwa. W przypadku Big Data nie ma potrzeby tworzenia podzbiorów do ich analizy. Mamy teraz narzędzia, które mogą analizować dane niezależnie od ich wielkości. Prawdopodobnie te narzędzia same kategoryzują dane, nawet gdy je analizują.
Uważam, że warto wspomnieć o dwóch zdaniach z książki „Big Data” Jimmy'ego Gutermana(Jimmy Guterman) :
“Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”
-I-
“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”
Widzisz więc, że zarówno objętość, jak i analiza są ważną częścią Big Data .
Przeczytaj(Read) : Co to jest eksploracja danych?(What is Data Mining?)
Koncepcje Big Data
To kolejny punkt, w którym większość ludzi się nie zgadza. Niektórzy eksperci twierdzą, że koncepcje Big Data(Big Data Concepts) to trzy „V”:
- Tom
- Prędkość
- Różnorodność
Niektórzy dodają jeszcze kilka V do koncepcji:
- Wyobrażanie sobie
- Wiarygodność (niezawodność)
- Zmienność i
- Wartość
Koncepcje Big Data omówię(Big Data) w osobnym artykule, ponieważ ten post już się rozkręca. Moim zdaniem pierwsze trzy litery V wystarczą, aby wyjaśnić pojęcie Big Data .
Przykład Big Data – jak NetFlix(Big Data Example – How NetFlix) wykorzystał go do rozwiązania swoich problemów
Pod koniec 2008 roku w NetFlix wystąpiła awaria , przez co wielu klientów pozostało w ciemności. Podczas gdy niektórzy nadal mogli uzyskać dostęp do usług przesyłania strumieniowego, większość z nich nie mogła. Niektórym klientom udało się zdobyć wypożyczone płyty DVD(DVDs) , podczas gdy innym się nie udało. Post na blogu w Wall Street Journal mówi, że Netflix właśnie rozpoczął transmisję strumieniową na żądanie.
Awaria sprawiła, że kierownictwo pomyślało o możliwych przyszłych problemach, a co za tym idzie; zwrócił się do Big Data . Przeanalizował obszary o dużym natężeniu ruchu, podatne punkty i przepustowość sieci itp., korzystając z tych danych i pracował nad tym, aby skrócić czas przestoju, jeśli w przyszłości pojawi się problem, który będzie miał zasięg globalny. Oto link(the link) do bloga Wall Street Journal(Wall Street Journal Blog) , jeśli chcesz zapoznać się z przykładami Big Data .
Powyższe podsumowuje czym jest Big Data w języku laika. Można to nazwać bardzo podstawowym wprowadzeniem. Planuję napisać jeszcze kilka artykułów na temat powiązanych czynników, takich jak – Koncepcje(Concepts) , Analiza(Analysis) , Narzędzia(Tools) , i zastosowania Big Data(uses of Big Data) , Big Data 3 V , itp. Tymczasem, jeśli chciałbyś coś dodać do powyższego, proszę o komentarz i udostępnienie z nami.
Przeczytaj dalej(Read next) : Co to jest pobieranie danych z sieci(Web Scraping) ?
Related posts
Zużycie dużych zbiorów danych. Jakie są zastosowania Big Data.
Co to jest analiza danych i do czego służy
Jaka jest różnica między danymi a informacjami?
Jak zainstalować Drupala za pomocą WAMP w systemie Windows
Najlepsze oprogramowanie i sprzęt Portfele Bitcoin dla Windows, iOS, Android
Czym jest Wyzwanie Niebieski Wieloryb Dare Game
Pole komentarza Disqus nie ładuje się lub nie wyświetla dla strony internetowej
Co to są karty kredytowe z chipem i kodem PIN lub karty kredytowe EMV?
Jak szyfrować i dodawać hasła do dokumentów LibreOffice
10 najlepszych lamp USB LED do laptopów
Co to jest syndrom głupiego okna - wyjaśnienie i zapobieganie
Jak usunąć swoje konto LastPass?
Dziewięć Nostalgic Tech Sounds, których prawdopodobnie nie słyszałeś od lat
Aplikacje OpenGL nie działają na wyświetlaczu bezprzewodowym Miracast w systemie Windows 11/10
Jak tworzyć certyfikaty SSL z podpisem własnym w systemie Windows 11/10?
Automate.io to bezpłatne narzędzie do automatyzacji i alternatywa dla IFTTT
Etykieta wideokonferencji, wskazówki i zasady, których należy przestrzegać
Wystąpił błąd podczas sprawdzania aktualizacji w VLC
Co to jest link Magnet i jak otwierać linki Magnet w przeglądarce
NASA's Eyes pomaga odkrywać Wszechświat niczym astronauci