Jak otworzyć naprawdę duży tekst i pliki CSV?

MS Excel może wyświetlić 1 048 576 wierszy. Chociaż może się to wydawać bardzo dużą liczbą w normalnym użytkowaniu, istnieje wiele scenariuszy, w których to nie wystarczy.

Niezależnie od tego, czy przeglądasz pliki dziennika, czy duże zestawy danych, łatwo znajdziesz pliki CSV z milionami wierszy lub ogromnymi plikami tekstowymi. Ponieważ program Excel(Excel) nie obsługuje tak dużych plików, jak dokładnie je otwierasz? Dowiedzmy Się.

Dlaczego zwykłe edytory tekstu(Normal Text Editors) nie mogą otwierać naprawdę dużych plików(Open Really Large Files) ?

Komputer ma gigabajty pamięci, dlaczego więc edytory tekstu nie mogą otwierać dużych plików?

W grę wchodzą tutaj dwa czynniki. Niektóre aplikacje mają ustalony na stałe limit ilości danych, które mogą wyświetlić. Nie ma znaczenia, ile pamięci ma twój komputer, po prostu jej nie użyje.

Druga sprawa to pamięć RAM(RAM) . Wiele edytorów tekstu nie ma sztywnego limitu liczby wierszy, ale nie może wyświetlać dużych plików ze względu na ograniczenia pamięci. Ładują cały plik do systemowej pamięci RAM(RAM) , więc jeśli ta pamięć nie jest wystarczająco duża, proces kończy się niepowodzeniem.

Metoda nr 1: Korzystanie z bezpłatnych edytorów

Najlepszym sposobem na przeglądanie bardzo dużych plików tekstowych jest użycie… edytora tekstu. Nie byle jaki edytor tekstu, ale narzędzia przeznaczone do pisania kodu. Takie aplikacje zazwyczaj bez problemu obsługują duże pliki i są bezpłatne.

Przeglądarka dużych plików tekstowych(Large Text File Viewer) jest prawdopodobnie najprostszą z tych aplikacji. Jest naprawdę łatwy w użyciu, działa szybko i zajmuje bardzo mało zasobów. Jedyny minus? Nie może edytować plików. Ale jeśli chcesz tylko przeglądać duże pliki CSV , jest to najlepsze narzędzie do tego zadania.

Do edycji dużych plików tekstowych również powinieneś wypróbować Emacs . Pierwotnie stworzony dla systemów Unix , działa doskonale również w systemie Windows(Windows) i może obsługiwać duże pliki. Podobnie Neovim i Sublime Text to dwa lekkie IDE(IDEs) , których można używać do otwierania plików tekstowych CSV o rozmiarze gigabajtów.(CSV)

Jeśli wszystko, czego szukasz, to wyszukiwanie danych w dużych plikach dziennika, to klogg jest właśnie narzędziem dla Ciebie. Aktualizujący widelec popularnego glogga(glogg) , aplikacja ta pozwala z łatwością wykonywać złożone operacje wyszukiwania w ogromnych plikach tekstowych. Ponieważ pliki dziennika generowane przez komputer mogą często mieć miliony wierszy, klogg jest zaprojektowany do pracy z plikami o takich rozmiarach bez problemu.

Metoda(Method) #2: Podziel na wiele części(Into Multiple Parts)

Cały problem z próbą otwarcia dużych plików CSV polega na tym, że są one zbyt duże. (CSV)Ale co, jeśli podzielisz je na wiele mniejszych plików?

Jest to popularne rozwiązanie, ponieważ generalnie nie wymaga uczenia się interfejsu nowego edytora tekstu. Zamiast tego możesz użyć jednego z wielu rozdzielaczy CSV dostępnych online(one of the many CSV splitters available online) , aby podzielić duży plik na kilka łatwych do otwarcia plików. Do każdego z tych plików można wtedy normalnie uzyskać dostęp.

Jednak nie jest to najlepszy sposób, aby to zrobić. Dzielenie dużego pliku może często prowadzić do dziwnych literówek lub nieprawidłowo skonfigurowanych plików. Co więcej, otwieranie każdego fragmentu osobno uniemożliwia jednoczesne filtrowanie całych danych.

Metoda #3: Importuj do bazy danych

Pliki tekstowe i .csv, które mają wiele gigabajtów, są zazwyczaj dużymi zestawami danych. Dlaczego więc nie zaimportować ich do bazy danych?

SQL jest obecnie najczęściej używanym językiem znaczników baz danych. W użyciu jest wiele wersji SQL(many versions of SQL) , ale najłatwiejszą jest prawdopodobnie MySQL . I na szczęście możliwe jest przekonwertowanie pliku CSV na tabelę MySQL(convert a CSV file into a MySQL table) .

Nie jest to najłatwiejsza metoda radzenia sobie z dużymi plikami CSV , więc zalecamy ją tylko wtedy, gdy chcesz regularnie zajmować się dużymi zestawami danych. Jeśli MySQL wydaje się zbyt trudny, zawsze możesz zaimportować pliki .csv do MS Access .

Metoda(Method) 4: Analizuj za pomocą bibliotek Pythona(Python)

Kiedy pracujesz z plikiem .csv z milionami wierszy danych, oczywiście nie będziesz w stanie zrozumieć tego ręcznie. Prawdopodobnie chcesz filtrować dane i uruchamiać określone zapytania, aby zrozumieć trendy.

Dlaczego więc nie napisać kodu w Pythonie,(write Python code) który właśnie to zrobi?

Po raz kolejny nie jest to najbardziej przyjazna dla użytkownika metoda. Chociaż Python nie jest najtrudniejszym językiem programowania(Python isn’t the hardest programming language to learn) , jest to kodowanie, więc może nie być dla ciebie najlepszym podejściem. Jeśli jednak będziesz musiał codziennie analizować naprawdę duże pliki CSV , możesz chcieć zautomatyzować zadanie za pomocą kodu Pythona(automate the task with some Python code) .

Metoda nr 5: Z narzędziami premium

Edytory tekstu, które widzieliśmy w pierwszej metodzie, nie były dedykowanymi narzędziami przeznaczonymi do przetwarzania CSV . Były to narzędzia ogólnego przeznaczenia, których można było używać również do pracy z dużymi plikami .csv.

Ale co z aplikacjami specjalistycznymi? Czy nie ma aplikacji, które zostały stworzone, aby rozwiązać ten problem?

Właściwie są. Na przykład CSV Explorer(CSV Explorer) opiera się na tym samym procesie, który opisaliśmy w dwóch ostatnich metodach ( baza danych SQL i kod Pythona(Python) ), aby stworzyć aplikację zdolną do przeglądania i edycji plików CSV o dowolnym rozmiarze. (CSV)Możesz zrobić wszystko, czego oczekujesz od narzędzia arkusza kalkulacyjnego, na przykład tworzyć wykresy lub filtrować dane w CSV Explorer .

Inną opcją jest UltraEdit . W przeciwieństwie do poprzedniego narzędzia, dotyczy to nie tylko plików .csv, ale dowolnego typu pliku tekstowego. Może z łatwością obsługiwać pliki tekstowe i CSV o wielkości do kilku gigabajtów, z interfejsem podobnym do wielu darmowych edytorów, o których mówiliśmy wcześniej. 

Jedyną wadą tych narzędzi jest to, że są to aplikacje premium, wymagające uzyskania płatnej licencji, aby móc z nich korzystać. Zawsze możesz wypróbować ich bezpłatne wersje próbne, aby sprawdzić ich funkcje, lub jeśli masz tylko jednorazowe użycie.

Jaki jest najlepszy sposób otwierania dużych plików tekstowych(Large Text) i CSV(CSV Files) ?

W dobie Big Data często zdarza się, że natrafia się na pliki tekstowe zajmujące gigabajty, które mogą być trudne do wyświetlenia za pomocą wbudowanych narzędzi, takich jak Notatnik(Notepad) lub MS Excel . Aby móc otwierać tak duże pliki CSV , musisz pobrać i używać aplikacji innej firmy.

Jeśli chcesz tylko przeglądać takie pliki, przeglądarka plików tekstowych(Large Text File Viewer) jest dla Ciebie najlepszym wyborem. Aby je edytować, możesz wypróbować bogaty w funkcje edytor tekstu, taki jak Emacs , lub skorzystać z narzędzia premium, takiego jak CSV Explorer .

Techniki takie jak dzielenie pliku CSV lub importowanie go do bazy danych obejmują zbyt wiele kroków. Lepiej jest uzyskać płatną licencję na dedykowane narzędzie premium, jeśli dużo pracujesz z dużymi plikami tekstowymi.



About the author

Jestem informatykiem z ponad 10-letnim doświadczeniem. W wolnym czasie lubię pomagać przy biurku i uczyć dzieci korzystania z Internetu. Moje umiejętności obejmują wiele rzeczy, ale najważniejsze jest to, że wiem, jak pomagać ludziom w rozwiązywaniu problemów. Jeśli potrzebujesz kogoś, kto pomoże Ci w pilnej sprawie lub po prostu potrzebujesz podstawowych wskazówek, skontaktuj się ze mną!



Related posts