MS Excel peut afficher 1 048 576 lignes. Bien que cela puisse sembler être un très grand nombre dans une utilisation normale, il existe de nombreux scénarios où cela ne suffit pas.
Que vous consultiez des fichiers journaux ou de grands ensembles de données, il est facile de trouver des fichiers CSV avec des millions de lignes ou d'énormes fichiers texte. Étant donné qu'Excel ne peut pas prendre en charge des fichiers aussi volumineux, comment les ouvrez-vous exactement ? Découvrons-le.
Pourquoi les éditeurs de texte normaux ne peuvent-ils pas ouvrir des fichiers très volumineux ?
Un ordinateur a des gigaoctets de stockage, alors pourquoi les éditeurs de texte ne peuvent-ils pas ouvrir des fichiers volumineux ?
Il y a deux facteurs en jeu ici. Certaines applications ont une limite codée en dur sur la quantité de données qu'elles peuvent afficher. Peu importe la quantité de mémoire dont dispose votre PC, ils ne l'utiliseront tout simplement pas.
Le deuxième problème est la RAM. De nombreux éditeurs de texte n'ont pas de limite stricte sur le nombre de lignes, mais ne peuvent pas afficher de fichiers volumineux en raison de limitations de mémoire. Ils chargent le fichier entier dans la RAM du système, donc si cette mémoire n'est pas assez grande, le processus échoue.
Méthode #1 : Utiliser des éditeurs gratuits
La meilleure façon de visualiser des fichiers texte extrêmement volumineux est d'utiliser… un éditeur de texte. Pas n'importe quel éditeur de texte, mais les outils destinés à écrire du code. Ces applications peuvent généralement gérer des fichiers volumineux sans accroc et sont gratuites.
Large Text File Viewer est probablement la plus simple de ces applications. Il est vraiment facile à utiliser, fonctionne rapidement et a une très faible empreinte de ressources. Le seul bémol ? Il ne peut pas modifier les fichiers. Mais si vous souhaitez uniquement afficher de gros fichiers CSV, c'est sans conteste le meilleur outil pour le travail.
Pour éditer également de gros fichiers texte, vous devriez essayer Emacs . Créé à l'origine pour les systèmes Unix, il fonctionne également parfaitement sous Windows et peut gérer des fichiers volumineux. De même, Neovim et Sublime Text sont deux IDE légers qui peuvent être utilisés pour ouvrir des fichiers texte CSV de la taille d'un gigaoctet.
Si tout ce que vous cherchez est de rechercher des données dans de gros fichiers journaux, alors klogg est l'outil qu'il vous faut. Un fork de mise à jour du populaire glogg , cette application vous permet d'effectuer facilement des opérations de recherche complexes à travers d'énormes fichiers texte. Étant donné que les fichiers journaux générés par ordinateur peuvent souvent contenir des millions de lignes, klogg est conçu pour fonctionner avec de telles tailles de fichiers sans problème.
Méthode n ° 2 : Diviser en plusieurs parties
Tout le problème d'essayer d'ouvrir de gros fichiers CSV est qu'ils sont trop volumineux. Mais que se passerait-il si vous deviez les diviser en plusieurs fichiers plus petits ?
C'est une solution populaire, car elle n'implique généralement pas d'apprendre l'interface d'un nouvel éditeur de texte. Au lieu de cela, vous pouvez utiliser l'un des nombreux séparateurs CSV disponibles en ligne pour diviser le gros fichier en plusieurs fichiers faciles à ouvrir. Chacun de ces fichiers est alors accessible normalement.
Cependant, ce n'est pas la meilleure façon de procéder. Le fractionnement d'un fichier volumineux peut souvent entraîner des fautes de frappe étranges ou des fichiers mal configurés. De plus, l'ouverture de chaque bloc séparément vous empêche de filtrer l'ensemble des données à la fois.
Méthode #3 : Importer dans une base de données
Les fichiers texte et .csv s'étendant sur plusieurs gigaoctets sont généralement de grands ensembles de données. Alors pourquoi ne pas simplement les importer dans une base de données ?
SQL est le langage de balisage de base de données le plus couramment utilisé de nos jours. Il existe de nombreuses versions de SQL , mais la plus simple est probablement MySQL. Et comme par hasard, il est possible de convertir un fichier CSV en une table MySQL .
Ce n'est en aucun cas la méthode la plus simple pour traiter les fichiers CSV volumineux, nous ne la recommandons donc que si vous souhaitez traiter régulièrement de grands ensembles de données. Si MySQL semble trop difficile, vous pouvez toujours importer vos fichiers .csv vers MS Access à la place.
Méthode #4 : Analyser avec les bibliothèques Python
Lorsque vous travaillez avec un fichier .csv contenant des millions de lignes de données, vous ne pourrez évidemment pas le comprendre manuellement. Vous souhaitez probablement filtrer les données et exécuter des requêtes spécifiques pour comprendre les tendances.
Alors pourquoi ne pas écrire du code Python pour faire exactement cela ?
Encore une fois, ce n'est pas la méthode la plus conviviale. Bien que Python ne soit pas le langage de programmation le plus difficile à apprendre , il s'agit de codage, donc ce n'est peut-être pas la meilleure approche pour vous. Néanmoins, si vous devez analyser quotidiennement des fichiers CSV très volumineux, vous pouvez automatiser la tâche avec du code Python .
Méthode #5 : Avec des outils premium
Les éditeurs de texte que nous avons vus dans la première méthode n'étaient pas des outils dédiés au traitement CSV. Il s'agissait d'outils à usage général qui pouvaient également être utilisés pour travailler avec de gros fichiers .csv.
Mais qu'en est-il des applications spécialisées ? N'y a-t-il pas d'applications créées pour résoudre ce problème ?
Il y en a, en fait. CSV Explorer , par exemple, s'appuie sur le processus même que nous avons décrit dans les deux dernières méthodes (base de données SQL et code Python) pour créer une application capable de visualiser et de modifier des fichiers CSV de n'importe quelle taille. Vous pouvez faire tout ce que vous attendez d'un tableur, comme créer des graphiques ou filtrer les données dans CSV Explorer.
Une autre option est UltraEdit . Contrairement à l'outil précédent, cela ne s'applique pas seulement aux fichiers .csv, mais à tout type de fichier texte. Il peut facilement gérer des fichiers texte et CSV allant jusqu'à quelques gigaoctets, avec une interface similaire à la plupart des éditeurs gratuits dont nous avons parlé plus tôt.
Le seul inconvénient de ces outils est qu'il s'agit d'applications premium, vous obligeant à obtenir une licence payante pour pouvoir les utiliser. Vous pouvez toujours essayer leurs versions d'essai gratuites pour découvrir leurs fonctionnalités, ou si vous n'avez qu'une seule utilisation.
Quel est le meilleur moyen d'ouvrir des fichiers texte et CSV volumineux ?
À l'ère du Big Data, il n'est pas rare de rencontrer des fichiers texte de plusieurs gigaoctets, qui peuvent même être difficiles à visualiser avec des outils intégrés tels que le Bloc-notes ou MS Excel. Pour pouvoir ouvrir des fichiers CSV aussi volumineux, vous devez télécharger et utiliser une application tierce.
Si tout ce que vous voulez, c'est voir de tels fichiers, alors Large Text File Viewer est le meilleur choix pour vous. Pour les éditer, vous pouvez essayer un éditeur de texte riche en fonctionnalités comme Emacs, ou opter pour un outil premium comme CSV Explorer.
Des techniques telles que la division du fichier CSV ou son importation dans une base de données impliquent tout simplement trop d'étapes. Vous feriez mieux d'obtenir une licence payante d'un outil premium dédié si vous travaillez beaucoup avec d'énormes fichiers texte.