mirror of
https://github.com/adambard/learnxinyminutes-docs.git
synced 2024-11-29 11:22:14 +03:00
403 lines
14 KiB
Markdown
403 lines
14 KiB
Markdown
---
|
||
category: tool
|
||
tool: awk
|
||
filename: learnawk-fr.awk
|
||
contributors:
|
||
- ["Marshall Mason", "http://github.com/marshallmason"]
|
||
translators:
|
||
- ["GannonTdW", "https://github.com/GannonTdW"]
|
||
lang: fr-fr
|
||
|
||
---
|
||
|
||
AWK est un outil standard présent dans chaque système UNIX conforme aux normes
|
||
POSIX. C’est un outil en ligne de commande qui ressemble au Perl et qui est
|
||
excellent dans les tâches de traitement de fichiers texte.
|
||
Vous pouvez l’appeler à partir d’un script shell, ou l’utiliser comme un langage
|
||
de script autonome.
|
||
|
||
Pourquoi utiliser AWK au lieu du langage Perl ?
|
||
Principalement, car AWK fait partie d'UNIX et est donc présent par défaut sur
|
||
une très grande partie des systèmes d'exploitation UNIX et Linux.
|
||
AWK est aussi plus facile à lire que le langage Perl ; et est l'outil idéal pour
|
||
ce qui concerne le traitement de texte simple. Notamment le traitement de ceux
|
||
qui nécessitent de lire des fichiers ligne par ligne ; chaque ligne comportant
|
||
des champs séparés par des délimiteur.
|
||
|
||
```awk
|
||
#!/usr/bin/awk -f
|
||
|
||
# Les commentaires commencent par un #
|
||
|
||
# Les programmes AWK consistent en une collection de règles et d'actions.
|
||
règle1 { action; }
|
||
règle2 { action; }
|
||
|
||
# AWK lit et analyse automatiquement chaque ligne de chaque fichier fourni.
|
||
# Chaque ligne est divisée par un délimiteur FS qui est par défaut l'espace
|
||
# (plusieurs espaces ou une tabulation comptent pour un espace). Ce délimiteur
|
||
# peut être changé grâce à l'option -F ou être renseigné au début d'un bloc
|
||
# (exemple: FS = " ").
|
||
|
||
# BEGIN est une règle spécifique exécutée au début du programme. C'est à cet
|
||
# endroit que vous mettrez tout le code à exécuter avant de traiter les fichiers
|
||
# texte. Si vous ne disposez pas de fichiers texte, considérez BEGIN comme le
|
||
# point d’entrée principal du script.
|
||
# À l'opposé de BEGIN, il existe la règle END. Cette règle est présente après
|
||
# chaque fin de fichier (EOF : End Of File).
|
||
|
||
BEGIN {
|
||
|
||
# Les variables sont globales. Pas besoin de les déclarer.
|
||
count = 0;
|
||
|
||
# Les opérateurs sont identiques au langage C et aux langages similaires
|
||
# (tels que C#, C++, etc.)
|
||
a = count + 1; # addition
|
||
b = count - 1; # soustraction
|
||
c = count * 1; # multiplication
|
||
d = count / 1; # division entière
|
||
e = count % 1; # modulo, reste de la division entière
|
||
f = count ^ 1; # exponentiel
|
||
|
||
a += 1;
|
||
b -= 1;
|
||
c *= 1;
|
||
d /= 1;
|
||
e %= 1;
|
||
f ^= 1;
|
||
|
||
# Incrémenter et décrémenter par un
|
||
a++;
|
||
b--;
|
||
|
||
# En tant qu'opérateur préfixé, c'est la valeur incrémentée qui
|
||
# est retournée
|
||
++a;
|
||
--b;
|
||
|
||
# Instruction de contrôle
|
||
if (conteur == 0)
|
||
print "Nombre de départ 0";
|
||
else
|
||
print "Hein?";
|
||
|
||
# Vous pouvez aussi utiliser l'opérateur ternaire
|
||
print (compteur == 0) ? "Nombre de départ 0" : "Hein?";
|
||
|
||
# Les blocs sont composés d'une multitude de lignes entre accolades
|
||
while (a < 10) {
|
||
print "La concaténation de chaînes de caractères" " se fait avec"
|
||
"des séries de chaînes " "séparées par des espaces";
|
||
print a;
|
||
|
||
a++;
|
||
}
|
||
|
||
for (i = 0; i < 10; i++)
|
||
print "le bon vieux for pour les boucles";
|
||
|
||
# Les opérateurs de comparaison sont standard
|
||
# a < b # plus petit que
|
||
# a <= b # plus petit ou égale à
|
||
# a != b # non égale
|
||
# a == b # égale
|
||
# a > b # Plus grand que
|
||
# a >= b # Plus grand ou égale à
|
||
|
||
# Les opérateurs logiques sont
|
||
# a && b # ET
|
||
# a || b # OU
|
||
|
||
# En plus, il y a les expressions régulières
|
||
if ("foo" ~ "^fo+$")
|
||
print "Fooey!";
|
||
if ("boo" !~ "^fo+$")
|
||
print "Boo!";
|
||
|
||
# Les Tableaux
|
||
arr[0] = "foo";
|
||
arr[1] = "bar";
|
||
|
||
# Vous pouvez aussi initialiser un tableau avec la fonction split()
|
||
n = split("foo:bar:baz", arr, ":");
|
||
|
||
# Il y a aussi les tableaux associatifs
|
||
assoc["foo"] = "bar";
|
||
assoc["bar"] = "baz";
|
||
|
||
# et les tableaux multi-dimensions, avec certaines limitations que l'on ne
|
||
# mentionnera pas ici
|
||
multidim[0,0] = "foo";
|
||
multidim[0,1] = "bar";
|
||
multidim[1,0] = "baz";
|
||
multidim[1,1] = "boo";
|
||
|
||
# Vous pouvez tester l'appartenance à un tableau
|
||
if ("foo" in assoc)
|
||
print "Fooey!";
|
||
|
||
# Vous pouvez aussi utilisez l'opérateur 'in' pour parcourir les clés
|
||
# d'un tableau
|
||
for (key in assoc)
|
||
print assoc[key];
|
||
|
||
# La ligne de commande est dans un tableau spécifique appelé ARGV
|
||
for (argnum in ARGV)
|
||
print ARGV[argnum];
|
||
|
||
# Vous pouvez supprimer des éléments d'un tableau.
|
||
# C'est utile pour empêcher AWK de supposer que certains arguments soient
|
||
# des fichiers à traiter.
|
||
delete ARGV[1];
|
||
|
||
# Le nombre d'arguments de la ligne de commande est assigné à
|
||
# la variable ARGC
|
||
print ARGC;
|
||
|
||
# AWK inclue trois catégories de fonction. On les examinera plus tard.
|
||
return_value = arithmetic_functions(a, b, c);
|
||
string_functions();
|
||
io_functions();
|
||
}
|
||
|
||
# Voici comment définir une fonction
|
||
function arithmetic_functions(a, b, c, d) {
|
||
|
||
# La partie la plus ennuyeuse de AWK est probablement l’absence de variables
|
||
# locales. Tout est global. Pour les scripts courts, c'est très utile, mais
|
||
# pour les scripts plus longs, cela peut poser un problème.
|
||
|
||
# Il y a cependant une solution de contournement (enfin ... une bidouille).
|
||
# Les arguments d'une fonction sont locaux à cette fonction.
|
||
# Et AWK vous permet de définir plus d'arguments à la fonction que
|
||
# nécessaire. Il suffit donc de mettre une variable locale dans la
|
||
# déclaration de fonction, comme ci-dessus. La convention veut que vous
|
||
# mettiez quelques espaces supplémentaires pour faire la distinction entre
|
||
# les paramètres réels et les variables locales.
|
||
# Dans cet exemple, a, b et c sont des paramètres réels, alors que d est
|
||
# simplement une variable locale.
|
||
|
||
# Maintenant, les fonctions arithmétiques
|
||
|
||
# La plupart des implémentations de AWK ont des fonctions trigonométriques
|
||
# standards
|
||
localvar = sin(a);
|
||
localvar = cos(a);
|
||
localvar = atan2(b, a); # arc tangente de b / a
|
||
|
||
# Les exponentiels et logarithmes décimaux sont aussi là
|
||
localvar = exp(a);
|
||
localvar = log(a);
|
||
|
||
# Les racines carrées
|
||
localvar = sqrt(a);
|
||
|
||
# Tronquer un nombre décimal en nombre entier
|
||
localvar = int(5.34); # localvar => 5
|
||
|
||
# Les nombres aléatoires
|
||
srand();
|
||
# L'argument de la fonction srand() est la valeur de départ pour générer
|
||
# les nombres aléatoires . Par défaut, il utilise l'heure du système
|
||
|
||
localvar = rand(); # Nombre aléatoire entre 0 et 1.
|
||
|
||
# Maintenant on retourne la valeur
|
||
return localvar;
|
||
}
|
||
|
||
function string_functions( localvar, arr) {
|
||
|
||
# AWK a plusieurs fonctions pour le traitement des chaînes de caractères,
|
||
# dont beaucoup reposent sur des expressions régulières.
|
||
|
||
# Chercher et remplacer, la première occurrence (sub), ou toutes les
|
||
# occurrences (gsub).
|
||
# Les deux renvoient le nombre de correspondances remplacées
|
||
localvar = "fooooobar";
|
||
sub("fo+", "Meet me at the ", localvar); # localvar => "Meet me at the bar"
|
||
gsub("e", ".", localvar); # localvar => "M..t m. at th. bar"
|
||
|
||
# Rechercher une chaîne de caractères qui correspond à une expression
|
||
# régulière index() fait la même chose, mais n'autorise pas les expressions
|
||
# régulières.
|
||
match(localvar, "t"); # => 4, puisque 't' est le quatrième caractère
|
||
|
||
# Séparer par un délimiteur
|
||
n = split("foo-bar-baz", arr, "-");
|
||
# résultat : a[1] = "foo"; a[2] = "bar"; a[3] = "baz"; n = 3
|
||
|
||
# Autre astuces utiles
|
||
sprintf("%s %d %d %d", "Testing", 1, 2, 3); # => "Testing 1 2 3"
|
||
substr("foobar", 2, 3); # => "oob"
|
||
substr("foobar", 4); # => "bar"
|
||
length("foo"); # => 3
|
||
tolower("FOO"); # => "foo"
|
||
toupper("foo"); # => "FOO"
|
||
}
|
||
|
||
function io_functions( localvar) {
|
||
|
||
# Vous avez déjà vu print
|
||
print "Hello world";
|
||
|
||
# Mais il y a aussi printf
|
||
printf("%s %d %d %d\n", "Testing", 1, 2, 3);
|
||
|
||
# AWK n'a pas de descripteur de fichier en soi. Il ouvrira automatiquement
|
||
# un descripteur de fichier lorsque vous utilisez quelque chose qui en a
|
||
# besoin. La chaîne de caractères que vous avez utilisée pour cela peut être
|
||
# traitée comme un descripteur de fichier à des fins d'entrée / sortie.
|
||
outfile = "/tmp/foobar.txt";
|
||
print "foobar" > outfile;
|
||
|
||
# Maintenant, la chaîne de caractères "outfile" est un descripteur de
|
||
# fichier. Vous pouvez le fermer.
|
||
close(outfile);
|
||
|
||
# Voici comment exécuter quelque chose dans le shell
|
||
system("echo foobar"); # => affiche foobar
|
||
|
||
# Lire quelque chose depuis l'entrée standard et la stocker dans une
|
||
# variable locale
|
||
getline localvar;
|
||
|
||
# Lire quelque chose à partir d'un pipe (encore une fois, utilisez une
|
||
# chaîne de caractère que vous fermerez proprement)
|
||
"echo foobar" | getline localvar # localvar => "foobar"
|
||
close("echo foobar")
|
||
|
||
# Lire une ligne d'un fichier et la stocker dans une variable locale
|
||
infile = "/tmp/foobar.txt";
|
||
getline localvar < infile;
|
||
close(infile);
|
||
}
|
||
|
||
# Comme dit au début, AWK consiste en une collection de règles et d'actions.
|
||
# Vous connaissez déjà les règles BEGIN et END. Les autres règles ne sont
|
||
# utilisées que si vous traitez des lignes à partir de fichiers ou l'entrée
|
||
# standard (stdin).
|
||
# Quand vous passez des arguments à AWK, ils sont considérés comme des noms de
|
||
# fichiers à traiter. AWK les traitera tous dans l'ordre. Voyez les comme dans
|
||
# une boucle implicite, parcourant les lignes de ces fichiers. Ces règles et ces
|
||
# actions ressemblent à des instructions switch dans la boucle.
|
||
|
||
/^fo+bar$/ {
|
||
|
||
# Cette action sera exécutée pour chaque ligne qui correspond à l'expression
|
||
# régulière, /^fo+bar$/, et sera ignorée pour toute ligne qui n'y correspond
|
||
# pas. Imprimons simplement la ligne :
|
||
|
||
print;
|
||
|
||
# Pas d'argument ! C'est parce que print a un défaut : $0.
|
||
# $0 est le nom de la ligne en cours de traitement. Il est créé
|
||
# automatiquement.
|
||
|
||
# Vous devinez probablement qu'il existe d'autres variables $.
|
||
# Chaque ligne est divisée implicitement avant que chaque action soit
|
||
# exécutée, comme le fait le shell. Et, comme le shell, chaque champ est
|
||
# accessible avec un signe dollar.
|
||
|
||
# Ceci affichera les deuxième et quatrième champs de la ligne.
|
||
print $2, $4;
|
||
|
||
# AWK défini automatiquement beaucoup d'autres variables qui peuvent vous
|
||
# aider à inspecter et traiter chaque ligne. La plus importante est NF.
|
||
|
||
# Affiche le nombre de champs de la ligne
|
||
print NF;
|
||
|
||
# Afficher le dernier champ de la ligne
|
||
print $NF;
|
||
}
|
||
|
||
# Chaque règle est en réalité un test conditionnel.
|
||
a > 0 {
|
||
# Ceci s’exécutera une fois pour chaque ligne, tant que le test est positif
|
||
}
|
||
|
||
# Les expressions régulières sont également des tests conditionnels.
|
||
# Si le test de l'expression régulières n'est pas vrais alors le bloc
|
||
# n'est pas exécuté.
|
||
$0 /^fobar/ {
|
||
print "la ligne commence par foobar"
|
||
}
|
||
|
||
# Dans le cas où vous voulez tester votre chaîne de caractères sur la ligne
|
||
# en cours de traitement $0 est optionnelle.
|
||
/^[a-zA-Z0-9]$/ {
|
||
print "La ligne courante ne contient que des caractères alphanumériques.";
|
||
}
|
||
|
||
# AWK peut parcourir un fichier texte ligne par ligne et exécuter des actions en
|
||
# fonction de règles établies. Cela est si courant sous UNIX qu'AWK est un
|
||
# langage de script.
|
||
|
||
# Ce qui suit est un exemple rapide d'un petit script, pour lequel AWK est
|
||
# parfait. Le script lit un nom à partir de l'entrée standard, puis affiche
|
||
# l'âge moyen de toutes les personnes portant ce prénom.
|
||
# Supposons que vous fournissiez comme argument le nom d'un fichier comportant
|
||
# ces données :
|
||
#
|
||
# Bob Jones 32
|
||
# Jane Doe 22
|
||
# Steve Stevens 83
|
||
# Bob Smith 29
|
||
# Bob Barker 72
|
||
#
|
||
# Le script est le suivant :
|
||
|
||
BEGIN {
|
||
|
||
# Premièrement, on demande à l'utilisateur le prénom voulu
|
||
print "Pour quel prénom voudriez vous savoir l'age moyen ?";
|
||
|
||
# On récupère la ligne à partir de l'entrée standard, pas de la ligne
|
||
# de commande :
|
||
getline name < "/dev/stdin";
|
||
}
|
||
|
||
# Maintenant, pour chaque ligne dont le premier champ est le prénom donné
|
||
$1 == name {
|
||
|
||
# Ici, nous avons accès à un certain nombre de variables utiles déjà
|
||
# préchargées :
|
||
# $0 est la ligne entière
|
||
# $3 est le troisième champ. Ici il correspond à l'age qui nous intéresse
|
||
# NF est le nombre de champs et vaut 3
|
||
# NR est le nombre d'enregistrements (lignes) vus jusqu'à présent
|
||
# FILENAME est le nom du fichier en cours de traitement
|
||
# FS est séparateur de champs, ici c'est " " (un espace)
|
||
# ...etc. Et beaucoup d'autre que vous pouvez connaître dans le manuel de
|
||
# man. Pour cela exécutez "man awk" dans votre terminal.
|
||
|
||
# Garder une trace du total accumulé et du nombre de lignes correspondant.
|
||
sum += $3;
|
||
nlines++;
|
||
}
|
||
|
||
# Un autre motif spécial est END. Il fonctionnera après le traitement de tous
|
||
# les fichiers texte. Contrairement à BEGIN, il ne fonctionne que si vous lui
|
||
# donnez une entrée à traiter. Il sera exécuté une fois que tous les fichiers
|
||
# auront été lus et traités conformément aux règles et aux actions que vous
|
||
# avez fournies. Le but est généralement de produire un rapport final, ou de
|
||
# faire quelque chose avec l'ensemble des données que vous avez accumulées
|
||
# au cours du script.
|
||
|
||
|
||
END {
|
||
if (nlines)
|
||
print "L'age moyen pour le prénom " name " est " sum / nlines;
|
||
}
|
||
```
|
||
|
||
Pour plus d'informations :
|
||
|
||
* [Awk tutorial](http://www.grymoire.com/Unix/Awk.html)
|
||
* [Awk man page](https://linux.die.net/man/1/awk)
|
||
* [The GNU Awk User's Guide](https://www.gnu.org/software/gawk/manual/gawk.html)
|
||
GNU Awk est dans la majorité des systèmes Linux.
|
||
* [AWK one-liner collection](http://tuxgraphics.org/~guido/scripts/awk-one-liner.html)
|