Publié le 22 février 2026 18:18:00. La nouvelle version 5.4 de l’outil de traitement de texte GNU Awk, très utilisé dans le monde de l’informatique, apporte des améliorations significatives en termes de performance et de compatibilité, notamment grâce à l’adoption d’un nouveau moteur d’expressions régulières.
- Gawk 5.4 intègre désormais le moteur d’expressions régulières MinRX par défaut, offrant une meilleure conformité aux normes POSIX.
- La lecture des fichiers disque classiques est optimisée, avec un gain de vitesse d’environ 9 %.
- La prise en charge du codage UTF-8 est améliorée pour les systèmes Windows MinGW et Cygwin.
Les développeurs de GNU Awk ont annoncé la sortie de la version 5.4 de leur outil, un utilitaire puissant pour la manipulation de texte. Cette nouvelle itération se distingue par l’adoption du moteur d’expressions régulières MinRX, conçu par Mike Haertel, l’architecte original de GNU grep. Contrairement aux moteurs existants, MinRX est entièrement conforme à la norme POSIX, garantissant une plus grande compatibilité et prévisibilité.
Outre cette modification majeure, Gawk 5.4 présente des gains de performance notables. En supprimant les vérifications de délais d’attente lors de la lecture de fichiers, les utilisateurs peuvent constater une amélioration de la vitesse d’environ 9 % lors du traitement de fichiers volumineux. Cette optimisation est particulièrement bienvenue pour les tâches nécessitant le traitement de grandes quantités de données.
La compatibilité avec les différents systèmes d’exploitation est également renforcée. Gawk 5.4 améliore la prise en charge du codage UTF-8 pour les ports Windows MinGW, permettant une gestion plus fluide des textes non-ASCII. Le port Cygwin bénéficie également d’une prise en charge complète de l’UTF-8.
D’autres améliorations techniques incluent une gestion optimisée de la mémoire persistante, la prise en charge des caractères multi-octets via l’extension ordchr, et des mises à jour pour assurer la conformité aux spécifications POSIX 2024. Les assertions dans le code C ont été activées, et le support BSD a été amélioré. Une nouvelle option de compilation, « –enable-o3 », permet d’utiliser les optimisations du compilateur -O3 pour une performance accrue.
Cette version marque également une première pour Gawk, avec l’ajout de traductions en arabe. De plus, la documentation a été mise à jour pour interdire explicitement les attaques personnelles sur les listes de diffusion et décourager la discussion de logiciels propriétaires.
Enfin, Gawk 5.4 apporte des améliorations à la prise en charge du système d’exploitation OpenVMS.
Téléchargements et plus de détails sur la version Gawk 5.4 d’aujourd’hui via GNU.org.