Enencoding de caractères Exdom Mainlog

Dans mon installation de l'exim4, je continue d'avoir à la fois codé UTF-8 codé et étendu le journal principal codé ANSI contenant des strings comme "tämä" (correctement dans UTF-8) et "t \ xe4 \ m \ xe4" (ANSI). Ce dernier échappe aux marques sont des codes d'un octet, échappant à la clarté ("tämä" codé en 74 EC 6D EC en octets). La valeur par défaut d'aujourd'hui, bien sûr, est UTF-8 et la plupart des lignes sont correctes.

Le problème est que cela confond fail2ban parce qu'il s'attend à ce que le file journal soit encodé de manière cohérente. Je ne peux cependant pas sélectionner ANSI ou UTF-8 car les deux enencodings existent dans le file journal.

Je me request s'il existe un moyen de filterr les caractères ANSI avant d'save les strings dans / var / log / exim / mainlog?

En ce qui concerne le coupable, il pourrait s'agir d'un ancien logiciel de spam sur une machine Windows ou une ancienne application de messagerie de masse. Quoi qu'il en soit, environ 35 à 45% des lignes logarithmiques semblent être contaminées par ANSI quotidiennement.

  • L'enencoding Utf-8 pour PHP-scripts crée "les en-têtes déjà envoyés"
  • `less 'ne peut pas afficher de caractères spéciaux
  • Conversion des noms de fichiers UTF-8 NFD en UTF-8 NFC, soit en rsync, soit en AFPD
  • Proxy HTTP pour traiter différents enencodings
  • La vitesse d'écriture / lecture est-elle affectée par le nom des files?
  • Logique CygWin SSHD et UTF-8
  • re: UTF-8, PHP et XML Mysql
  • Puis-je convertir ma database / script en UTF-8?
  • Comment interdire les noms de files non UTF-8?
  • La page de code UnrealIRCD n'existe pas?
  • Comment faire pour que la commande "moins" gère UTF-8?
  • Les astuces du serveur de linux et windows, tels que ubuntu, centos, apache, nginx, debian et des sujets de rĂ©seau.