Encodage et Décodage d'URL

Utilisez notre outil d'encodage d'URL en ligne très pratique pour encoder ou décoder vos données. C'est gratuit !

Encoder au format URL-encodé en Ligne



À propos du Décodage et de l'Encodage d'URL

Bienvenue sur URL Decode et Encode, votre outil en ligne ultime pour encoder et décoder des URL sans effort. Notre plateforme est conçue pour simplifier le processus d'encodage et de décodage d'URL, vous permettant de convertir des données en un format sécurisé pour les URL ou de les ramener à un état lisible par l'homme en un clic.

Qu'est-ce que l'Encodage d'URL ?

L'encodage d'URL, souvent appelé encodage par pourcentage, est un mécanisme crucial utilisé dans la formation des Identifiants de Ressources Uniformes (URI). Bien que couramment connu sous le nom d'encodage d'URL, cette technique s'applique largement dans le cadre des URI, englobant à la fois les Localisateurs de Ressources Uniformes (URLs) et les Noms de Ressources Uniformes (URNs). Elle transforme les caractères en un format qui peut être transmis sur Internet, ce qui est essentiel pour les applications web et la soumission de données dans les requêtes HTTP.

Fonctionnalités et Options Avancées

Notre outil prend en charge plusieurs ensembles de caractères, y compris UTF-8, ASCII et divers formats ISO, garantissant la compatibilité avec vos besoins. Vous pouvez personnaliser :

  • Ensemble de Caractères : Notre site utilise par défaut l'ensemble de caractères UTF-8 pour transmettre vos données d'entrée. Si vous devez convertir vos données dans un autre ensemble de caractères avant l'encodage, vous pouvez ajuster cette option. Gardez à l'esprit que pour les données textuelles, le schéma d'encodage n'inclut pas l'ensemble de caractères.
  • Séparateurs de Nouvelle Ligne : Les systèmes Unix et Windows utilisent des caractères différents pour les sauts de ligne. Avant l'encodage, vos données seront ajustées pour remplacer ces caractères en fonction de l'option sélectionnée. Sélectionnez entre les sauts de ligne Unix (LF) et Windows (CRLF) pour convenir à vos données.
  • Encodage Unique de Chaque Ligne : Les caractères de nouvelle ligne seront également convertis en leurs équivalents encodés par pourcentage. Vous pouvez utiliser cette option si vous souhaitez encoder plusieurs entrées de données séparées par des sauts de ligne.
  • Diviser les lignes en morceaux de 76 caractères : Les données encodées se transformeront en une chaîne continue sans aucun espace. Si vous souhaitez les diviser en plusieurs lignes, assurez-vous de sélectionner cette option. La limite de caractères est définie par la spécification MIME (RFC 2045), qui exige que chaque ligne encodée ne dépasse pas 76 caractères.

Sécurité et Protection

Nous priorisons votre confidentialité. Toutes les communications sont sécurisées par cryptage SSL, et nous ne stockons ni n'inspectons vos données téléchargées. Les données ne sont pas stockées sur nos serveurs. Vos données sont supprimées immédiatement après traitement, garantissant que vos informations restent confidentielles.

Entièrement Gratuit et Convivial

Notre outil de codage et de décodage d'URL est entièrement gratuit. Dites adieu aux installations logicielles compliquées—effectuez vos tâches de codage directement depuis votre navigateur.

Détails du codage d'URL

Types de caractères URI
Dans une URI, les caractères se classent en deux catégories : réservés et non réservés, ainsi que les caractères de pourcentage utilisés pour l'encodage. Les caractères réservés peuvent avoir des significations spéciales ; par exemple, les barres obliques sont utilisées pour séparer différentes sections d'une URL (ou, plus largement, d'une URI). En revanche, les caractères non réservés n'ont aucune signification particulière. Lors de l'utilisation de l'encodage par pourcentage, les caractères réservés sont représentés par des séquences spécifiques. Les définitions des caractères réservés et non réservés, ainsi que les contextes dans lesquels certains caractères réservés sont significatifs, ont évolué avec chaque révision des spécifications qui régulent les URI et les schémas URI.

RFC 3986 section 2.2 Caractères Réservés (janvier 2005)
! * ' ( ) ; : @ & = + $ , / ? # [ ]
RFC 3986 section 2.3 Caractères Non Réservés (janvier 2005)
A B C D E F G F I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 - _ . ~

Caractères Réservés de l'Encodage par Pourcentage

Lorsqu'un caractère de l'ensemble réservé a une signification spécifique dans un certain contexte, il peut devoir être encodé par pourcentage si un schéma URI l'exige à d'autres fins. L'encodage par pourcentage consiste à convertir le caractère en sa valeur de byte ASCII correspondante, puis à exprimer cette valeur sous forme de deux chiffres hexadécimaux, précédés d'un signe de pourcentage ('%'). Pour les caractères non-ASCII, le caractère est généralement converti en sa séquence de bytes UTF-8, chaque byte étant représenté de la même manière.

Par exemple, le caractère réservé '/' sert de délimiteur dans le composant 'path' d'une URI. Si un schéma URI spécifie que '/' doit être inclus dans un segment de chemin, il doit être remplacé par '%2F' (ou '%2f') dans ce segment au lieu d'utiliser le caractère directement.

Caractères Réservés de l'Encodage par Pourcentage
! # $ & ' ( ) * + , / : ; = ? @ [ ]
%21 %23 %24 %26 %27 %28 %29 %2A %2B %2C %2F %3A %3B %3D %3F %40 %5B %5D

Les caractères réservés qui n'ont pas de but spécifique dans un contexte donné peuvent également être encodés par pourcentage, mais ils sont traités de la même manière que les autres caractères en termes de signification.

Par exemple, dans le composant 'query' d'une URI (la partie suivant le caractère '?' ), le caractère '/' est classé comme réservé mais n'a généralement aucune fonction spéciale, sauf si spécifié par un schéma URI particulier. Par conséquent, il n'a pas besoin d'être encodé par pourcentage lorsqu'il n'a pas de but réservé.

Les URI qui diffèrent uniquement en fonction du fait qu'un caractère réservé est encodé par pourcentage ne sont généralement pas considérées comme équivalentes, ce qui signifie qu'elles ne pointent pas vers la même ressource. Cependant, cela ne s'applique que si les caractères réservés en question n'ont pas de but désigné. Les règles spécifiques concernant les caractères réservés sont définies par des schémas URI individuels.

Encodage par Pourcentage des Caractères Non Réservés

Les caractères de l'ensemble non réservé n'ont pas besoin d'être encodés par pourcentage.

Les URI qui ne diffèrent que par le fait qu'un caractère non réservé est encodé par pourcentage sont considérées comme équivalentes par définition. Cependant, en pratique, les processeurs d'URI peuvent ne pas toujours les traiter de la même manière. Par exemple, '%41' doit être traité de la même manière que 'A' (puisque '%41' est l'encodage par pourcentage de 'A'), et '%7E' devrait être équivalent à '~'. Malgré cela, certains systèmes peuvent faire la distinction entre eux. Pour garantir une compatibilité maximale, il est recommandé que les producteurs d'URI évitent d'encoder par pourcentage les caractères non réservés.

Encodage par Pourcentage du Caractère (%)

Le caractère pourcentage ('%') est utilisé pour indiquer des octets encodés par pourcentage, donc lorsque vous devez l'inclure comme donnée dans une URI, il doit être encodé par pourcentage comme '%25'.

Encodage par Pourcentage de Données Arbitraires

De nombreux schémas URI nécessitent la représentation de divers types de données arbitraires, telles que des adresses IP ou des chemins de fichiers, comme parties d'une URI. Bien que les spécifications des schémas URI fournissent idéalement une correspondance claire entre les caractères URI et toutes les valeurs de données possibles, ce n'est souvent pas le cas.

Données Binaires

Suite à la publication de la RFC 1738 en 1994, il a été établi que les schémas permettant la représentation de données binaires dans une URI doivent diviser les données en bytes de 8 bits et encoder chaque byte par pourcentage en conséquence. Par exemple, la valeur byte 0F (en hexadécimal) doit être représentée sous la forme '%0F', tandis que la valeur byte 41 peut être affichée soit comme 'A' soit comme '%41'. En général, il est préférable d'utiliser des caractères non encodés pour les caractères alphanumériques et d'autres caractères non réservés car cela crée des URL plus courtes.

Données de Caractères

La méthode d'encodage par pourcentage des données binaires a souvent été inappropriément étendue aux données basées sur des caractères sans directives claires. Dans les premiers jours du Web, lorsqu'on travaillait avec des caractères de l'ensemble ASCII, on supposait généralement que les caractères et leurs valeurs de byte correspondantes pouvaient être traités de manière interchangeable pour l'encodage par pourcentage. Cette hypothèse était généralement inoffensive à l'époque. Cependant, à mesure que le besoin de représenter des caractères au-delà de la plage ASCII grandissait, les schémas et protocoles URI manquaient souvent de règles standardisées pour préparer les données de caractères pour les URI.

En conséquence, les applications web ont commencé à utiliser divers encodages multi-octets et non compatibles avec ASCII pour l'encodage par pourcentage, ce qui a introduit des ambiguïtés et rendu plus difficile l'interprétation fiable des URI.

Par exemple, de nombreux schémas URI et protocoles basés sur la RFC 1738 et 2396 supposent que les caractères de données seront convertis en bytes en utilisant un encodage non spécifié avant d'être représentés dans une URI comme caractères non réservés ou bytes encodés par pourcentage. Si un schéma ne spécifie pas l'encodage utilisé ou entre en conflit avec l'encodage par pourcentage basé sur ASCII des caractères réservés et non réservés, l'URI devient difficile à interpréter correctement. Certains schémas négligent complètement d'aborder l'encodage, suggérant plutôt que les caractères de données devraient se mapper directement aux caractères URI. Cela laisse aux utilisateurs le soin de déterminer comment encoder par pourcentage les caractères qui ne tombent pas dans les catégories réservées ou non réservées.

Caractères courants après encodage par pourcentage (basé sur ASCII ou UTF-8)
newline space " % - . < > \ ^ _ ` { | } ~
%0A or %0D or %0D%0A %20 %22 %25 %2D %2E %3C %3E %5C %5E %5F %60 %7B %7C %7D %7E

Une Brève Histoire de l'Encodage d'URL

L'encodage d'URL trouve ses racines dans les premiers jours d'Internet, formalisé avec la publication de la RFC 1738 en 1994. Cette spécification a posé les bases de l'encodage de données arbitraires dans un format adapté aux URI, permettant la représentation de caractères spéciaux et garantissant que les données sont transmises correctement. Au fil des ans, à mesure que les normes web évoluaient, les pratiques entourant l'encodage par pourcentage ont également évolué, s'adaptant pour inclure un plus large éventail de caractères et de schémas d'encodage, en particulier avec l'essor des caractères non-ASCII et des encodages multi-octets. Cette évolution a fait de l'encodage d'URL une compétence essentielle pour les développeurs web, garantissant que les données restent intactes et correctement interprétées à travers diverses plateformes et protocoles.