Online in das URL-codierte Format codieren
Über URL Dekodierung und Kodierung
Willkommen bei URL Dekodierung und Kodierung, Ihrem ultimativen Online-Tool zum mühelosen Codieren und Dekodieren von URLs. Unsere Plattform ist darauf ausgelegt, den Prozess der URL-Codierung und -Dekodierung zu vereinfachen, sodass Sie Daten in ein URL-sicheres Format konvertieren oder mit nur einem Klick in einen menschenlesbaren Zustand zurückkehren können.
Was ist URL-Codierung?
URL-Codierung, oft als Prozent-Codierung bezeichnet, ist ein entscheidender Mechanismus, der bei der Bildung von Uniform Resource Identifiers (URIs) verwendet wird. Obwohl allgemein als URL-Codierung bekannt, gilt diese Technik im URI-Rahmen weitreichend und umfasst sowohl Uniform Resource Locators (URLs) als auch Uniform Resource Names (URNs). Sie verwandelt Zeichen in ein Format, das über das Internet übertragen werden kann, was sie für Webanwendungen und die Datenübermittlung in HTTP-Anfragen unverzichtbar macht.
Funktionen und erweiterte Optionen
Unser Tool unterstützt mehrere Zeichencodierungen, einschließlich UTF-8, ASCII und verschiedenen ISO-Formaten, um die Kompatibilität mit Ihren Anforderungen sicherzustellen. Sie können anpassen:
- Zeichensatz: Unsere Website verwendet standardmäßig den UTF-8-Zeichensatz für die Übertragung Ihrer Eingabedaten. Wenn Sie Ihre Daten vor der Codierung in einen anderen Zeichensatz konvertieren müssen, können Sie diese Option anpassen. Beachten Sie, dass für Textdaten das Codierungsschema den Zeichensatz nicht enthält.
- Zeilenumbruch-Trennzeichen: Unix- und Windows-Systeme verwenden unterschiedliche Zeichen für Zeilenumbrüche. Vor der Codierung wird Ihre Daten angepasst, um diese Zeichen basierend auf Ihrer ausgewählten Option zu ersetzen. Wählen Sie zwischen Unix (LF) und Windows (CRLF) Zeilenumbrüchen, um zu Ihren Daten zu passen.
- Eindeutige Codierung jeder Zeile: Zeilenumbruchzeichen werden ebenfalls in ihre prozentual codierten Äquivalente umgewandelt. Sie können diese Option verwenden, wenn Sie mehrere separate Dateneinträge codieren möchten, die durch Zeilenumbrüche getrennt sind.
- Zeilen in 76-Zeichen-Stücke aufteilen: Die kodierten Daten werden zu einem durchgehenden String ohne Leerzeichen. Wenn Sie es in mehrere Zeilen aufteilen möchten, stellen Sie sicher, dass Sie diese Option auswählen. Die Zeichenbegrenzung wird durch die MIME (RFC 2045)-Spezifikation festgelegt, die verlangt, dass jede kodierte Zeile nicht länger als 76 Zeichen ist.
Sicherheit und Schutz
Wir priorisieren Ihre Privatsphäre. Alle Kommunikationen sind mit SSL-Verschlüsselung gesichert, und wir speichern oder überprüfen Ihre hochgeladenen Daten nicht. Daten werden nicht auf unseren Servern gespeichert. Ihre Daten werden unmittelbar nach der Verarbeitung gelöscht, sodass Ihre Informationen vertraulich bleiben.
Völlig kostenlos und benutzerfreundlich
Unser URL-Codierungs- und -Dekodierungstool ist völlig kostenlos. Verabschieden Sie sich von komplizierten Softwareinstallationen – führen Sie Ihre Codierungsaufgaben direkt aus Ihrem Browser aus.
Details der URL-Codierung
Arten von URI-Zeichen
In einer URI fallen Zeichen in zwei Kategorien: reservierte und unreservierte, sowie Prozentzeichen, die zum Codieren verwendet werden. Reservierte Zeichen können spezielle Bedeutungen haben; zum Beispiel werden Schrägstriche verwendet, um verschiedene Abschnitte einer URL (oder breiter gefasst, einer URI) zu trennen. Unreservierte Zeichen haben hingegen keine besondere Bedeutung. Bei der Verwendung von Prozent-Codierung werden reservierte Zeichen durch spezifische Sequenzen dargestellt. Die Definitionen von reservierten und unreservierten Zeichen sowie die Kontexte, in denen bestimmte reservierte Zeichen von Bedeutung sind, haben sich mit jeder Revision der Spezifikationen, die URIs und URI-Schemata regeln, weiterentwickelt.
! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
---|
A | B | C | D | E | F | G | F | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Prozent-Codierung reservierter Zeichen
Wenn ein Zeichen aus der reservierten Menge in einem bestimmten Kontext eine spezifische Bedeutung hat, muss es möglicherweise prozentual codiert werden, wenn ein URI-Schema dies für einen anderen Zweck erforderlich macht. Die Prozent-Codierung umfasst die Umwandlung des Zeichens in seinen entsprechenden ASCII-Byte-Wert und die Darstellung dieses Wertes als zwei hexadezimale Ziffern, die mit einem Prozentzeichen ('%') vorangestellt sind. Für Nicht-ASCII-Zeichen wird das Zeichen normalerweise in seine UTF-8-Byte-Sequenz umgewandelt, wobei jedes Byte auf dieselbe Weise dargestellt wird.
Zum Beispiel dient das reservierte Zeichen '/' als Trennzeichen im 'Pfad'-Teil einer URI. Wenn ein URI-Schema angibt, dass '/' in einem Pfadsegment enthalten sein sollte, sollte es in diesem Segment durch '%2F' (oder '%2f') ersetzt werden, anstatt das Zeichen direkt zu verwenden.
! | # | $ | & | ' | ( | ) | * | + | , | / | : | ; | = | ? | @ | [ | ] |
%21 | %23 | %24 | %26 | %27 | %28 | %29 | %2A | %2B | %2C | %2F | %3A | %3B | %3D | %3F | %40 | %5B | %5D |
Reservierte Zeichen, die in einem bestimmten Kontext keinen spezifischen Zweck haben, können ebenfalls prozentual codiert werden, aber sie werden hinsichtlich ihrer Bedeutung wie andere Zeichen behandelt.
Zum Beispiel wird im 'Abfrage'-Teil einer URI (dem Teil nach dem '?'-Zeichen) das Zeichen '/' als reserviert kategorisiert, hat jedoch normalerweise keine spezielle Funktion, es sei denn, sie wird durch ein bestimmtes URI-Schema angegeben. Daher muss es nicht prozentual codiert werden, wenn es keinen reservierten Zweck hat.
URIs, die sich ausschließlich darin unterscheiden, ob ein reserviertes Zeichen prozentual codiert ist, werden normalerweise nicht als gleichwertig betrachtet, was bedeutet, dass sie nicht auf dieselbe Ressource verweisen. Dies gilt jedoch nur, wenn die betreffenden reservierten Zeichen keinen bestimmten Zweck haben. Die spezifischen Regeln zu reservierten Zeichen werden von einzelnen URI-Schemata definiert.
Prozent-Codierung unreservierter Zeichen
Zeichen im unreservierten Set benötigen keine Prozent-Codierung.
URIs, die sich nur darin unterscheiden, ob ein unreserviertes Zeichen prozentual codiert ist, gelten definitionsgemäß als gleichwertig. In der Praxis können URI-Prozessoren sie jedoch nicht immer gleich behandeln. Zum Beispiel sollte '%41' wie 'A' behandelt werden (da '%41' die Prozent-Codierung für 'A' ist), und '%7E' sollte äquivalent zu '~' sein. Dennoch können einige Systeme zwischen ihnen unterscheiden. Um maximale Kompatibilität zu gewährleisten, wird empfohlen, dass URI-Produzenten die Prozent-Codierung unreservierter Zeichen vermeiden.
Prozent-Codierung des (%) Prozentzeichens
Das Prozent ('%') Zeichen wird verwendet, um prozentual codierte Oktette anzuzeigen. Wenn Sie es als Daten in einer URI einfügen müssen, muss es als '%25' prozentual codiert werden.
Prozent-Codierung beliebiger Daten
Viele URI-Schemata erfordern die Darstellung verschiedener Arten beliebiger Daten, wie IP-Adressen oder Dateisystempfade, als Teile einer URI. Während die Spezifikationen von URI-Schemata idealerweise eine klare Zuordnung zwischen URI-Zeichen und allen möglichen Datenwerten bieten, ist dies oft nicht der Fall.
Binärdaten
Nach der Veröffentlichung von RFC 1738 im Jahr 1994 wurde festgelegt, dass Schemata, die die Darstellung binärer Daten in einer URI zulassen, Daten in 8-Bit-Bytes aufteilen und jedes Byte entsprechend prozentual codieren müssen. Zum Beispiel muss der Bytewert 0F (in hexadezimal) als '%0F' dargestellt werden, während der Bytewert 41 entweder als 'A' oder '%41' angezeigt werden kann. Im Allgemeinen wird bevorzugt, unkodierte Zeichen für alphanumerische Zeichen und andere unreservierte Zeichen zu verwenden, da dies kürzere URLs erzeugt.
Zeichendaten
Die Methode der Prozent-Codierung binärer Daten wurde häufig unangemessen auf zeichenbasierte Daten ohne klare Richtlinien ausgeweitet. In den frühen Tagen des World Wide Web, als mit Zeichen aus dem ASCII-Satz gearbeitet wurde, wurde allgemein angenommen, dass Zeichen und ihre entsprechenden Byte-Werte für die Prozent-Codierung austauschbar behandelt werden könnten. Diese Annahme war zu der Zeit weitgehend harmlos. Als jedoch der Bedarf wuchs, Zeichen außerhalb des ASCII-Bereichs darzustellen, fehlten URI-Schemata und -Protokolle häufig an standardisierten Regeln zur Vorbereitung von Zeichendaten für URIs.
Infolgedessen begannen Webanwendungen, verschiedene Multi-Byte- und nicht-ASCII-kompatible Codierungen für die Prozent-Codierung zu verwenden, was zu Mehrdeutigkeiten führte und es schwieriger machte, URIs zuverlässig zu interpretieren.
Beispielsweise gehen viele URI-Schemata und -Protokolle, die auf RFC 1738 und 2396 basieren, davon aus, dass Datenzeichen mithilfe einer nicht spezifizierten Codierung in Bytes umgewandelt werden, bevor sie in einer URI als unreservierte Zeichen oder prozentual codierte Bytes dargestellt werden. Wenn ein Schema die verwendete Codierung nicht angibt oder mit der auf ASCII basierenden Prozent-Codierung reservierter und unreservierter Zeichen in Konflikt steht, wird die URI schwer korrekt zu interpretieren. Einige Schemata versäumen es, die Codierung vollständig zu behandeln, und schlagen stattdessen vor, dass Datenzeichen direkt auf URI-Zeichen abgebildet werden. Dies lässt den Benutzern die Aufgabe, zu bestimmen, wie Zeichen, die nicht in die reservierten oder unreservierten Kategorien fallen, prozentual codiert werden sollen.
newline | space | " | % | - | . | < | > | \ | ^ | _ | ` | { | | | } | ~ |
%0A or %0D or %0D%0A | %20 | %22 | %25 | %2D | %2E | %3C | %3E | %5C | %5E | %5F | %60 | %7B | %7C | %7D | %7E |
Eine kurze Geschichte der URL-Codierung
Die URL-Codierung hat ihre Wurzeln in den frühen Tagen des Internets, formalisiert mit der Veröffentlichung von RFC 1738 im Jahr 1994. Diese Spezifikation legte die Grundlage für die Codierung beliebiger Daten in ein für URIs geeignetes Format, das die Darstellung spezieller Zeichen ermöglicht und sicherstellt, dass Daten korrekt übertragen werden. Im Laufe der Jahre, als sich die Webstandards weiterentwickelten, entwickelten sich auch die Praktiken rund um die Prozent-Codierung weiter, um eine breitere Palette von Zeichen und Codierungsschemata einzubeziehen, insbesondere mit dem Aufstieg nicht-ASCII-Zeichen und Multi-Byte-Codierungen. Diese Evolution hat die URL-Codierung zu einer wesentlichen Fähigkeit für Webentwickler gemacht und sichergestellt, dass Daten intakt bleiben und über verschiedene Plattformen und Protokolle korrekt interpretiert werden.