Кодировать в формат URL-кодирования Онлайн
О кодировании и декодировании URL
Добро пожаловать в URL Decode and Encode, ваш идеальный онлайн-инструмент для легкого кодирования и декодирования URL. Наша платформа предназначена для упрощения процесса кодирования и декодирования URL, позволяя вам преобразовать данные в безопасный формат URL или вернуть их в читаемый человеком вид всего одним щелчком.
Что такое кодирование URL?
Кодирование URL, часто называемое кодированием процентом, является ключевым механизмом, используемым при формировании унифицированных идентификаторов ресурсов (URI). Хотя это обычно известно как кодирование URL, эта техника широко применяется в рамках URI, охватывая как унифицированные локаторы ресурсов (URL), так и унифицированные имена ресурсов (URN). Она преобразует символы в формат, который можно передавать по интернету, что делает его жизненно важным для веб-приложений и отправки данных в HTTP-запросах.
Особенности и расширенные параметры
Наш инструмент поддерживает несколько наборов символов, включая UTF-8, ASCII и различные форматы ISO, обеспечивая совместимость с вашими потребностями. Вы можете настроить:
- Набор символов: Наш сайт по умолчанию использует набор символов UTF-8 для передачи ваших входных данных. Если вам нужно преобразовать ваши данные в другой набор символов перед кодированием, вы можете изменить эту опцию. Имейте в виду, что для текстовых данных схема кодировки не включает набор символов.
- Разделители новой строки: Системы Unix и Windows используют разные символы для разрывов строк. Перед кодированием ваши данные будут настроены для замены этих символов в зависимости от вашего выбранного варианта. Выберите между разрывами строк Unix (LF) и Windows (CRLF), чтобы соответствовать вашим данным.
- Уникальное кодирование каждой строки: Символы новой строки также будут преобразованы в их эквиваленты, закодированные процентом. Вы можете использовать эту опцию, если хотите закодировать несколько отдельных записей данных, разделенных разрывами строк.
- Разделить строки на части по 76 символов: Закодированные данные превратятся в непрерывную строку без пробелов. Если вы хотите разделить их на несколько строк, обязательно выберите эту опцию. Ограничение по количеству символов установлено спецификацией MIME (RFC 2045), которая требует, чтобы каждая закодированная строка не превышала 76 символов.
Безопасность и защита
Мы приоритизируем вашу конфиденциальность. Все коммуникации защищены шифрованием SSL, и мы не храним и не проверяем ваши загруженные данные. Данные не хранятся на наших серверах. Ваши данные удаляются сразу после обработки, гарантируя, что ваша информация останется конфиденциальной.
Совершенно бесплатно и удобно в использовании
Наш инструмент кодирования и декодирования URL полностью бесплатен для использования. Прощайте, сложные установки программного обеспечения — выполняйте свои задачи кодирования прямо из браузера.
Детали кодирования URL
Типы символов URI
В URI символы делятся на две категории: зарезервированные и незарезервированные, а также символы процента, используемые для кодирования. Зарезервированные символы могут иметь специальные значения; например, косые черты используются для разделения различных частей URL (или более широко, URI). С другой стороны, незарезервированные символы не имеют никакого специального значения. При использовании кодирования процента зарезервированные символы представлены конкретными последовательностями. Определения зарезервированных и незарезервированных символов, а также контексты, в которых определенные зарезервированные символы имеют значение, эволюционировали с каждой ревизией спецификаций, регулирующих URI и схемы URI.
! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
---|
A | B | C | D | E | F | G | F | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Кодирование процента зарезервированных символов
Когда символ из зарезервированного набора имеет конкретное значение в определенном контексте, его может потребоваться закодировать процентом, если схема URI требует этого для другой цели. Кодирование процента включает преобразование символа в его соответствующее значение байта ASCII, а затем выражение этого значения в виде двух шестнадцатеричных цифр с префиксом в виде знака процента ('%'). Для не-ASCII символов символ обычно преобразуется в его последовательность байтов UTF-8, при этом каждый байт представлен аналогичным образом.
Например, зарезервированный символ '/' служит разделителем в компоненте 'путь' URI. Если схема URI указывает, что '/' должен быть включен в сегмент пути, он должен быть заменен на '%2F' (или '%2f') в этом сегменте вместо использования символа напрямую.
! | # | $ | & | ' | ( | ) | * | + | , | / | : | ; | = | ? | @ | [ | ] |
%21 | %23 | %24 | %26 | %27 | %28 | %29 | %2A | %2B | %2C | %2F | %3A | %3B | %3D | %3F | %40 | %5B | %5D |
Зарезервированные символы, которые не имеют конкретной цели в данном контексте, также могут быть закодированы процентом, но они рассматриваются так же, как и другие символы с точки зрения значения.
Например, в компоненте 'запрос' URI (часть после символа '?') символ '/' классифицируется как зарезервированный, но обычно не имеет специальной функции, если это не указано конкретной схемой URI. Поэтому его не нужно кодировать процентом, когда он не имеет зарезервированной цели.
URI, которые различаются исключительно на основе того, закодирован ли зарезервированный символ процентом, обычно не считаются эквивалентными, что означает, что они не указывают на один и тот же ресурс. Однако это применимо только в том случае, если у рассматриваемых зарезервированных символов нет назначенной цели. Конкретные правила, касающиеся зарезервированных символов, определяются отдельными схемами URI.
Кодирование процента незарезервированных символов
Символы в незарезервированном наборе не требуют кодирования процентом.
URI, которые различаются только на основе того, закодирован ли незарезервированный символ процентом, считаются эквивалентными по определению. Однако на практике процессоры URI могут не всегда обрабатывать их одинаково. Например, '%41' следует рассматривать так же, как 'A' (так как '%41' — это кодирование процента для 'A'), и '%7E' должно быть эквивалентно '~'. Несмотря на это, некоторые системы могут различать их. Для обеспечения максимальной совместимости рекомендуется, чтобы производители URI избегали кодирования процентом незарезервированных символов.
Кодирование процента (%) символа процента
Символ процента ('%') используется для обозначения байтов, закодированных процентом, поэтому, когда вам нужно включить его как данные в URI, он должен быть закодирован как '%25'.
Кодирование процента произвольных данных
Многие схемы URI требуют представления различных типов произвольных данных, таких как IP-адреса или пути файловой системы, в качестве частей URI. Хотя спецификации схем URI в идеале обеспечивают четкое сопоставление между символами URI и всеми возможными значениями данных, это часто не так.
Двоичные данные
После публикации RFC 1738 в 1994 году было установлено, что схемы, допускающие представление двоичных данных в URI, должны разбивать данные на 8-битные байты и соответствующим образом кодировать каждый байт процентом. Например, значение байта 0F (в шестнадцатеричном формате) должно быть представлено как '%0F', в то время как значение байта 41 может быть показано как 'A' или '%41'. Обычно предпочтительно использовать не закодированные символы для алфавитно-цифровых символов и других незарезервированных символов, так как это создает более короткие URL.
Символьные данные
Метод кодирования процента двоичных данных часто неправильно распространялся на символьные данные без четких рекомендаций. В ранние дни Всемирной паутины, когда работали с символами из набора ASCII, обычно предполагалось, что символы и их соответствующие значения байтов могут рассматриваться как взаимозаменяемые для кодирования процента. Это предположение в основном было безвредным в то время. Однако с ростом необходимости представления символов за пределами диапазона ASCII схемы URI и протоколы часто не имели стандартизированных правил для подготовки символьных данных для URI.
В результате веб-приложения начали использовать различные многобайтовые и несовместимые с ASCII кодировки для кодирования процента, что привело к неоднозначностям и усложнило надежную интерпретацию URI.
Например, многие схемы URI и протоколы, основанные на RFC 1738 и 2396, предполагают, что символы данных будут преобразованы в байты с использованием какой-то неуточненной кодировки перед представлением в URI в виде незарезервированных символов или байтов, закодированных процентом. Если схема не указывает используемую кодировку или конфликтует с кодированием процента для зарезервированных и незарезервированных символов на основе ASCII, URI становится трудно интерпретировать правильно. Некоторые схемы полностью игнорируют вопросы кодирования, предполагая, что символы данных должны напрямую соответствовать символам URI. Это оставляет пользователям определять, как кодировать процентом символы, которые не попадают в зарезервированные или незарезервированные категории.
newline | space | " | % | - | . | < | > | \ | ^ | _ | ` | { | | | } | ~ |
%0A or %0D or %0D%0A | %20 | %22 | %25 | %2D | %2E | %3C | %3E | %5C | %5E | %5F | %60 | %7B | %7C | %7D | %7E |
Краткая история кодирования URL
Кодирование URL имеет свои корни в ранние дни интернета, оформленные публикацией RFC 1738 в 1994 году. Эта спецификация заложила основы для кодирования произвольных данных в формат, подходящий для URI, позволяя представлять специальные символы и обеспечивая правильную передачу данных. За эти годы, по мере эволюции веб-стандартов, изменялись и практики, связанные с кодированием процента, адаптируясь к включению более широкого диапазона символов и схем кодирования, особенно с ростом не-ASCII символов и многобайтовых кодировок. Эта эволюция сделала кодирование URL важным навыком для веб-разработчиков, обеспечивая целостность данных и правильную интерпретацию на различных платформах и протоколах.