Difference between revisions of "Character encodings"

From TheAlmightyGuru
Jump to: navigation, search
Line 3: Line 3:
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
! Char !! Name !! Hex !! Dec !! Binary !! Percent
+
! Char !! Name !! Hex !! Dec !! Binary !! Percent !! Escape
 
|-
 
|-
| ␀ || Null || 00 || 000 || 00000000 || %00
+
| ␀ || Null || 00 || 000 || 00000000 || %00 ||
 
|-
 
|-
 
| ␁ || Start of heading || 01 || 001 || 00000001 || %01
 
| ␁ || Start of heading || 01 || 001 || 00000001 || %01

Revision as of 11:29, 3 April 2024

ASCII

ASCII

Char Name Hex Dec Binary Percent Escape
Null 00 000 00000000  %00
Start of heading 01 001 00000001  %01
Start of text 02 002 00000010  %02
End of text 03 003 00000011  %03
End of transmission 04 004 00000100  %04
Enquiry 05 005 00000101  %05
Acknowledge 06 006 00000110  %06
Bell 07 007 00000111  %07
Backspace 08 008 00001000  %08
Horizontal tabulation 09 009 00001001  %09
Line feed 0A 010 00001010  %0A
Vertical tabulation 0B 011 00001011  %0B
Form feed 0C 012 00001100  %0C
Carriage return 0D 013 00001101  %0D
Shift out 0E 014 00001110  %0E
Shift in 0F 015 00001111  %0F
Data link escape 10 016 00010000  %10
Device control 1 11 017 00010001  %11
Device control 2 12 018 00010010  %12
Device control 3 13 019 00010011  %13
Device control 4 14 020 00010100  %14
Negative acknowledge 15 021 00010101  %15
Synchronous idle 16 022 00010110  %16
End of transmission block 17 023 00010111  %17
Cancel 18 024 00011000  %18
End of medium 19 025 00011001  %19
Substitute 1A 026 00011010  %1A
Escape 1B 027 00011011  %1B
File separator 1C 028 00011100  %1C
Group separator 1D 029 00011101  %1D
Record separator 1E 030 00011110  %1E
Unit separator 1F 031 00011111  %1F
Space 20 032 00100000  %20
 ! Exclamation point 21 033 00100001  %21
" Quotation mark 22 034 00100010  %22
# Number sign 23 035 00100011  %23
$ Dollar sign 24 036 00100100  %24
 % Percent sign 25 037 00100101  %25
& Ampersand 26 038 00100110  %26
' Apostrophe 27 039 00100111  %27
( Left parenthesis 28 040 00101000  %28
) Right parenthesis 29 041 00101001  %29
* Asterisk 2A 042 00101010  %2A
+ Plus sign 2B 043 00101011  %2B
, Comma 2C 044 00101100  %2C
- Hyphen-minus 2D 045 00101101  %2D
. Period 2E 046 00101110  %2E
/ Slash 2F 047 00101111  %2F
0 Digit zero 30 048 00110000
1 Digit one 31 049 00110001
2 Digit two 32 050 00110010
3 Digit three 33 051 00110011
4 Digit four 34 052 00110100
5 Digit five 35 053 00110101
6 Digit six 36 054 00110110
7 Digit seven 37 055 00110111
8 Digit eight 38 056 00111000
9 Digit nine 39 057 00111001
 : Colon 3A 058 00111010  %3A
 ; Semicolon 3B 059 00111011  %3B
< Less-than sign 3C 060 00111100  %3C
= Equals sign 3D 061 00111101  %3D
> Greater-than sign 3E 062 00111110  %3E
 ? Question mark 3F 063 00111111  %3F
@ Commercial at 40 064 01000000  %40
A Latin capital letter A 41 065 01000001
B Latin capital letter B 42 066 01000010
C Latin capital letter C 43 067 01000011
D Latin capital letter D 44 068 01000100
E Latin capital letter E 45 069 01000101
F Latin capital letter F 46 070 01000110
G Latin capital letter G 47 071 01000111
H Latin capital letter H 48 072 01001000
I Latin capital letter I 49 073 01001001
J Latin capital letter J 4A 074 01001010
K Latin capital letter K 4B 075 01001011
L Latin capital letter L 4C 076 01001100
M Latin capital letter M 4D 077 01001101
N Latin capital letter N 4E 078 01001110
O Latin capital letter O 4F 079 01001111
P Latin capital letter P 50 080 01010000
Q Latin capital letter Q 51 081 01010001
R Latin capital letter R 52 082 01010010
S Latin capital letter S 53 083 01010011
T Latin capital letter T 54 084 01010100
U Latin capital letter U 55 085 01010101
V Latin capital letter V 56 086 01010110
W Latin capital letter W 57 087 01010111
X Latin capital letter X 58 088 01011000
Y Latin capital letter Y 59 089 01011001
Z Latin capital letter Z 5A 090 01011010
[ Left square bracket 5B 091 01011011  %5B
\ Backslash 5C 092 01011100  %5C
] Right square bracket 5D 093 01011101  %5D
^ Circumflex accent 5E 094 01011110  %5E
_ Underscore 5F 095 01011111  %5F
` Grave accent 60 096 01100000  %60
a Latin small letter a 61 097 01100001
b Latin small letter b 62 098 01100010
c Latin small letter c 63 099 01100011
d Latin small letter d 64 100 01100100
e Latin small letter e 65 101 01100101
f Latin small letter f 66 102 01100110
g Latin small letter g 67 103 01100111
h Latin small letter h 68 104 01101000
i Latin small letter i 69 105 01101001
j Latin small letter j 6A 106 01101010
k Latin small letter k 6B 107 01101011
l Latin small letter l 6C 108 01101100
m Latin small letter m 6D 109 01101101
n Latin small letter n 6E 110 01101110
o Latin small letter o 6F 111 01101111


! colspan="11" | || { || | || } || ~ || ␡ |- align="center" | colspan="11" | || %7B || %7C || %7D || %7E || %7F |}


Percent encoding

Used to encode special characters in URIs and URLs. For ASCII characters, the encoding is simply the value in hex, for Unicode characters, it's more complicated. Files downloaded from a web site which have these symbols in their names may be converted their percent hex values. Below are some of the more common conversions:

ASCII

 %00  %01  %02  %03  %04  %05  %06  %07  %08  %09  %0A  %0B  %0C  %0D  %0E  %0F
 %10  %11  %12  %13  %14  %15  %16  %17  %18  %19  %1A  %1B  %1C  %1D  %1E  %1F
 ! " # $  % & ' ( ) * + , - . /
 %20  %21  %22  %23  %24  %25  %26  %27  %28  %29  %2A  %2B  %2C  %2D  %2E  %2F
 :  ; < = >  ?
 %3A  %3B  %3C  %3D  %3E  %3F
@
 %40
[ \ ] ^ _
 %5B  %5C  %5D  %5E  %5F
`
 %60
{ | } ~
 %7B  %7C  %7D  %7E  %7F

Unicode

£
 %C2%A3  %E2%82%AC