HTML -codering (tekensets)
Om een HTML-pagina correct weer te geven, moet een webbrowser weten welke tekenset moet worden gebruikt.
Van ASCII naar UTF-8
ASCII was de eerste tekencoderingsstandaard. ASCII definieerde 128 verschillende tekens die op internet konden worden gebruikt: cijfers (0-9), Engelse letters (AZ) en enkele speciale tekens zoals ! $ + - ( ) @ < > .
ISO-8859-1 was de standaard tekenset voor HTML 4. Deze tekenset ondersteunde 256 verschillende tekencodes. HTML 4 ondersteunde ook UTF-8.
ANSI (Windows-1252) was de originele Windows-tekenset. ANSI is identiek aan ISO-8859-1, behalve dat ANSI 32 extra tekens heeft.
De HTML5-specificatie moedigt webontwikkelaars aan om de UTF-8-tekenset te gebruiken, die bijna alle tekens en symbolen ter wereld omvat!
Het HTML-tekensetkenmerk
Om een HTML-pagina correct weer te geven, moet een webbrowser de tekenset kennen die op de pagina wordt gebruikt.
Dit wordt gespecificeerd in de <meta>
tag:
<meta charset="UTF-8">
Verschillen tussen tekensets
De volgende tabel toont de verschillen tussen de hierboven beschreven tekensets:
Gevoelloos | ASCII | ANSI | 8859 | UTF-8 | Beschrijving |
---|---|---|---|---|---|
32 | ruimte | ||||
33 | ! | ! | ! | ! | uitroepteken |
34 | " | " | " | " | aanhalingsteken |
35 | # | # | # | # | hekje |
36 | $ | $ | $ | $ | dollarteken |
37 | % | % | % | % | procentteken |
38 | & | & | & | & | ampersand |
39 | ' | ' | ' | ' | apostrof |
40 | ( | ( | ( | ( | linker haakje |
41 | ) | ) | ) | ) | rechter haakje |
42 | * | * | * | * | asterisk |
43 | + | + | + | + | meer teken |
44 | , | , | , | , | komma |
45 | - | - | - | - | koppelteken-minus |
46 | . | . | . | . | punt |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | cijfer nul |
49 | 1 | 1 | 1 | 1 | cijfer één |
50 | 2 | 2 | 2 | 2 | cijfer twee |
51 | 3 | 3 | 3 | 3 | cijfer drie |
52 | 4 | 4 | 4 | 4 | cijfer vier |
53 | 5 | 5 | 5 | 5 | cijfer vijf |
54 | 6 | 6 | 6 | 6 | cijfer zes |
55 | 7 | 7 | 7 | 7 | cijfer zeven |
56 | 8 | 8 | 8 | 8 | cijfer acht |
57 | 9 | 9 | 9 | 9 | cijfer negen |
58 | : | : | : | : | dikke darm |
59 | ; | ; | ; | ; | puntkomma |
60 | < | < | < | < | minder-dan-teken |
61 | = | = | = | = | is gelijk aan teken |
62 | > | > | > | > | groter-dan-teken |
63 | ? | ? | ? | ? | vraagteken |
64 | @ | @ | @ | @ | commercieel bij |
65 | EEN | EEN | EEN | EEN | Latijnse hoofdletter A |
66 | B | B | B | B | Latijnse hoofdletter B |
67 | C | C | C | C | Latijnse hoofdletter C |
68 | D | D | D | D | Latijnse hoofdletter D |
69 | E | E | E | E | Latijnse hoofdletter E |
70 | F | F | F | F | Latijnse hoofdletter F |
71 | G | G | G | G | Latijnse hoofdletter G |
72 | H | H | H | H | Latijnse hoofdletter H |
73 | I | I | I | I | Latijnse hoofdletter I |
74 | J | J | J | J | Latijnse hoofdletter J |
75 | K | K | K | K | Latijnse hoofdletter K |
76 | L | L | L | L | Latijnse hoofdletter L |
77 | m | m | m | m | Latijnse hoofdletter M |
78 | N | N | N | N | Latijnse hoofdletter N |
79 | DE | DE | DE | DE | Latijnse hoofdletter O |
80 | P | P | P | P | Latijnse hoofdletter P |
81 | Q | Q | Q | Q | Latijnse hoofdletter Q |
82 | R | R | R | R | Latijnse hoofdletter R |
83 | S | S | S | S | Latijnse hoofdletter S |
84 | t | t | t | t | Latijnse hoofdletter T |
85 | jij | jij | jij | jij | Latijnse hoofdletter U |
86 | V | V | V | V | Latijnse hoofdletter V |
87 | W | W | W | W | Latijnse hoofdletter W |
88 | x | x | x | x | Latijnse hoofdletter X |
89 | ja | ja | ja | ja | Latijnse hoofdletter Y |
90 | MET | MET | MET | MET | Latijnse hoofdletter Z |
91 | [ | [ | [ | [ | vierkante haak links |
92 | \ | \ | \ | \ | omgekeerde solidus |
93 | ] | ] | ] | ] | rechter vierkante haak |
94 | ^ | ^ | ^ | ^ | circumflex accent |
95 | _ | _ | _ | _ | lage lijn |
96 | ` | ` | ` | ` | serieus accent |
97 | een | een | een | een | Latijnse kleine letter a |
98 | B | B | B | B | Latijnse kleine letter b |
99 | C | C | C | C | Latijnse kleine letter c |
100 | D | D | D | D | Latijnse kleine letter d |
101 | e | e | e | e | Latijnse kleine letter e |
102 | F | F | F | F | Latijnse kleine letter f |
103 | G | G | G | G | Latijnse kleine letter g |
104 | H | H | H | H | Latijnse kleine letter h |
105 | I | I | I | I | Latijnse kleine letter i |
106 | J | J | J | J | Latijnse kleine letter j |
107 | k | k | k | k | Latijnse kleine letter k |
108 | ik | ik | ik | ik | Latijnse kleine letter l |
109 | m | m | m | m | Latijnse kleine letter m |
110 | N | N | N | N | Latijnse kleine letter n |
111 | De | De | De | De | Latijnse kleine letter o |
112 | P | P | P | P | Latijnse kleine letter p |
113 | Q | Q | Q | Q | Latijnse kleine letter q |
114 | R | R | R | R | Latijnse kleine letter r |
115 | s | s | s | s | Latijnse kleine letter s |
116 | t | t | t | t | Latijnse kleine letter t |
117 | jij | jij | jij | jij | Latijnse kleine letter u |
118 | v | v | v | v | Latijnse kleine letter v |
119 | met wie | met wie | met wie | met wie | Latijnse kleine letter w |
120 | x | x | x | x | Latijnse kleine letter x |
121 | ja | ja | ja | ja | Latijnse kleine letter y |
122 | met | met | met | met | Latijnse kleine letter z |
123 | { | { | { | { | accolade links |
124 | | | | | | | | | verticale lijn |
125 | } | } | } | } | accolade rechts |
126 | ~ | ~ | ~ | ~ | tilde |
127 | VAN | ||||
128 | € | euro teken | |||
129 | | | | NIET GEBRUIKT | |
130 | ik | enkel laag-9 aanhalingsteken | |||
131 | ƒ | Latijnse kleine letter f met haak | |||
132 | „ | dubbel laag-9 aanhalingsteken | |||
133 | … | horizontale ellips | |||
134 | ik | dolk | |||
135 | ik | dubbele dolk | |||
136 | B | modifier letter circumflex accent | |||
137 | ik | voor duizend tekens | |||
138 | S | Latijnse hoofdletter S met caron | |||
139 | ik | enkele naar links wijzende hoekaanhalingsteken | |||
140 | Œ | Latijnse hoofdletter ligatuur OE | |||
141 | | | | NIET GEBRUIKT | |
142 | Ž | Latijnse hoofdletter Z met caron | |||
143 | | | | NIET GEBRUIKT | |
144 | | | | NIET GEBRUIKT | |
145 | ' | links enkel aanhalingsteken | |||
146 | ' | enkel aanhalingsteken rechts | |||
147 | “ | links dubbel aanhalingsteken | |||
148 | ” | rechts dubbel aanhalingsteken | |||
149 | • | kogel | |||
150 | – | en dash | |||
151 | — | jij sprint | |||
152 | ~ | kleine tilde | |||
153 | ™ | handelsmerk teken | |||
154 | s | Latijnse kleine letter s met caron | |||
155 | › | enkele naar rechts wijzende hoek aanhalingstekens | |||
156 | œ | Latijnse kleine rietbinder oe | |||
157 | | | | NIET GEBRUIKT | |
158 | Ž | Latijnse kleine letter z met caron | |||
159 | Ÿ | Latijnse hoofdletter Y met trema | |||
160 | no-break ruimte | ||||
161 | ik | ik | ik | omgekeerd uitroepteken | |
162 | ¢ | ¢ | ¢ | cent teken | |
163 | £ | £ | £ | pondteken | |
164 | ¤ | ¤ | ¤ | valutateken | |
165 | ¥ | ¥ | ¥ | yen teken | |
166 | | | | | | | gebroken balk | |
167 | ik | ik | ik | sectie teken | |
168 | ¨ | ¨ | ¨ | trema | |
169 | © | © | © | copyright teken | |
170 | ª | ª | ª | vrouwelijke ordinale indicator | |
171 | « | « | « | naar links wijzend aanhalingsteken met dubbele hoek | |
172 | ¬ | ¬ | ¬ | niet ondertekenen | |
173 | | | | zacht koppelteken | |
174 | ® | ® | ® | geregistreerd teken | |
175 | ¯ | ¯ | ¯ | macron | |
176 | ° | ° | ° | graden teken | |
177 | ± | ± | ± | plus-min teken | |
178 | ² | ² | ² | superscript twee | |
179 | ³ | ³ | ³ | superscript drie | |
180 | ´ | ´ | ´ | acuut accent | |
181 | µ | µ | µ | microteken | |
182 | ik | ik | ik | pilk teken | |
183 | · | · | · | middelste punt | |
184 | ¸ | ¸ | ¸ | cedille | |
185 | ¹ | ¹ | ¹ | superscript één | |
186 | º | º | º | mannelijke ordinale indicator | |
187 | » | » | » | naar rechts wijzend dubbel hoekaanhalingsteken | |
188 | ¼ | ¼ | ¼ | vulgaire fractie een kwart | |
189 | ½ | ½ | ½ | vulgaire fractie de helft | |
190 | ¾ | ¾ | ¾ | vulgaire fractie driekwart | |
191 | ik | ik | ik | omgekeerd vraagteken | |
192 | BIJ | BIJ | BIJ | Latijnse hoofdletter A met graf | |
193 | EEN | EEN | EEN | Latijnse hoofdletter A met acute | |
194 | EEN | EEN | EEN | Latijnse hoofdletter A met circumflex | |
195 | EEN | EEN | EEN | Latijnse hoofdletter A met tilde | |
196 | EEN | EEN | EEN | Latijnse hoofdletter A met trema | |
197 | Oh | Oh | Oh | Latijnse hoofdletter A met ring erboven | |
198 | Æ | Æ | Æ | Latijnse hoofdletter AE | |
199 | C | C | C | Latijnse hoofdletter C met cedilla | |
200 | IS | IS | IS | Latijnse hoofdletter E met graf | |
201 | ZIJN | ZIJN | ZIJN | Latijnse hoofdletter E met acute | |
202 | Ê | Ê | Ê | Latijnse hoofdletter E met circumflex | |
203 | E | E | E | Latijnse hoofdletter E met trema | |
204 | I | I | I | Latijnse hoofdletter I met graf | |
205 | I | I | I | Latijnse hoofdletter I met acute | |
206 | I | I | I | Latijnse hoofdletter I met circumflex | |
207 | I | I | I | Latijnse hoofdletter I met trema | |
208 | D | D | D | Latijnse hoofdletter Eth | |
209 | N | N | N | Latijnse hoofdletter N met tilde | |
210 | O | O | O | Latijnse hoofdletter O met graf | |
211 | Oh | Oh | Oh | Latijnse hoofdletter O met acute | |
212 | PARAPLU | PARAPLU | PARAPLU | Latijnse hoofdletter O met circumflex | |
213 | O | O | O | Latijnse hoofdletter O met tilde | |
214 | O | O | O | Latijnse hoofdletter O met trema | |
215 | × | × | × | vermenigvuldigingsteken | |
216 | O | O | O | Latijnse hoofdletter O met slag | |
217 | Ù | Ù | Ù | Latijnse hoofdletter U met graf | |
218 | Ú | Ú | Ú | Latijnse hoofdletter U met acute | |
219 | Û | Û | Û | Latijnse hoofdletter U met circumflex | |
220 | Ü | Ü | Ü | Latijnse hoofdletter U met trema | |
221 | IDEE | IDEE | IDEE | Latijnse hoofdletter Y met acute | |
222 | E | E | E | Latijnse hoofdletter Thorn | |
223 | ß | ß | ß | Latijnse kleine letter scherpe s | |
224 | Bij | Bij | Bij | Latijnse kleine letter a met graf | |
225 | een | een | een | Latijnse kleine letter a met acute | |
226 | een | een | een | Latijnse kleine letter a met circumflex | |
227 | een | een | een | Latijnse kleine letter a met tilde | |
228 | een | een | een | Latijnse kleine letter a met trema | |
229 | een | een | een | Latijnse kleine letter a met ring erboven | |
230 | æ | æ | æ | Latijnse kleine letter ae | |
231 | C | C | C | Latijnse kleine letter c met cedilla | |
232 | is | is | is | Latijnse kleine letter e met graf | |
233 | Zijn | Zijn | Zijn | Latijnse kleine letter e met acute | |
234 | ê | ê | ê | Latijnse kleine letter e met circumflex | |
235 | e | e | e | Latijnse kleine letter e met trema | |
236 | I | I | I | Latijnse kleine letter i met graf | |
237 | I | I | I | Latijnse kleine letter i met acute | |
238 | I | I | I | Latijnse kleine letter i met circumflex | |
239 | I | I | I | Latijnse kleine letter i met trema | |
240 | D | D | D | Latijnse kleine letter eth | |
241 | N | N | N | Latijnse kleine letter n met tilde | |
242 | O | O | O | Latijnse kleine letter o met graf | |
243 | Oh | Oh | Oh | Latijnse kleine letter o met acute | |
244 | Paraplu | Paraplu | Paraplu | Latijnse kleine letter o met circumflex | |
245 | O | O | O | Latijnse kleine letter o met tilde | |
246 | O | O | O | Latijnse kleine letter o met trema | |
247 | ÷ | ÷ | ÷ | divisie teken | |
248 | O | O | O | Latijnse kleine letter o met slag | |
249 | ù | ù | ù | Latijnse kleine letter u met graf | |
250 | ú | ú | ú | Latijnse kleine letter u met acute | |
251 | en | en | en | Latijnse kleine letter met circumflex | |
252 | ü | ü | ü | Latijnse kleine letter u met trema | |
253 | idee | idee | idee | Latijnse kleine letter y met acute | |
254 | e | e | e | Latijnse kleine letter doorn | |
255 | ÿ | ÿ | ÿ | Latijnse kleine letter y met trema |
De ASCII-tekenset
ASCII gebruikt de waarden van 0 tot 31 (en 127) voor controletekens.
ASCII gebruikt de waarden van 32 tot 126 voor letters, cijfers en symbolen.
ASCII gebruikt de waarden van 128 tot 255 niet.
De ANSI-tekenset (Windows-1252)
ANSI is identiek aan ASCII voor de waarden van 0 tot 127.
ANSI heeft een eigen set tekens voor de waarden van 128 tot 159.
ANSI is identiek aan UTF-8 voor de waarden van 160 tot 255.
De ISO-8859-1 tekenset
ISO-8859-1 is identiek aan ASCII voor de waarden van 0 tot 127.
ISO-8859-1 gebruikt de waarden van 128 tot 159 niet.
ISO-8859-1 is identiek aan UTF-8 voor de waarden van 160 tot 255.
De UTF-8-tekenset
UTF-8 is identiek aan ASCII voor de waarden van 0 tot 127.
UTF-8 gebruikt de waarden van 128 tot 159 niet.
UTF-8 is identiek aan zowel ANSI als 8859-1 voor de waarden van 160 tot 255.
UTF-8 gaat verder vanaf de waarde 256 met meer dan 10.000 verschillende karakters.
Bekijk onze complete HTML-tekensetreferentie voor meer informatie .