UTF-8

UTF-8 è una codifica multibyte che massimizza la compatibilità con ASCII (parzialmente
descritta precedentemente come codifica F). In UTF-8 ogni carattere viene codificato in una
sequenza di lunghezza variabile da 1 a quattro ottetti (byte)
In UTF-8 non esiste un BOM (poichè i caratteri sono usati singolarmente e non in coppie) anche se
alcuni programmi (soprattutto operanti in ambiente windows) ne inseriscono uno
(0xEF,0xBB,0xBF) equivalente a quello usato in UTF-16. Questo è permesso, ma sconsigliato,
dallo standard, e in essenza non fa che rompere le scatole.





