Charset
Índice
Usando iso-8859-1
Este é o charset para códigos de caracteres latinos. Assim letras acentuadas serão representadas por apenas um caractere.
Exemplo:
palavra - Hexadecimal Ação - 41-E7-E3-6F
Usando utf-8
Esta tabela de caracteres é [multibyte], ou seja, alguns caracteres serão representados no arquivo como 2 caracteres ASCII (o que pode dificultar a utilização de funções Lenght).
Exemplo:
palavra - Unicode - Hexadecimal Ação - U+0041 U+00E7 U+00E3 U+006F - 41,C3 A7,C3 A3,6F
Arquivo html
Para utf-8 use o cabeçalho
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
e para iso-8859-1 use
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
Firefox
Clicando em Tools/Page Info/General podemos ver o Encoding e as tags meta.
O Firefox verifica qual encoding foi informado pelo servidor web (apache). Veja o arquivo http.conf, e procure a linha
AddDefaultCharset ISO-8859-1
Isso significa que todas as páginas saindo desse servidor serão padrão ISO-8859-1. Mesmo que especificado de forma contrária no cabeçalho html. (Isso acontece também com o Internet Explorer)
Veja Também
- utf8: Convertendo arquivos entre utf-8 e iso-8859-1
- Convertendo arquivos entre utf-8 e iso-8859-1
Ligações Externas
- http://www.phpwact.org/php/i18n/charsets, Boa explicação com bastante informação dos diferentes aspectos
- W3Cbr: Configurando o parâmetro HTTP da codificação de caracteres (charset)
- http://www.w3.org/International/O-charset.pt-br.php