Mudanças entre as edições de "Charset"

De WikiLICC
Ir para: navegação, pesquisa
(utf-8)
Linha 9: Linha 9:
 
Esta tabela de caracteres é [multibyte], ou seja, alguns caracteres serão representados no arquivo como 2 ou mais caracteres ASCII (o que pode dificultar a utilização de funções Lenght).
 
Esta tabela de caracteres é [multibyte], ou seja, alguns caracteres serão representados no arquivo como 2 ou mais caracteres ASCII (o que pode dificultar a utilização de funções Lenght).
 
  palavra -  Unicode                      - Hexadecimal
 
  palavra -  Unicode                      - Hexadecimal
  Ação    -  U+0041 U+00E7 U+00E3 U+006F  - 41,C3 A7,C3 A3,6F
+
  Ação    -  U+0041 U+00E7 U+00E3 U+006F  - 41-C3 A7-C3 A3-6F
  
 
* [http://en.wikipedia.org/wiki/ISO_8859-1 ISO_8859-1]
 
* [http://en.wikipedia.org/wiki/ISO_8859-1 ISO_8859-1]

Edição das 16h00min de 23 de maio de 2009

Tabela de caracteres iso-8859-1 e utf-8

iso-8859-1

Este é o charset para códigos de caracteres latinos. Assim letras acentuadas serão representadas por apenas um caractere.

palavra -   Hexadecimal  
Ação    -   41-E7-E3-6F  

utf-8

Esta tabela de caracteres é [multibyte], ou seja, alguns caracteres serão representados no arquivo como 2 ou mais caracteres ASCII (o que pode dificultar a utilização de funções Lenght).

palavra -   Unicode                      - Hexadecimal
Ação    -   U+0041 U+00E7 U+00E3 U+006F  - 41-C3 A7-C3 A3-6F

Digitando os caracteres

Cada uma das partes abaixo pode estar configurada de maneira diferente.

O sistema operacional

Para verificar qual charset o sistema linux está usando:

[user@euler]$ locale
LANG=pt_BR.UTF-8
LC_CTYPE="pt_BR.UTF-8"
...

O cliente SSH

Usando o Putty, clicando em Settings/Windows/Translations podemos selecionar a tabela charset.

O editor

O editor de texto usado deve ser capaz de salvar usando a tabela de caracteres desejada.

vi

O vi (vim) possui o arquivo de configuração .vimrc no direrório home do usuário a com configuração

 set fileencodings=utf-8,latin1

com que arquivos sejam editados nesses formatos. Se um arquivo iso-8859-1 é editado com um cliente SSH (em UTF-8), o arquivo é convertido ao abrir para UTF-8 e convertido de volta ao salvar para iso-8859-1 (veja [1]).

O arquivo html

Para utf-8 use o cabeçalho

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

e para iso-8859-1 use

<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

O servidor Apache

Ao enviar uma página para o cliente web, o servidor apache avisa qual tipo de charset é utilizado.

[user@euler]$ more http.conf
...
AddDefaultCharset ISO-8859-1
...

O cliente Firefox/Internet Explorer

O Firefox verifica qual encoding foi informado pelo servidor web (no exemplo ISO-8859-1). Todas as páginas saindo desse servidor serão padrão ISO-8859-1, mesmo que especificado de forma contrária no cabeçalho html.

Clicando em Tools/Page Info/General podemos ver o Encoding e as tags meta.

Veja Também

Ligações Externas