Unicode zdobyło prawie 50% Sieci
Półtora roku temu wg wyliczeń Google użycie kodowania Unicode było porównywalne z innymi systemami kodowania (ASCII oraz ISO/CP).
Obecnie wykorzystanie Unicode w Sieci dochodzi powoli do 50%, gdy ASCII oraz ISO/CP mają po około 20 % udział. Jest to dość śmieszne, ponieważ nie ma nic bardziej oczywistego dla Internetu jak Unicode, którego historia sięga aż 1991 roku (1.0).
Pamiętam, gdy nie lada problemem stron internetowych było właśnie kodowanie. Microsoft trzymał się dla Polaków z CP-1250 (np. Front Page, Word), a druga część społeczeństwa używało ISO-8859-2.
Z tego powodu w polskim Internecie było sporo krzaczków, nie mówiąc o problemie tworzenia takich stron. Od kilku lat dość popularnym kodowaniem stało się UTF-8 i problemy jakby ręką odjął – przynajmniej ja go nie odczuwam.
Dodam, że Google już od wielu lat przechowuje swoje zasoby właśnie z wykorzystaniem Unicode. Obecnie Google planuje przejść na Unicode 5.2 (ogłoszone w październiku 2009), który oferuje dodatkowe 6600 znaków.
Podobne wpisy:
- Orangespace – Twoja własna strona internetowa
- Outlook Personal Folders File Format (PST)
- Słów kilka o openSuSE 10.2








Mateusz Kamiński

webit
29 sty, 2010
no tak, utf czyli unicode, to bardzo wygodna sprawa zwlaszcza w projektach wielojezykowtch. maly problem z obsluga utf mamy w php (na razie, bo poczawszy od wersji 6. bedzie juz pelne wsparcie dla unicode). czesto widzi sie w sieci strony gdzie tekst zostal skrocony lub dzielony i ktos nie wzial pod uwage ze znaki utf8 maja 2 bity – stad czesto widzimy krzaczek
no ale tym wlasnie odroznia sie dobry od przecietnego phpowca
matipl
29 sty, 2010
@webit: no nie każdy zna inne funkcje lub biblioteki
Jeśli się pamięta m.in. o mb_ to UTF nie stanowi problem w PHP, ale oczywiście przydałoby się natywne wsparcie
test
29 sty, 2010
Wiesz co to jest unicode?
test
29 sty, 2010
unicode a utf-8 to są dwie różne bajki.
@webit – znaki w utf-8 nie mają 2bajtów, mogą tyle mieć. w utf-16 mają 2 bajty
matipl
30 sty, 2010
@test: zastosowałem uogólnienie zakładając, że rozumiem różnicę między standardem a kodowaniem
po to też linki w tekście…
bo jedno wynika z drugiego
unicode, a utf8 to nie są 2 różne bajki