Ved at bruge denne side acceptere du samtidig Brugbarts og vores partneres brug af cookies.

Læs mere

Danske bogstaver..

Hvor kan det være irriterende nogle gange..

Oprettet: 2012-02-26 04:43

By. BlueBoden

Jeg har som sådan ikke noget imod vores gode Æ Ø og Å, med undtagelse af når de bliver misbrugt til at konstruere ligegyldige ord. Men når det kommer til det tekniske, så må jeg indrømme det har givet mig en del problemer, som jeg håber jeg har fået løst.

Oprindeligt vidste jeg ikke meget om karakter koder, er dog glad for jeg fik sat mig ind i det vigtigste. Hvor mange bits eller prikker der bliver brugt til at gemme et enkelt tegn, tal, eller bogstav er mig fuldkommen ligegyldigt. Jeg vil bare gerne have at de applikationer jeg programmere, også kan vise de tegn jeg forventer af dem, uden at skulle erstatte dem med specielle HTML koder og andet snask.

Det var et større skridt at skifte fra iso-8859-1 til UTF-8 end jeg havde regnet med, og jeg løb ind i flere problemer, hvor jeg bare var totalt tom for ideer til hvad problemet kunne være. Men det var det hele værd.

Misforståelse af danske web-programmøre

Mange danske web-programmøre råder ganske enkelt til, at levere sider som UTF-8 via en slags kommando, eller funktion i det programmerings sprog som bliver brugt. De tager ikke højde for, at selve filerne, scriptsne, skal gemmes i, eller konverteres til UTF-8. Så når folk siger det ikke virker, og at deres elskede bogstaver bare er noget krimskrams på skærmen, så siger de med det samme, bare erstat dem med HTML alternativer, så virker det!

Det ser ganske vist ud til at virke, men fejlen er der stadig. Det er måske stadig bare en almindelig fil, kodet i hvad den oprindelige editor nu engang valgte. Hvorfor skulle man dog også erstatte Æ Ø og Å med HTML alternativer, når nu man kan få det til at virke uden?

Databasen skal også være i UTF-8

Det sværeste er at forstå hvordan man skal indstille databasen. Selv når alt tilsyneladende er indstillet korrekt, opstår der pludseligt et nyt problem. Hvorfor bliver indput til databasen gemt i et andet format, selvom databasen er indstillet til at bruge UTF-8? Tilsyneladende er det ikke den indstilling som bestemmer hvad format dataene som kommer til databasen bliver gemt i! Ganske forvirrende når script headers, og alt andet er indstillet korrekt. Det viser sig så, at selve forbindelsen til databasen også skal indstilles til at bruge UTF-8 før alt virker efter hensigten.

Gode råd til andre

Få installeret phpMyAdmin, så kan du nemt konfigurere dine tabeller, og se hvis et af dine scripts indsætter bogstaver som Æ Ø og Å forkert. Kollektionen kan godt være indstillet korrekt til UTF-8, og vil også vise Æ Ø og Å rigtigt i phpMyAdmins brugerflade, hvis de er indsat som UTF-8. Hvis ikke det er tilfældet vil de vises som nogle andre tegn.

De kan godt være indsat forkert, og stadig vises rigtigt på selve hjemmesiden. Men de vil altså se forkerte ud når du ser på dem i phpMyAdmin. Det er noget underligt rod, og jeg er stadig ikke helt sikker på hvad der skabte situationen. Men det stoppede da jeg fik mine scripts til at kommunikere med databasen i UTF-8.