Längst upp i XML-filen måste man ange en så kallade processorinstruktion. I denna
information anges vilken encoding som används. Encoding är en uppgift om hur mottagaren ska
tolka innehållet i filen. ”Internt” i datorn representeras varje tecken i en textfil av ett tal. Talet
kommer från en teckentabell där respektive tecken är kopplat till ett numeriskt värde. Olika
teckentabeller (olika encodingar) kan ha skillnader i sin uppbyggnad och det är ofta så att
ÅåÄäÖö har olika placering i tabellerna. Följden blir att en fil som är sparad enligt en
teckentabell men presenteras utifrån en annan teckentabell ibland får problem med enstaka
bokstäver. Om tecknet
□ visas istället för åäö kan det vara en indikation på att man har
problem med encoding.
Processorinstruktionen kan se ut såhär:
<?xml version="1.0" encoding="UTF-8"?>
I exemplet anger UTF-8 är dokumentets encoding/teckentabell.
Viktigt – Det händer ofta att systemleverantörer anger UTF-8 (eller motsv) trots att filen i
praktiken använder en annan encoding. Det räcker alltså inte att skriva i rätt encoding i
processorinformation, det är viktigt att angiven encoding också används när filen skapas!