Både uklarheter i slutten av ordet og usikkerhet på hele ordet markeres som "bokstaver??". Det er ikke enkelt mulig å skille disse tilfellene. Jeg foreslår at man markerer usikkerhet i hele ordet som "bokstaver ??" mens uklarheter i slutten av ordet som "bokstaver??", dvs. mellomrom før ??.
Det er for dumt å nekte å akseptere et bestemt tegn fordi det brukes som feltseperator. Det må istedet velges en brukbar koding av dette tegnet. Aktuelle kodingsmetoder er '\<' (slik som unix. '\' kodes med '\\') Annet alternativ er '<' slik HTML bruker. & blir da kodet &
ISO 8859/1 er i dag det tegnsettet som er spesifisert av internasjonale standardiseringsorganer for bruk i Norge. MS-DOS' tegnkoder gir en risiko ved transport over linker med stripping til 7-bits. De norske tegnene for æ, ø og å ender opp som kontrollkoder. Dette oppstår ikke ved ISO 8859/1. I tillegg har ISO spesifisert andre tegnsett som gir mulighet for russisk, hebraisk og det meste i sine standarder ISO 8895/[1-15]. Jeg ber om at man legger seg på den første som standard utvekslingsformat. Dette er også det MS-Windows har som standard tegnsett under navnet ANSI, og som danner utgangpunktet for UNICODE - 16-bits tegnsett.
Man bør heller ikke kreve at alle filene følger et spesiellt tegnsett.
Det bør legges inn informasjon i formatet som forteller hvilket tegnsett som benyttes. Det kan oppstå tilfeller da denne standarden brukes for å registrere data med tegn som ikke finnes i standard-tegnsettet, og det bør da være mulig å spesifisere alternativ.