Internationalisering, lokalisering, kodning, Island och översättning av en japansk kattfotowebbplats

internationalisering översättning

internationaliseringDet finns mycket information där ute när det gäller internationalisering, lokalisering och kodning inom webbapplikationer. Det finns också mycket missförstånd om vad var och en tillhandahåller för en webbapplikation. Här är mitt tag ...

När en webbläsare ansluter till en webbserver, skickar den en hel del variabler och gör ytterligare förfrågningar, här är ett exempel:

GET / HTTP / 1.1
Värd: www.dknewmedia.com
Användaragent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Acceptera: HTTP Acceptera = text / xml, applikation / xml, applikation / xhtml + xml, text / html; q = 0.9, text / vanlig; q = 0.8, bild / png, * / *; q = 0.5
Acceptera-språk: en-us, en; q = 0.5
Acceptera-kodning: gzip, tömma
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

internationalisering

Internationalisering är en sammansättning av många saker:

  1. Lokalisering: Förmågan att identifiera vilket språk och plats en besökare besöker från. Detta görs via HTTP-förfrågningar där besökaren identifieras av en lokal. I mitt fall är det en-US. "Sv" är engelska och "USA" är USA. Det här är en inställning i mitt operativsystem.
  2. Tidszoner: Möjligheten att justera efter tidszoner. Detta uppnås normalt genom att ställa in din server till en Greenwich Mean Time (GMT) och sedan låta användare ställa in sin lokala förskjutning från GMT.
  3. Teckenkodning: Detta är förmågan att visa språkuppsättningar korrekt. Det skiljer sig från lokalisering eftersom lokalisering kan berätta språk och region på datorn som begäran från, men det kommer inte att berätta för mig vilket språk läsare begär ... det är upp till läsaren!

Observera i min HTTP-rubrik när webbläsaren gjorde begäran, den berättade för servern att den begärde min plats (Accept-Language: en-us); Men det måste också berätta för servern vilken teckenuppsättning som begärs (Acceptera-teckenuppsättning: Acceptera-teckenuppsättning: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 och utf -8 är båda tillåtna teckenuppsättningar.

Lokalisering

I denna fantastiska blandade värld dikterar lokalisering aldrig språk längre. Även om jag är i USA kan jag absolut läsa ett annat språk med en annan teckenuppsättning ... det är vad som händer när jag använder Google Hindi (Jag använder inte riktigt Google Hindi). Min begäran om språk och teckenuppsättning är identisk som när jag begär Google engelska sida, men jag får faktiskt en sida som jag inte kan läsa eftersom jag inte har teckenuppsättningen. Allt kommer upp ??????????? ... Jag kan dock ladda den karaktärsuppsättningen till Firefox (Firefox> Inställningar> Avancerat> Språk):

Firefox Load Language

Om jag laddar det språket kan jag sedan begära sidan i dess ursprungliga teckenuppsättning och visa den på min dator även om min standardinställning är en-US!

Så ... om jag är en hindi-student, studerar jag engelska på Purdue och är ansluten via VPN till skolans server, på semester i Australien ... det finns 3 olika inställningar som måste tillämpas på applikationen för att verkligen internationaliseras - och ingen beror på den andra.

Min lokal skulle komma som en-US, men min tidszon är Australien, men språket jag begär från webbplatsen kan vara hindi. Om jag skulle programmera min ansökan att göra antaganden baserat på min dators lokal, skulle jag ha helt fel - mata personen engelska i en östlig tidszon. Helst skulle jag programmera min ansökan att erbjuda båda inställningar för språk och tidszon ... men jag skulle inte anta dem baserat på språk.

Island - det ultimata exemplet

Vi är okunniga om flerspråkiga och flerspråkiga utmaningar i USA där vi alla tala engelska [sarkasm underförstådd]. I vissa länder, till exempel Island, trots att modersmålet är isländskt, växer det otroliga isländska folket upp med att lära sig 3 språk! Eftersom Island är ett land mitt i Europa och Nordamerika, arbetar deras företag över flera kontinenter, språk, språkdialekter och flera tidszoner från sitt skrivbord!

Många isländska webbplatser är byggda på amerikanska engelska, brittiska engelska, isländska, spanska, spanska, franska och tyska! Tänk dig hur utmanande det skulle vara att bygga Icelandair webbplatsapplikationer och biljettsystem ... wow!

FRISKRIVNING: Jag har haft det absolut nöjet att arbeta med de fina folket från Icelandair och kan berätta att de är några av de mest begåvade och vänliga yrkesverksamma jag har haft nöjet att arbeta med. Det är helt enkelt ett fantastiskt land och folk! Besök ... ta Icelandair och se till att besöka Blue Lagoon!

Språk kontra kodning

Det finns till och med olika teckenkodningar på ett enda språk som inte spelar bra med varandra! Exempel: Ett japanskt e-postmeddelande skrivet i Shift-JIS kan bli oläsligt på en japansk persons dator med lokalisering inställd på ja-JP eftersom deras e-postserver bara känner igen EUC-JP. Helst bör en kund kunna ställa in vilken kodning de vill ha samt vilket språk - helt enkelt se till att kodningen och språket är kompatibla med vad kunden begär.

Om jag vill läsa japanska kan jag behöva välja både japanska som mitt språk OCH Shift-JIS för kodning för att visa det språket ordentligt. Här är lite mer förvirring att lägga till blandningen ... vissa kodningstyper stöder flera språk. UNICODE / UTF8 stöder dussintals. Det omvända är också sant. Vissa språk kan läsas i många kodningstyper. Om det inte är vettigt ... Jag ber om ursäkt, det är en mycket komplex fråga.

En dag tror jag (hoppas) att allt detta kommer att förändras. Jag tror att de ursprungliga designarna av lokaliseringskoder hoppades att språk-landskombinationen skulle vara allt som behövs ... men vi har blivit mycket mer sofistikerade. Kom ihåg att mycket av detta utvecklades innan ett internet fanns. Med tillkomsten av GIS, kanske en person kan välja sin kodning och GIS skulle hantera tidszon och lokal information.

internationalisering

Tillbaka till internationaliseringsstöd. Om du vill tillhandahålla en internationaliserad applikation måste du:

  1. Stöd flera kodningstyper, språk och ha översättningsfiler för att visa dessa översättningar.
  2. Låt klienten ställa in sitt språk, och till och med kanske deras kodningstyp, om det behövs.
  3. Stöd tidszoner genom att låta användare referera till sin tidszon jämfört med GMT.
  4. Använd lokaliseringskoder med försiktighet ... de visar INTE exakt vad din användare faktiskt begär eller vad de kan läsa.

Översättning

Maskinöversättning är fortfarande i sin linda. Det finns ett antal webbplatser där ute (och Wordpress Insticksprogram) som erbjuder maskinöversättning av din webbplats. Frestas inte att göra detta ... det finns två skäl till varför:

  1. Om maskinöversättning fungerar har användaren som checkar ut din webbplats redan en översättare att arbeta med.
  2. Maskinöversättning suger.

Tro mig inte? Här är en japansk översättning till dig:
Klistrad från Masatsu-fil - en kille med massor av bilder på katter:

Japanskt blogginlägg

???
- 00:29:35 av masatsu

??????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
?????????????????????????????

?????????????????????????????????? (?)

?????????????????

??????????????
???
???

???????????????????????????????????????

???????????????????????????????

??????????????????????????????????????
?????????????????????????????????
?????????? Ag ????????????????

?????????????????????????????????????

Maskinöversättning:

?? Hann ?????
-00: 29: 35 av masatsu

Namnet på nävehelgen på en / elefanten som dykt upp på gårdagens “a / the beast fist flotta ?? ranger ”“ ?? Hann ???? ” med / radioskådespelaren Yutaka Mizushima….

? (?) det gör bläckfisk lätt.

För att även radioaktören för nävehelgen, mästare ????? av en / katten är den kinesiska kvitten av en Nagai Ichiro = dragon ball personal på en / den ?? ranger ser ut som de människor som är kvicka kommentarer vet lätt.

?????? (Svetten) som jag helt glömde bort i år "hemligheten med superflottans namn", med vanlig praxis varje år?,

?????? Om jag skriver för sent i år,

??????? helgedom ??? (kan hur?)? vändtegen (?? inte klippa) Fukami ?? (? eller observera kan?) är det / det är det som gör

?????? Med blir det "en burk /? /?", Med andra ord "kung fu", när du raderar och ändrar huvudet på ett / namnet.

?????? Även om det sägs öka ytterligare två påstås det kan bli vilken typ av namn.

Sanningen sägs vara "ålder" eftersom silverelementets symbol är Ag?, Även om namnet "den ???? silver ”Takaoka? tekniker av ??????? tänkte att karaktären heter "?" användes tillsammans med en silver'screen? -film, om den kallas med en tilläggsmedlem.

?????? Men jag tänker självisk, att min teori inte är orelaterad att "?" ingår i en / den kinesiska karaktären.

Jag är säker på att omvänd polaritet på denna översättning skulle ge en lika läsbar diktion på engelska. Du förstod posten, eller hur?

2 Kommentarer

  1. 1

Vad tror du?

Den här sidan använder Akismet för att minska spam. Läs om hur din kommentardata behandlas.