Löste gåtan från fängelset
Länge var det en av Asiens och Kinas mest gäckande utmaningar. Hur skulle man ”översätta” kinesiska skrivtecken till ett språk som kunde läsas av datorer?
Året var 1968. Fysikern Zhi Bingyi, som fram till nyligen haft ett tryggt jobb som statsanställd ingenjör i Shanghai, fann sig själv i en fängelsecell. Han hade gripits och anklagats för att vara en ”reaktionär akademiker” under Kinas pågående kulturrevolution.
I stället för att tampas med ekvationer, läsa forskningsrapporter och utveckla ny teknik stirrade den Leipzigutbildade fysikern nu på åtta skrifttecken på cellväggen: ”Lindring till dem som erkänner, hårdhet för dem som vägrar”, stod det.
Men plötsligt såg han något annat i de skarpa penseldragen. Han insåg att varje enskilt tecken var en kombination av vissa typer av penndrag, olika tjocka, och med prickar eller små streck.
Kunde dessa beståndsdelar kodas och matas in i en datamaskin? Tanken svindlade.
Ett antal försök att avkoda standardkinesiska hade redan gjorts, de flesta med ambitionen att det skulle göra språket lättare att lära sig för människor. Men Zhi var intresserad av en annan kodning, en ”översättning” som kunde läsas av en datamaskin, enligt historien om honom som publiceras i magasinet Wired och berättas i boken Kingdom of Characters: The Language Revolution That Made China Modern.
Kina hade vid den här tiden börjat konstruera avancerade räknemaskiner som påminde om datorer. De användes bland annat av luftfartsmyndigheter, försvaret, jordbruket och industrin.
Men, liksom i västvärlden, fanns ett stort behov av att kunna processa text, inte enbart siffror.
Zhi, som före gripandet hade utvecklat modeller av datorer, insåg snabbt utmaningen i att översätta tiotusentals skrifttecken till ett språk som datorer förstår, ett språk som består av ettor och nollor.
Men väggmålningen gav honom en idé. Kunde skrivtecknens beståndsdelar ”översättas” med hjälp av alfabetiska bokstäver, tecken som redan användes av dataprogrammerare?
Skrev på kopp – och torkade av
Zhi Bingyi behövde papper och penna för att testa sin hypotes. Men vakterna vägrade honom det, han fick inte ens toalettpapper. Den enda möjligheten var en tekopp.
Sagt och gjort. Varje dag skrev Zhi (med en stulen penna) så många tecken han kunde på den matta keramikkoppen – och prövade att överföra skrivteckens beståndsdelar till en kombination av västerländska bokstäver. När koppen var fullklottrad torkade han av den och började på nytt.
1969 frigavs Zhi Bingyi efter 14 månader i fängelse. Han var nöjd med de enkla städ- och väktarjobb han sattes på, för då kunde han fortsätta att utveckla sin idé i ett lager. Vetenskapliga artiklar som visade på hur man i Japan arbetade med att digitalisera sitt skriftspråk var uppmuntrande, men det krävdes en komponentbaserad indexering av tecknen för att komma vidare.
Det tog ytterligare två år. De flesta kinesiska skrivtecken kan brytas ner i mellan två och fyra komponenter och det finns uppemot 400 sådana totalt. Zhi gav varje kinesiskt tecken en alfabetisk kod som var 2–4 bokstäver lång. Som jämförelse är ett ord på engelska i genomsnitt 4,8 bokstäver långt.
Lyriska rubriker
1978 presenterade Zhi Bingyi slutligen sitt system i den vetenskapliga tidskriften Nature Magazine i Kina. Han beskrev ett översättningssystem byggt på koder bestående av fyra bokstäver som totalt använde alfabetets alla 26 tecken. Totalt fanns 456 976 koder – mer än tillräckligt för komponentkombinationerna i de omkring 50 000 kinesiska skrivtecken som existerar.
Zhis system kom att jämföras med Morsekod – det beskrevs som snabbt, intuitivt och transparent.
”Det kinesiska skriftspråket har nått datamaskinen”, skrev dagstidningen Wenhui Daily i Shanghai lyriskt.
Zhi Bingyi fick så äntligen upprättelse, och innan han gick bort 1993 valdes han in i Kinas vetenskapsakademi och hyllades som pionjär.
Publicerat 28.02.2022