Proces pretvorbe podataka iz jednog oblika u drugi poznat je kao kodiranje. Koristi se za transformaciju podataka tako da ih različiti sustavi mogu podržati i koristiti. Kodiranje funkcionira slično kao pretvaranje temperature iz Celzijevih stupnjeva u Fahrenheite, budući da se samo pretvara u drugi oblik, ali izvorna vrijednost uvijek ostaje ista. Kodiranje se koristi uglavnom u dva polja:
Napomena: kodiranje se razlikuje od enkripcije jer njegova glavna svrha nije sakriti podatke, već ih pretvoriti u format kako bi se mogli pravilno koristiti.
U ovoj temi raspravljat ćemo o različitim vrstama tehnika kodiranja koje se koriste u računalstvu.
Vrsta tehnike kodiranja
Kodiranje znakova
Kodiranje znakova kodira znakove u bajtove . Obavještava računala kako interpretirati nule i jedinice u stvarne znakove, brojeve i simbole. Računalo razumije samo binarne podatke; stoga je potrebno te znakove pretvoriti u numeričke kodove. Da bi se to postiglo, svaki se znak pretvara u binarni kod, a za to se tekstualni dokumenti spremaju s vrstama kodiranja. To se može učiniti uparivanjem brojeva sa znakovima. Ako ne primijenimo kodiranje znakova, naše web mjesto neće prikazati znakove i tekst u ispravnom formatu. Zbog toga će se smanjiti čitljivost, a stroj neće moći pravilno obraditi podatke. Nadalje, kodiranje znakova osigurava da svaki znak ima pravilan prikaz u računalnom ili binarnom formatu.
Postoje različite vrste tehnika kodiranja znakova koje su navedene u nastavku:
HTML kodiranje
HTML kodiranje koristi se za prikaz HTML stranice u ispravnom formatu. Pomoću kodiranja web preglednik saznaje koji će se skup znakova koristiti.
U HTML-u postoje različiti znakovi koji se koriste u HTML oznakama kao što su . Da bismo te znakove kodirali kao sadržaj, moramo upotrijebiti kodiranje.
URL kodiranje
URL (Uniform resource locator) Kodiranje se koristi za pretvoriti znakove u takav format da se mogu prenositi putem interneta . Također je poznato kao postotno kodiranje. Kodiranje URL-a izvodi se za slanje URL-a na internet pomoću ASCII skupa znakova. Znakovi koji nisu ASCII zamjenjuju se sa %, nakon čega slijede heksadecimalne znamenke.
UNICODE kodiranje
Unicode je standard kodiranja za univerzalni skup znakova. Omogućuje kodiranje, predstavljanje i rukovanje tekstom predstavljenim na većini jezika ili sustava pisanja koji su dostupni diljem svijeta. Omogućuje kodnu točku ili broj za svaki znak u svakom podržanom jeziku. Može predstavljati otprilike sve moguće znakove u svim jezicima. Određeni niz bitova poznat je kao kodna jedinica.
UNICODE standard može koristiti 8, 16 ili 32 bita za predstavljanje znakova.
Unicode standard definira Unicode transformacijski format (UTF) za kodiranje kodnih točaka.
Standard kodiranja UNICODE ima sljedeće UTF sheme:
UTF8 definiran je standardom UNICODE, koji je kodiranje znakova promjenjive širine koje se koristi u elektroničkim komunikacijama. UTF-8 može kodirati svih 1.112.064 valjanih znakovnih kodnih točaka u Unicodeu pomoću jedne do četiri jednobajtne (8-bitne) kodne jedinice.
Kodiranje UTF16 predstavlja kodne točke znaka pomoću jednog od dva 16-bitna cijela broja.
UTF32 kodiranje predstavlja svaku kodnu točku kao 32-bitne cijele brojeve.
Kodiranje Base64
Kodiranje Base64 koristi se za kodiranje binarnih podataka u ekvivalentne ASCII znakove. Kodiranje Base64 koristi se u sustavu pošte jer sustavi pošte kao što je SMTP ne mogu raditi s binarnim podacima jer prihvaćaju samo ASCII tekstualne podatke. Također se koristi u jednostavnoj HTTP autentifikaciji za kodiranje vjerodajnica. Štoviše, također se koristi za prijenos binarnih podataka u kolačiće i druge parametre kako bi podaci bili nečitljivi kako bi se spriječilo neovlašteno mijenjanje. Ako se slika ili druga datoteka prenese bez Base64 kodiranja, bit će oštećena jer sustav e-pošte ne može raditi s binarnim podacima.
Base64 predstavlja podatke u blokove od 3 bajta, gdje svaki bajt sadrži 8 bitova; stoga predstavlja 24 bita. Ova 24 bita su podijeljena u četiri grupe od po 6 bita. Svaka od ovih grupa ili dijelova pretvara se u ekvivalentnu Base64 vrijednost.
ASCII kodiranje
Američki standardni kod za razmjenu informacija (ASCII) je vrsta kodiranja znakova. Bio je to prvi standard za kodiranje znakova objavljen 1963. godine.
ASCII kod se koristi za predstavljanje engleskih znakova kao brojeva, gdje je svakom slovu dodijeljen broj iz 0 do 127. Većina modernih shema kodiranja znakova temelji se na ASCII-ju, iako podržavaju mnoge dodatne znakove. To je jednobajtno kodiranje samo korištenjem donjih 7 bitova. U ASCII datoteci svaki abecedni, numerički ili posebni znak predstavljen je 7-bitnim binarnim brojem. Svaki znak na tipkovnici ima ekvivalentnu ASCII vrijednost.
Kodiranje slike i zvuka i videa
Kodiranje slike te zvuka i videa izvodi se radi uštede prostora za pohranu. Medijska datoteka poput slike, zvuka i videa kodirana je kako bi se spremila u učinkovitijem i komprimiranijem formatu.
Ove kodirane datoteke sadrže isti sadržaj obično slične kvalitete, ali u komprimiranoj veličini, tako da se mogu spremiti na manje prostora, mogu se lako prenijeti putem pošte ili se mogu preuzeti na sustav.
Možemo to shvatiti kao . WAV audio datoteka pretvara se u .MP3 datoteku kako bi se smanjila veličina za 1/10thna izvornu veličinu.