Jezični prevoditelj
Jezični prevoditelj (još i prevodilac, prevoditelj, programski prevodilac, programski prevoditelj, kompilator,[1][2] te kolokvijalno često kompajler od eng. compiler) jest računalni program koji čita program napisan u izvornom jeziku, te ga prevodi u istovjetni program u ciljnom (najčešće strojnom) jeziku. Formalna se definicija jezičnog prevoditelja zasniva na tri jezika: izvorni jezik, ciljni jezik i jezik izgradnje, te se jezični prevoditelj prikazuje na sljedeći način:
gdje je JP jezični prevoditelj, je izvorni jezik, je ciljni jezik, te je jezik izgradnje.
Primjer:
Programski kod - Java | Strojni kod | |
---|---|---|
public class Ggt { /* */ private static int ggt(int zahl1, int zahl2) { while (zahl1 != zahl2) { if (zahl1 < zahl2) { zahl2 = zahl2 - zahl1; } else { zahl2 = zahl1 - zahl2; } } return zahl1; } /* */ public static void main(String[] args) { /* */ int ersteZahl = Integer.parseInt(args[0]); int zweiteZahl = Integer.parseInt(args[1]); int ergebnis = ggt(ersteZahl, zweiteZahl); System.out.println("Der ggT von " ersteZahl " und " zweiteZahl " ist: " ergebnis); } } |
Prevoditelj → |
··· |
Obično je jezični prevoditelj i sam program, te je stoga jezik izgradnje programski jezik kojim je ostvaren sam prevoditelj.
Osim tri spomenuta jezika, razvijaju se i posebni metajezici (jezici definiranja jezika) koji omogućuju jednostavan zapis pravila programskih jezika
Dvije su osnovne faze rada prevoditelja:
- faza analize izvornog programa
- faza sinteze ciljnog programa
Tijekom faze analize izvornog programa izvode se dva procesa prevođenja, jedan tijekom leksičke analize, drugi tijekom sintaksne analize i semantičke analize.
Leksička analiza grupira znakove izvornog programa u osnovne elemente jezika, koje se zovu leksičke jedinke (engl. token) ili leksemi. Leksemi su npr. varijable, ključne riječi, konstante, operatori i pravopisni znakovi. Leksička se jedinka formalno zadaje kao niz znakova. Leksička pravila određuju skup svih pravilno napisanih leksičkih jedinki (nizova) zadanog programskog jezika.
Dozvoljava se da je skup pravilno napisanih leksičkih jedinki beskonačan i u formalnom smislu taj skup definira jezik leksičkih jedinki. Formalni automat je osnovica leksičkog analizatora. Tijekom leksičke analize, svaki se leksem zamijeni jedinstvenim znakom.
Leksički analizator također gradi podatkovnu strukturu zvanu tablica znakova (ili tablica simbola) u koju se spremaju svi ostali podaci važni za varijable i konstante.
Tijekom sintaksne analize izvodi se proces prihvaćanja nizova jedinstvenih znakova leksičkih jedinki, a tijekom semantičke analize izvodi se proces generiranja višeg međukoda. Formalni automat je okosnica i sintaksnog analizatora.
Semantički analizator pokreće proces generiranja višeg međukoda. Semantička pravila su interpretacijska pravila koja povezuju izvođenje programa s ponašanjem računala. Semantika jezika određuje skup dozvoljenih značenja.
Tijekom procesa generiranja višeg međukoda obično se izračunavaju konstantne vrijednosti i pojednostavi se struktura naredbe. Uobičajeno je da naredbe višeg međukoda sadrže kazaljke na mjesta u tablici znakova.
Tijekom faze sinteze ciljnog programa izvode se tri procesa prevođenja: prevođenje višeg međukoda u srednji međukod, prevođenje srednjeg međukoda u niži međukod i prevođenje nižeg međukoda u ciljni program.
Tijekom procesa prevođenja višeg međukoda u srednji međukod se obavlja pretvorba složenih podatkovnih struktura, kao što su nizovi podataka, i složenih kontrolnih programskih konstrukta u niz naredbi koje koriste isključivo varijable i jednostavne naredbe grananja.
Naredbe nižeg međukoda koriste simboličke registre r1 do r8.
Vidi interpreter, dekompilator, transkompilator, cross-kompilator, izvorni kod, asemblerski jezik, strojni jezik.
- ↑ Kiš Miroslav, Englesko-hrvatski i hrvatsko-engleski informatički rječnik, Zagreb, Naklada Ljevak, 2000., str. 211
- ↑ Demistificirani C , 2. izdanje, str. 18 (PDF). Inačica izvorne stranice (PDF) arhivirana 7. rujna 2012. Pristupljeno 20. lipnja 2012.