Apertium
Stabil version | 3.1.1 (21. maj 2009) |
---|---|
Skrevet i | C |
Operativsystem | POSIX-kompatibelt |
Tilgængelig på | Multi-sproget |
Type | Maskinoversættelse |
Licens | GNU General Public License |
Hjemmeside | www.apertium.org |
Apertium er en software-platform til regelbaseret maskinoversættelse af sprog. Det er fri software og udgivet under licensen GNU General Public License.
Apertium er et maskinoversættelsessystem med "snæver overførsel" (uden semantik), som bruger finite-state transducere til alle leksikalske transformationer og skjulte Markov modeller til ordklassetagging og behandling af ordklasse-flertydighed. For nogle sprogpar (f.eks. bretonsk-fransk) benyttes desuden tagging ifølge restriktionsgrammatik (Constraint Grammar).
Historie
[redigér | rediger kildetekst]Apertium opstod som en af maskinoversættelses-løsningerne i projektet OpenTrad, som var finansieret af den spanske regering. Det var oprindeligt skabt til at oversætte mellem tæt forbundne sprog, men er senere blevet udvidet til også at kunne behandle mere fjerntstående sprogpar. For at udvide med maskinoversættelse af et nyt sprogpar er det blot nødvendigt at udvikle de lingvistiske oplysninger (ordbøger, regler) i et veldefineret XML-format.
De sprogdata, som er udviklet for Apertium (i samarbejde med Universidade de Vigo, Universitat Politècnica de Catalunya og Universitat Pompeu Fabra) understøtter nu (i stabile versioner) sprogene asturiansk, baskisk, bretonsk, bulgarsk, catalansk, dansk, engelsk, esperanto, fransk, galicisk, islandsk, makedonsk, norsk (bokmål og nynorsk), occitansk, portugisisk, rumænsk, spansk, svensk og walisisk. Den fulde liste fremgår af nedenstående tabel.
Adskillige firmaer er ligeledes invelveret i udviklingen af Apertium, herunder Prompsit Language Engineering, Imaxin Software og Eleka Ingeniaritza Linguistikoa.
Projekt har deltaget i Google Summer of Code i 2009 and 2010 og i Google Code-in 2010.[1]
Sprogpar
[redigér | rediger kildetekst]Liste over de nuværende stabile sprogpar. (Hold musen over sprogkoderne for at se de sprog, de repræsenterer).
ast | eu | br | bg | ca | da | en | eo | fr | gl | is | mk | nb | nn | oc | pt | ro | es | sv | cy | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Asturiansk | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej |
Baskisk | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (→) | Nej | Nej |
Bretonsk | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Ja (→) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej |
Bulgarsk | Nej | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej |
Catalansk | Nej | Nej | Nej | Nej | — | Nej | Ja (⇄) | Ja (←) | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Ja (⇄) | Nej | Ja (⇄) | Nej | Nej |
Dansk | Nej | Nej | Nej | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (←) | Nej |
Engelsk | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | — | Ja (⇄) | Nej | Ja (⇄) | Ja (←) | Ja (←) | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Ja (←) |
Esperanto | Nej | Nej | Nej | Nej | Ja (←) | Nej | Ja (⇄) | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (←) | Nej | Nej |
Fransk | Nej | Nej | Ja (←) | Nej | Ja (⇄) | Nej | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej |
Galician | Nej | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Ja (⇄) | Nej | Nej |
Islandsk | Nej | Nej | Nej | Nej | Nej | Nej | Ja (→) | Nej | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej |
Makedonsk | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | Ja (→) | Nej | Nej | Nej | Nej | — | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej |
Norsk (Bokmål) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | — | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | Nej |
Norsk (Nynorsk) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | — | Nej | Nej | Nej | Nej | Nej | Nej |
Occitansk | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | — | Nej | Nej | Ja (⇄) | Nej | Nej |
Portugisisk | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | Nej | Nej | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | — | Nej | Ja (⇄) | Nej | Nej |
Rumænsk | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | — | Ja (←) | Nej | Nej |
Spansk | Ja (⇄) | Ja (←) | Nej | Nej | Ja (⇄) | Nej | Ja (⇄) | Ja (⇄) | Ja (⇄) | Nej | Nej | Nej | Nej | Nej | Ja (⇄) | Ja (⇄) | Ja (←) | — | Nej | Nej |
Svensk | Nej | Nej | Nej | Nej | Nej | Ja (→) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | — | Nej |
Walisisk | Nej | Nej | Nej | Nej | Nej | Nej | Ja (→) | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | Nej | — |
Note:
- → betyder, at der findes en ordbog fra sproget i forspalten til kolonnens sprogversion
- ← betyder, at der findes en ordbog fra kolonnens sprogversion til sproget i forspalten
- ⇄ betyder, at der findes ordbøger fra og til begge sprogversioner
Kilder
[redigér | rediger kildetekst]- ^ "Google Summer of Code page". Arkiveret fra originalen 16. marts 2011. Hentet 29. december 2010.
- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.