Format de fichier des dictionnaires |
Préfixes
Examinons ce fragment du dictionnaire de préfixes gpl/pierrick/brihaye/aramorph/dictionaries/dictPrefixes :
; conjunctions w wa Pref-Wa and <pos>wa/CONJ+</pos> f fa Pref-Wa and;so <pos>fa/CONJ+</pos>
On constate que les commentaires sont introduits par ; et que les lignes significatives sont divisées au moyen de tabulations déterminant respectivement :
- le squelette consonnantique du préfixe (selon le système de translitération de Buckwalter)
- la vocalisation du préfixe (selon le même système)
- la catégorie morphologique du préfixe
- une ou plusieurs traductions du préfixe suivies d'une ou plusieurs catégories grammaticales. Noter le + indiquant qu'un radical est attendu après ce préfixe.
Certaines informations sont facultatives. L'exemple le plus caractéristique est celui du préfixe vide :
; The first category is the null prefix (has a null gloss as well): Pref-0
... où seule apparaît la catégorie morphologique.
Suffixes
Examinons maintenant ce fragment du dictionnaire de suffixes gpl/pierrick/brihaye/aramorph/dictionaries/dictSuffixes :
; perfect verb, null suffix: banA-h, daEA-h h hu PVSuff-0ah he/it <verb> it/him <pos>+(null)/PVSUFF_SUBJ:3MS+hu/PVSUFF_DO:3MS</pos> hmA humA PVSuff-0ah he/it <verb> them (both) <pos>+(null)/PVSUFF_SUBJ:3MS+humA/PVSUFF_DO:3D</pos> hm hum PVSuff-0ah he/it <verb> them <pos>+(null)/PVSUFF_SUBJ:3MS+hum/PVSUFF_DO:3MP</pos> hA hA PVSuff-0ah he/it <verb> it/them/her <pos>+(null)/PVSUFF_SUBJ:3MS+hA/PVSUFF_DO:3FS</pos> hn hun~a PVSuff-0ah he/it <verb> them <pos>+(null)/PVSUFF_SUBJ:3MS+hun~a/PVSUFF_DO:3FP</pos> k ka PVSuff-0ah he/it <verb> you <pos>+(null)/PVSUFF_SUBJ:3MS+ka/PVSUFF_DO:2MS</pos> k ki PVSuff-0ah he/it <verb> you <pos>+(null)/PVSUFF_SUBJ:3MS+ki/PVSUFF_DO:2FS</pos> kmA kumA PVSuff-0ah he/it <verb> you (both) <pos>+(null)/PVSUFF_SUBJ:3MS+kumA/PVSUFF_DO:2D</pos> km kum PVSuff-0ah he/it <verb> you <pos>+(null)/PVSUFF_SUBJ:3MS+kum/PVSUFF_DO:2MP</pos> kn kun~a PVSuff-0ah he/it <verb> you <pos>+(null)/PVSUFF_SUBJ:3MS+kun~a/PVSUFF_DO:2FP</pos> ny niy PVSuff-0ah he/it <verb> me <pos>+(null)/PVSUFF_SUBJ:3MS+niy/PVSUFF_DO:1S</pos> nA nA PVSuff-0ah he/it <verb> us <pos>+(null)/PVSUFF_SUBJ:3MS+nA/PVSUFF_DO:1P</pos>
Le principe est strictement le même, bien que l'exemple soit légèrement plus complexe. On a en effet une double succession de suffixes, le premier étant le suffixe Ø de la troisième personne singulier masculin de l'accompli, le second étant relatif à un objet direct pronominal. On notera le + de liaison avec le radical puis le + de liaison avec le suffixe Ø.
Radicaux
Examinons ce fragment du dictionnaire de radicaux gpl/pierrick/brihaye/aramorph/dictionaries/dictstems :
;
;--- ktb
;; katab-u_1
ktb katab PV write
ktb kotub IV write
ktb kutib PV_Pass be written;be fated;be destined
ktb kotab IV_Pass_yu be written;be fated;be destined
;; kAtab_1
kAtb kAtab PV correspond with
kAtb kAtib IV_yu correspond with
;; >akotab_1
>ktb >akotab PV dictate;make write
Aktb >akotab PV dictate;make write
ktb kotib IV_yu dictate;make write
ktb kotab IV_Pass_yu be dictated
;; takAtab_1
tkAtb takAtab PV correspond
tkAtb takAtab IV correspond
;; {inokatab_1
<nktb {inokatab PV subscribe
Anktb {inokatab PV subscribe
nktb nokatib IV subscribe
;; {ikotatab_1
<kttb {ikotatab PV register;enroll
Akttb {ikotatab PV register;enroll
kttb kotatib IV register;enroll
;; {isotakotab_1
<stktb {isotakotab PV make write;dictate
Astktb {isotakotab PV make write;dictate
stktb sotakotib IV make write;dictate
;; kitAb_1
ktAb kitAb Ndu book
ktb kutub N books
;; kitAboxAnap_1
ktAbxAn kitAboxAn NapAt library;bookstore
ktbxAn kutuboxAn NapAt library;bookstore
;; kutubiy~_1
ktby kutubiy~ Ndu book-related
;; kutubiy~_2
ktby kutubiy~ Ndu bookseller
ktby kutubiy~ Nap booksellers <pos>kutubiy~/NOUN</pos>
;; kut~Ab_1
ktAb kut~Ab N kuttab (village school);Quran school
ktAtyb katAtiyb Ndip kuttab (village schools);Quran schools
;; kutay~ib_1
ktyb kutay~ib NduAt booklet
;; kitAbap_1
ktAb kitAb Nap writing
;; kitAbap_2
ktAb kitAb Napdu essay;piece of writing
ktAb kitAb NAt writings;essays
;; kitAbiy~_1
ktAby kitAbiy~ N-ap writing;written <pos>kitAbiy~/ADJ</pos>
;; katiybap_1
ktyb katiyb Napdu brigade;squadron;corps
ktA}b katA}ib Ndip brigades;squadrons;corps
ktA}b katA}ib Ndip Phalangists
;; katA}ibiy~_1
ktA}by katA}ibiy~ Nall brigade;corps <pos>katA}ibiy~/NOUN</pos>
ktA}by katA}ibiy~ Nall brigade;corps <pos>katA}ibiy~/ADJ</pos>
;; katA}ibiy~_2
ktA}by katA}ibiy~ Nall Phalangist <pos>katA}ibiy~/NOUN</pos>
ktA}by katA}ibiy~ Nall Phalangist <pos>katA}ibiy~/ADJ</pos>
;; makotab_1
mktb makotab Ndu bureau;office;department
mkAtb makAtib Ndip bureaus;offices
;; makotabiy~_1
mktby makotabiy~ N-ap office <pos>makotabiy~/ADJ</pos>
;; makotabap_1
mktb makotab NapAt library;bookstore
mkAtb makAtib Ndip libraries;bookstores
;; mikotAb_1
mktAb mikotAb Ndu printer
;; mukAtabap_1
mkAtb mukAtab NapAt correspondence
;; {ikotitAb_1
<kttAb {ikotitAb N/At enrollment;registration;subscription
AkttAb {ikotitAb N/At enrollment;registration;subscription
;; {isotikotAb_1
<stktAb {isotikotAb N/At dictation
AstktAb {isotikotAb N/At dictation
<stktAby {isotikotAbiy~ N-ap dictation <pos>{isotikotAbiy~/ADJ</pos>
AstktAby {isotikotAbiy~ N-ap dictation <pos>{isotikotAbiy~/ADJ</pos>
;; kAtib_1
kAtb kAtib N/ap writer;author
kAtb kAtib N/ap clerk
ktAb kut~Ab N authors;writers
ktb katab Nap authors;writers
;; kAtib_2
kAtb kAtib Nall writing <pos>kAtib/ADJ</pos>
;; makotuwb_1
mktwb makotuwb N-ap written <pos>makotuwb/ADJ</pos>
;; makotuwb_2
mktwb makotuwb Ndu letter;message
mkAtyb makAtiyb Ndip letters;messages
;; mukAtib_1
mkAtb mukAtib Nall correspondent;reporter
;; mukotatib_1
mkttb mukotatib Nall subscriber
;
Le format est très légèrement différent puisqu'une ligne commençant par ;; donne un identifiant de lemme. Tout le reste est néanmoins similaire.
On remarquera que la catégorie grammaticale est souvent absente car elle peut être extrapolée à partir de la catégorie morphologique. On notera cependant quelques exemples où la catégorie grammaticale doit être précisée car une catégorie morphologique comme une nisba, morphologicalement nominale, peut donner lieu à des utilisations adjectivales.
Ceci permettrait de traiter les dictionnaires directement en arabe plutôt que par l'intermédiaire du système de translitération de Buckwalter et permettrait d'exploiter le support Unicode natif de Java.
La version 2.0 de la version Perl d'Aramorph, utilise des dictionnaires en XML, mais elle n'est malheureusement pas en GPL.
