Files
le-matelot/client/plugins/recherche/stemmer/PaiceHuskStemRules_fr.php
2020-01-27 08:56:08 +01:00

408 lines
12 KiB
PHP

<?php
/*
*
* implements a Paice/Husk Stemmer written in PHP by Alexis Ulrich (http://alx2002.free.fr)
*
* rewriting rules to extract a stem from a French word
*
* This code is in the public domain.
*
*/
$PaiceHuskStemmerRules_fr = array(
'esre1>', # { -erse > -ers }
'esio1>', # { -oise > -ois }
'siol1.', # { -lois > -loi }
'siof0.', # { -fois > -fois }
'sioe0.', # { -eois > -eois }
'sio3>', # { -ois > - }
'st1>', # { -ts > -t }
'sf1>', # { -fs > -f }
'sle1>', # { -els > -el }
'slo1>', # { -ols > -ol }
'sé1>', # { -és > -é }
'étuae5.', # { -eauté > - }
'étuae2.', # { -eauté > -eau }
'tnia0.', # { -aint > -aint }
'tniv1.', # { -vint > -vin }
'tni3>', # { -int > - }
'suor1.', # { -rous > -ou }
'suo0.', # { -ous > -ous }
'sdrail5.', # { -liards > -l }
'sdrai4.', # { -iards > -i }
'erèi1>', # { -ière > -ier }
'sesue3x>', # { -euses > -euse }
'esuey5i.', # { -yeuse > -i }
'esue2x>', # { -euse > -eux }
'se1>', # { -es > -e }
'erèg3.', # { -gère > -g }
'eca1>', # { -ace > -ac }
'esiah0.', # { -haise > - }
'esi1>', # { -ise > -is }
'siss2.', # { -ssis > -ss }
'sir2>', # { -ris > -r }
'sit2>', # { -tis > -t }
'egané1.', # { -énage > -énag }
'egalli6>', # { -illage > - }
'egass1.', # { -ssage > -sag }
'egas0.', # { -sage > - }
'egat3.', # { -tage > - }
'ega3>', # { -age > - }
'ette4>', # { -ette > - }
'ett2>', # { -tte > -t }
'etio1.', # { -oite > -oit }
'tioç4c.', # { -çoit > -c }
'tio0.', # { -oit > -oit }
'et1>', # { -te > -t }
'eb1>', # { -be > -b }
'snia1>', # { -ains > -ain }
'eniatnau8>', # { -uantaine > - }
'eniatn4.', # { -ntaine > -nt }
'enia1>', # { -aine > -ain }
'niatnio3.', # { -ointain > -oint }
'niatg3.', # { -gtain > -gt }
'eé1>', # { -ée > -é }
'éhcat1.', # { -taché > -tach }
'éhca4.', # { -aché > - }
'étila5>', # { -alité > - }
'étici5.', # { -icité > - }
'étir1.', # { -rité > -rit }
'éti3>', # { -ité > - }
'égan1.', # { -nagé > -nag }
'éga3>', # { -agé > - }
'étehc1.', # { -cheté > -chet }
'éte3>', # { -eté > - }
'éit0.', # { -tié > -tié }
'é1>', # { -é > - }
'eire4.', # { -erie > - }
'eirue5.', # { -eurie > - }
'eio1.', # { -oie > -oi }
'eia1.', # { -aie > -ai }
'ei1>', # { -ie > -i }
'eng1.', # { -gne > -gn }
'xuaessi7.', # { -isseaux > - }
'xuae1>', # { -eaux > -eau }
'uaes0.', # { -seau > -seau }
'uae3.', # { -eau > - }
'xuave2l.', # { -evaux > -eval }
'xuav2li>', # { -vaux > -vail }
'xua3la>', # { -aux > -al }
'ela1>', # { -ale > -al }
'lart2.', # { -tral > -tr }
'lani2>', # { -inal > -in }
'laé2>', # { -éal > -é }
'siay4i.', # { -yais > -i }
'siassia7.', # { -aissais > - }
'siarv1*.', # { -vrais > -vrai if intact }
'sia1>', # { -ais > -ai }
'tneiayo6i.', # { -oyaient > -oi }
'tneiay6i.', # { -yaient > -i }
'tneiassia9.', # { -aissaient > - }
'tneiareio7.', # { -oieraient > -oi }
'tneia5>', # { -aient > - }
'tneia4>', # { -aient > -a }
'tiario4.', # { -oirait > -oi }
'tiarim3.', # { -mirait > -mir }
'tiaria3.', # { -airait > -air }
'tiaris3.', # { -sirait > -sir }
'tiari5.', # { -irait > - }
'tiarve6>', # { -evrait > - }
'tiare5>', # { -erait > - }
'iare4>', # { -erai > - }
'are3>', # { -era > - }
'tiay4i.', # { -yait > -i }
'tia3>', # { -ait > - }
'tnay4i.', # { -yant > -i }
'emèiu5>', # { -uième > - }
'emèi4>', # { -ième > - }
'tnaun3.', # { -nuant > -nu }
'tnauqo3.', # { -oquant > -oqu }
'tnau4>', # { -uant > - }
'tnaf0.', # { -fant > -fant }
'tnaté2>', # { -étant > -ét }
'tna3>', # { -ant > - }
'tno3>', # { -ont > - }
'zeiy4i.', # { -yiez > -i }
'zey3i.', # { -yez > -i }
'zeire5>', # { -eriez > - }
'zeird4.', # { -driez > -d }
'zeirio4.', # { -oiriez > -oi }
'ze2>', # { -ez > - }
'ssiab0.', # { -baiss > - }
'ssia4.', # { -aiss > - }
'ssi3.', # { -iss > - }
'tnemma6>', # { -amment > - }
'tnemesuey9i.', # { -yeusement > -i }
'tnemesue8>', # { -eusement > - }
'tnemevi7.', # { -ivement > - }
'tnemessia5.', # { -aissement > -aiss }
'tnemessi8.', # { -issement > - }
'tneme5>', # { -ement > - }
'tnemia4.', # { -aiment > -ai }
'tnemé5>', # { -ément > - }
'el2l>', # { -le > -l }
'lle3le>', # { -ell > -el }
'letô0.', # { -ôtel > -ôtel }
'lepp0.', # { -ppel > -ppel }
'le2>', # { -el > - }
'srei1>', # { -iers > -ier }
'reit3.', # { -tier > -t }
'reila2.', # { -alier > -ali }
'rei3>', # { -ier > - }
'ertâe5.', # { -eâtre > - }
'ertâé1.', # { -éâtre > -éâtr }
'ertâ4.', # { -âtre > - }
'drai4.', # { -iard > - }
'erdro0.', # { -ordre > -ordre }
'erute5.', # { -eture > - }
'ruta0.', # { -atur > -atur }
'eruta1.', # { -ature > -atur }
'erutiov1.', # { -voiture > -voitur }
'erub3.', # { -bure > -b }
'eruh3.', # { -hure > -h }
'erul3.', # { -lure > -l }
'er2r>', # { -re > -r }
'nn1>', # { -nn > -n }
'rèi3.', # { -ièr > - }
'srev0.', # { -vers > -vers }
'sr1>', # { -rs > -r }
'rid2>', # { -dir > -d }
're2>', # { -er > - }
'xuei4.', # { -ieux > - }
'esuei5.', # { -ieuse > - }
'lbati3.', # { -itabl > -it }
'lba3>', # { -abl > - }
'rueis0.', # { -sieur > - }
'ruehcn4.', # { -ncheur > -nc }
'ecirta6.', # { -atrice > - }
'ruetai6.', # { -iateur > - }
'rueta5.', # { -ateur > - }
'rueir0.', # { -rieur > - }
'rue3>', # { -eur > - }
'esseti6.', # { -itesse > - }
'essere6>', # { -eresse > - }
'esserd1.', # { -dresse > -dress }
'esse4>', # { -esse > - }
'essiab1.', # { -baisse > -baiss }
'essia5.', # { -aisse > - }
'essio1.', # { -oisse > -oiss }
'essi4.', # { -isse > - }
'essal4.', # { -lasse > -l }
'essa1>', # { -asse > -ass }
'ssab1.', # { -bass > -bas }
'essurp1.', # { -prusse > -uss }
'essu4.', # { -usse > - }
'essi1.', # { -isse > -ss }
'ssor1.', # { -ross > -ros }
'essor2.', # { -rosse > -ros }
'esso1>', # { -osse > -oss }
'ess2>', # { -sse > -s }
'tio3.', # { -oit > - }
'rès2re.', # { -sèr > -ser }
'rè0e.', # { -èr > -ère }
'esn1.', # { -nse > -èns }
'eu1>', # { -ue > -u }
'sua0.', # { -aus > -aus }
'su1>', # { -us > -u }
'utt1>', # { -utt > -tt }
'tuç3c.', # { -çut > -c }
'uç2c.', # { -çu > -c }
'ur1.', # { -ru > -r }
'ehcn2>', # { -nche > -nc }
'ehcu1>', # { -uche > -uch }
'snorr3.', # { -rrons > -rr }
'snoru3.', # { -urons > -ur }
'snorua3.', # { -aurons > -aur }
'snorv3.', # { -vrons > -vr }
'snorio4.', # { -oirons > -oi }
'snori5.', # { -irons > - }
'snore5>', # { -erons > - }
'snortt4>', # { -ttrons > -tt }
'snortîa7.', # { -aîtrons > - }
'snort3.', # { -trons > -tr }
'snor4.', # { -rons > - }
'snossi6.', # { -issons > - }
'snoire6.', # { -erions > - }
'snoird5.', # { -drions > -d }
'snoitai7.', # { -iations > - }
'snoita6.', # { -ations > - }
'snoits1>', # { -stions > -stion }
'noits0.', # { -stion > -stion }
'snoi4>', # { -ions > - }
'noitaci7>', # { -ication > - }
'noitai6.', # { -iation > - }
'noita5.', # { -ation > - }
'noitu4.', # { -ution > -u }
'noi3>', # { -ion > - }
'snoya0.', # { -ayons > -ayons }
'snoy4i.', # { -yons > -i }
'snoça1.', # { -açons > -açon }
'snoçr1.', # { -rçons > -rçon }
'snoe4.', # { -eons > - }
'snosiar1>', # { -raisons > - }
'snola1.', # { -alons > -alon }
'sno3>', # { -ons > - }
'sno1>', # { -ons > -on }
'noll2.', # { -llon > -ll }
'tnennei4.', # { -iennent > -ien }
'ennei2>', # { -ienne > -ien }
'snei1>', # { -iens > -ien }
'sneé1>', # { -éens > -éen }
'enneé5e.', # { -éenne > -e }
'neé3e.', # { -éen > -e }
'neic0.', # { -cien > -cien }
'neiv0.', # { -vien > -vien }
'nei3.', # { -ien > - }
'sc1.', # { -cs > -c }
'sd1.', # { -ds > -d }
'sg1.', # { -gs > -g }
'sni1.', # { -ins > -in }
'tiu0.', # { -uit > - }
'ti2.', # { -it > - }
'sp1>', # { -ps > -p }
'sna1>', # { -ans > -an }
'sue1.', # { -eus > -eu }
'enn2>', # { -nne > -n }
'nong2.', # { -gnon > -gn }
'noss2.', # { -sson > -ss }
'rioe4.', # { -eoir > - }
'riot0.', # { -toir > -toir }
'riorc1.', # { -croir > -croi }
'riovec5.', # { -cevoir > -c }
'rio3.', # { -oir > - }
'ric2.', # { -cir > -l }
'ril2.', # { -lir > -l }
'tnerim3.', # { -mirent > -mir }
'tneris3>', # { -sirent > -sir }
'tneri5.', # { -irent > - }
'tîa3.', # { -aît > - }
'riss2.', # { -ssir > -ss }
'tî2.', # { -ît > - }
'tâ2>', # { -ât > - }
'ario2.', # { -oira > -oi }
'arim1.', # { -mira > -m }
'ara1.', # { -ara > -ar }
'aris1.', # { -sira > -sir }
'ari3.', # { -ira > - }
'art1>', # { -tra > -tr }
'ardn2.', # { -ndra > -nd }
'arr1.', # { -rra > -rr }
'arua1.', # { -aura > -aur }
'aro1.', # { -ora > -or }
'arv1.', # { -vra > -vr }
'aru1.', # { -ura > -ur }
'ar2.', # { -ra > - }
'rd1.', # { -dr > -d }
'ud1.', # { -du > - }
'ul1.', # { -lu > -l }
'ini1.', # { -ini > -in }
'rin2.', # { -nir > - }
'tnessiab3.', # { -baissent > -baiss }
'tnessia7.', # { -aissent > - }
'tnessi6.', # { -issent > - }
'tnessni4.', # { -inssent > -ins }
'sini2.', # { -inis > -in }
'sl1.', # { -ls > -l }
'iard3.', # { -drai > -d }
'iario3.', # { -oirai > -oi }
'ia2>', # { -ai > - }
'io0.', # { -oi > -oi }
'iule2.', # { -elui > -el }
'i1>', # { -i > - }
'sid2.', # { -dis > -d }
'sic2.', # { -cis > -c }
'esoi4.', # { -iose > - }
'ed1.', # { -de > -d }
'ai2>', # { -ia > - }
'a1>', # { -a > - }
'adr1.', # { -rda > -rd }
'tnerè5>', # { -èrent > - }
'evir1.', # { -rive > -riv }
'evio4>', # { -oive > - }
'evi3.', # { -ive > - }
'fita4.', # { -atif > - }
'fi2>', # { -if > - }
'enie1.', # { -eine > -ein }
'sare4>', # { -eras > - }
'sari4>', # { -iras > - }
'sard3.', # { -dras > -d }
'sart2>', # { -tras > -tr }
'sa2.', # { -as > - }
'tnessa6>', # { -assent > - }
'tnessu6>', # { -ussent > - }
'tnegna3.', # { -angent > -ang }
'tnegi3.', # { -igent > -ig }
'tneg0.', # { -gent > -gent }
'tneru5>', # { -urent > - }
'tnemg0.', # { -gment > -gment }
'tnerni4.', # { -inrent > -in }
'tneiv1.', # { -vient > -vien }
'tne3>', # { -ent > - }
'une1.', # { -enu > -en }
'en1>', # { -ne > -n }
'nitn2.', # { -ntin > - }
'ecnay5i.', # { -yance > -i }
'ecnal1.', # { -lance > -lanc }
'ecna4.', # { -ance > - }
'ec1>', # { -ce > -c }
'nn1.', # { -nn > -n }
'rit2>', # { -tir > - }
'rut2>', # { -tur > -t }
'rud2.', # { -dur > -d }
'ugn1>', # { -ngu > -ng }
'eg1>', # { -ge > -g }
'tuo0.', # { -out > -out }
'tul2>', # { -lut > -l }
'tû2>', # { -ût > - }
'ev1>', # { -ve > -v }
'vè2ve>', # { -èv > -ev }
'rtt1>', # { -ttr > -tt }
'emissi6.', # { -issime > - }
'em1.', # { -me > -m }
'ehc1.', # { -che > -ch }
'céi2cè.', # { -iéc > -ièc }
'libi2l.', # { -ibil > -ibl }
'llie1.', # { -eill > -eil }
'liei4i.', # { -ieil > -i }
'xuev1.', # { -veux > -veu }
'xuey4i.', # { -yeux > -i }
'xueni5>', # { -ineux > - }
'xuell4.', # { -lleux > -l }
'xuere5.', # { -ereux > - }
'xue3>', # { -eux > - }
'rbé3rbè.', # { -ébr > -èbr }
'tur2.', # { -rut > -r }
'riré4re.', # { -érir > -er }
'rir2.', # { -rir > -r }
'câ2ca.', # { -âc > -ac }
'snu1.', # { -uns > -un }
'rtîa4.', # { -aîtr > - }
'long2.', # { -gnol > -gn }
'vec2.', # { -cev > -c }
'ç1c>', # { -ç > -c }
'ssilp3.', # { -pliss > -pl }
'silp2.', # { -plis > -pl }
'tèhc2te.', # { -chèt > -chet }
'nèm2ne.', # { -mèn > -men }
'llepp1.', # { -ppell > -ppel }
'tan2.', # { -nat > -n }
'rvè3rve.', # { -èvr > -evr }
'rvé3rve.', # { -évr > -evr }
'rè2re.', # { -èr > -er }
'ré2re.', # { -ér > -er }
'tè2te.', # { -èt > -et }
'té2te.', # { -ét > -et }
'epp1.', # { -ppe > -pp }
'eya2i.', # { -aye > -ai }
'ya1i.', # { -ay > -ai }
'yo1i.', # { -oy > -oi }
'esu1.', # { -use > -us }
'ugi1.', # { -igu > -g }
'tt1.', # { -tt > -t }
# end rule: the stem has already been found
'end0.'
);
?>