#!/bin/sh
# fonevek 0.1
# nouns
#
# $1: a Magyar Ispell gykrknyvtra / Magyar Ispell root directory
# $2: spellchecker
export LC_ALL=C

if [ "$1" = "" ]; then
	echo "usage: $0 magyar_ispell_root_directory [spellchecker]"
	exit 1
fi

ROOT=${1:-'.'}
SPELL=${2:-"ISPELL"}

. $ROOT/config

cd $WRKDIR || exit 1

# fnevek ragozsi osztlyokba sorolsa

$AWK -f $AWKDIR/fonev_gen.awk <fonev.1 >>$DICT

# -e vg mly hangrendek:

grep '^[a-z].*/.*u' $ROOT/szotar/kivetelek/ragozatlan/pseudoroot.2 | sed 's#/.*##' |
$AWK -f $AWKDIR/fonev_gen.awk >>$DICT

echo_n .

# mellknevek -sg/-sg kpzs alakjainak ellltsa,
# s ragozsi osztlyokba val sorolsa

$AWK -f $AWKDIR/mellek_sag2.awk <melleknev.1  >>$DICT

echo_n .



# tulajdonnv llomny feldolgozsa

# -e vg mly hangrendek:

grep '^[A-Z].*/.*u' $ROOT/szotar/kivetelek/ragozatlan/pseudoroot.2 | sed 's#/.*##' >>tulajdonnev.2

# tvek kinyerse
##cat tulajdonnev*.2 | $AWK -f $AWKDIR/tovek4.awk >>$DICT

cat tulajdonnev*.2 | grep "^	" | cut -f 2 >>$DICT
cat tulajdonnev*.2 | grep "^	" | sed 's/^	//' >>$DICT
cat tulajdonnev*.2 | grep "^	" | sed 's/^	//;s/$/\/,/' >>$DICT
echo_n .

cat tulajdonnev_geo*.2 | grep -v "^	" | cut -f 1 >magyar.fonev.1
$AWK -f $AWKDIR/fonev_gen.awk -v tulaj_e=1 -v tulaj_geo_e=1 <magyar.fonev.1 >>$DICT
echo_n .

cat tulajdonnev.2 | grep -v "^	" | cut -f 1 >magyar.fonev.1

$AWK -f $AWKDIR/fonev_gen.awk -v tulaj_e=1 <magyar.fonev.1 >>$DICT
echo_n .

# kpzs alakok tiltsa, ahol kln meg volt adva

cat tulajdonnev*.2 | grep -v "^	" | awk 'NF==2{print $1 "/------------"}' >>$DICT

# tulajdonnevekbl kpzett mellknvkpzs alakok feldolgozsa
# szably: a sz vgi -i kpzs alakok hangrendjt az azt megelz
# sztag hangrendje dnti el.

cat tulajdonnev*.2 | grep '[aou][bcdfghjklmnprstvxyz]*[	].*i$' | \
    cut -sf 2 >>melleknev_mely.1
cat tulajdonnev*.2 | grep -v "^	" | cut -s -f 2 >>melleknev.1
echo_n .

# fonev_oe zrt tosztly -en/-hez kpzs alakjainak letiltsa
# pl. knyvt, knyven, knyvhez rossz; helyette knyvet, knyvn, knyvhz
# kivtel a knnyen alak, mivel ez ms tbl szrmaz helyes alak

#cat fonev_oe.1 | sed 's/$/en\/w/' | egrep -v '(knnyen|csppen|szrnyen)' >>$DICT
#cat fonev_oe.1 melleknev_oe.1 melleknev_e.1 | sed 's/$/hez\/w/' >>$DICT
echo_n .


# idegen kiejts, s mozaikszavak feldolgozsa

$AWK -f $AWKDIR/kotojeles.awk -v V1="AUQi" -v V2="KUmQSsi" -v V3="mAFUKQF" -v V4="AFUKSsF" kotojeles_mely.7 >>$DICT
$AWK -f $AWKDIR/kotojeles.awk -v V1="BVRj" -v V2="LVnRTtj" -v V3="nBGVLRG" -v V4="BGVLTtG" kotojeles_magas.7 >>$DICT
$AWK -f $AWKDIR/kotojeles.awk -v V1="CWRj" -v V2="MWRTtj" -v V3="nCHWMRH" -v V4="CHWMTtH" kotojeles_magas2.7 >>$DICT

# morfonetikus alternns igkbl folyamatos mellknvi igenevek s fnevek
# ellltsa

cat ige_morfo.1 | \
sed 's/\(.*\)[ao]\(.\)$/\1\2\
\1\2s/
s/\(.*\)[ie]\(.\)$/\1\2\
\1\2s/' >magyar.fonev.1
echo_n .

cat ige_morfo.1 | \
sed 's/\(.*\)[ao]\(.\)$/\1\2\/X\
\1\2s\/X/
s/\(.*\)[ie]\(.\)$/\1\2\/X\
\1\2s\/X/' >>$DICT
echo_n .

cat ige_morfo.1 | \
sed 's/\(.*\)\([ao]\)\(.\)$/\1\3	\1\2\3[vrb]+[_PRESPART_adj]{+[NOM]}\
\1\3s	\1\2\3[vrb]+[s_PROCESS\/RESULT_noun]{+[NOM]}/
s/\(.*\)\([ie]\)\(.\)$/\1\3	\1\2\3[vrb]+[_PRESPART_adj]{+[NOM]}\
\1\3s	\1\2\3[vrb]+[s_PROCESS\/RESULT_noun]{+[NOM]}/' >>$DICT
echo_n .

cat ige_morfo.1 | \
sed 's/\(.*\)[ao]\(.\)$/\1\2/
s/\(.*\)[ie]\(.\)$/\1\2/' >>melleknev.1
echo_n .

cat ige_morfo.1 | \
sed 's/\(.*\)[ao]\(.\)$/[adj]\1\2\/X/
s/\(.*\)[ie]\(.\)$/[adj]\1\2\/X/' >>$DICT
echo_n .

cat ige_eas.1 >>magyar.fonev.1
cat ige_hatosag.1 >>magyar.fonev.1
cat ige_hatosag.1 >>fonev.1
echo_n .

$AWK -f $AWKDIR/fonev_gen.awk <magyar.fonev.1 >>$DICT
echo_n .

# npnevek

cat melleknev_nyelv.1 >>fonev.1
cat melleknev_mely.1 >>fonev_mely.1
cat melleknev_nyelv.1 >>fonev_kulon.1
$AWK -f $AWKDIR/fonev_gen.awk <melleknev_nyelv.1 >>$DICT
cat melleknev_nyelv.1 | sed 's/\(^.*$\)/\1bart\
\1ellenes\
\1gyll/' >>melleknev.1
cat melleknev_nyelv.1 | sed 's/\(^.*$\)/\1ldzs/' | \
tee -a fonev_osszetett.1 >>fonev.1

# mellknevek

cat melleknev_nyelv.1 melleknev.1 ige_ando.1 ige_hato.1 ige_hatatlan.1 | \
$AWK -f $AWKDIR/melleknev_gen.awk >> $DICT
echo_n .

echo " Rendben."
