​Արեւմտահայերէնը Նորարար Թեքնաբանութեան Կիզակէտին - Gündem
19 Nisan 2024 - Հակական տոմար - Տարի : 4516 / Ամիս : Ահեկան / Օր : Անահիտ / Ժամ : Հրակաթն

Gündem :

22 Temmuz 2021  

​Արեւմտահայերէնը Նորարար Թեքնաբանութեան Կիզակէտին -

​Արեւմտահայերէնը Նորարար Թեքնաբանութեան Կիզակէտին ​Արեւմտահայերէնը Նորարար Թեքնաբանութեան Կիզակէտին

«Գալուստ Կիւլպէնկեան» հիմնարկութեան Հայկական բաժանմունքը ուրախ է յայտարարելու, որ Արեւմտահայերէնի ծառադարանը (Treebank) թողարկուեցաւ 15 մայիս 2021-ին եւ այժմ առկայ է Universal Dependencies Consortium-ին մէջ:

Ծառադարանները անհրաժեշտ գործիքներ են լեզուի մը կենսունակութիւնը ապահովելու համար. անոնք կ’երաշխաւորեն, որ լեզուաբանական եւ թեքնաբանական գիտութիւններու ոլորտներուն մէջ լեզուն քայլ պահէ արդի զարգացումներուն հետ: Ծառադարաններու շնորհիւ համակարգչային ծրագիրներ «կը մարզուին», որպէսզի ճանչնան նախադասութեան մը քերականական եւ լեզուական տարբեր տարրերը. այսինքն` ծրագիրը կը ճանչնայ բայը, գոյականը, առոգանութեան ու կէտադրութեան նշանները եւ աւելին: Ծառադարանները քերականական մանրամասն ծանօթագրութիւններով օժտուած նախադասութիւններու շտեմարաններ են: Անոնց շնորհիւ յեղափոխութիւն մը տեղի ունեցաւ իննսունական թուականներուն միջազգային «Բնական լեզուի մշակում»-ի ոլորտին մէջ:

Ծառադարանները կենսական դեր կը խաղան լեզուաբանական ժամանակակից մշակումի համակարգերուն մէջ. օրինակ` համակարգչային մեքենայական թարգմանութիւններ, իմաստաբանական վերլուծիչներ, լեզուին բաղադրիչ մասնիկներու ծանօթագրութիւններ եւ այլն: Բաժանմունքի տնօրէն Ռազմիկ Փանոսեան կը բացատրէ. «Որպէսզի լեզու մը ուղղագրութիւն եւ քերականութիւն սրբագրելու գործիքներ ունենայ, կամ մեքենայական թարգմանութիւն իրականացնէ, այդ լեզուն պէտք է ծառադարան մը ունենայ: Ուրախ ենք, որ հիմնարկութիւնը կենսական դեր խաղաց այս ժամանակակից գործիքը ի սպաս դնելու անոնց, որոնք կը փափաքին լեզուի եւ արհեստագիտութեան ոլորտին մէջ աշխատիլ»:

Universal Dependencies-ը ծրագիր մըն է, որ կը մշակէ տարբեր լեզուներու համար միջլեզուական հասարակաց ծառադարաններ, որոնց այժմ մաս կը կազմեն թէ՛ արեւելահայերէնը, եւ թէ՛ արեւմտահայերէնը: Այս ծրագիրը այլազան լեզուներու հասարակաց շարահիւսութիւնները կը ճանչնայ եւ կը ծանօթագրէ` արտօնելով նաեւ լեզուական իւրայատկութիւններու ծանօթագրութիւնները:

Այս նոր ծառադարանը մշակած է ArmTDP խումբը, համաղեկավարութեամբ` Մարատ Եաւրումեանին (Երեւանի պետական համալսարան) եւ Հրանդ Խաչատրեանին («ԵրեւանԷՆ YerevaNN» հետազօտական կեդրոն), եւ հիմնուած է «Հայերէնի շարահիւսական ծառերու UD դարան»-ի արեւմտահայերէնի բաժինին վրայ: Արեւմտահայերէնի ծառադարանը կ՛աւելնայ 114 տարբեր լեզուներով 202 ծառադարաններուն շարքին: Ծառադարանը ամբողջութեամբ նոր պատրաստուած է, ուրեմն «Բնական լեզուի մշակում»-ի ոլորտին մէջ արեւմտահայերէնի համար ստեղծուող որեւէ գործիքի հիմքը կրնայ հանդիսանալ: 2021-ի աւարտին պիտի թողարկուի ծառադարանին թարմացուած եւ ընդլայնուած տարբերակը:

Արեւմտահայերէնի ծառադարանը այժմ կը պարունակէ 1780 նախադասութիւն եւ 7,5 միլիոն բառ. հիմնուած է 50 հեղինակներու 110 գործերուն վրայ` գրուած 1895-էն 2010-ի միջեւ: Զանազան գրական աշխատութիւններ ընդգրկուած են` վիպագրութիւն, նամակագրութիւն, ճամբորդական օրագրութիւն, քաղաքական եւ գրական դասախօսութիւններ ու ճառեր, յուշագրութիւն եւ աւելին: Ան կ՛օգտուի Հայաստանի ամերիկեան համալսարանի Հայ մատենագրութեան թուանշային գրադարանի շտեմարանէն:

Արեւմտահայերէնի ծառադարանը, եւ իրեն շնորհիւ մշակուած բոլոր «Բնական լեզուի մշակում»-ի գործիքները անհրաժեշտ են, որպէսզի լեզուն օժտուի նորարար միջոցներով եւ քայլ պահէ թեքնաբանական յառաջընթացի արդի մակարդակին հետ:

Այս ծրագիրին եւ այլ նախաձեռնութիւններու մասին յաւելեալ տեղեկութիւններու համար այցելել այս կայքէջը https://gulbenkian.pt/armenian-communities եւ անդամագրուիլ մեր լրատուին:





Bu haber civilnet kaynağından gelmektedir.

Haber metninde yer alan görüşler haber kaynağı (civilnet) ve yazarına ait olup,
bolsohays.com sitesi haber hakkında herhangi bir görüş üstlenmemektedir.

Opinions expressed are those of the author(s)-(civilnet). They do not purport to reflect the opinions or views of bolsohays.com
+