İçeriğe geçmek için "Enter"a basın

Արեւմտահայերէնը Նորարար Թեքնաբանութեան Կիզակէտին

«Գալուստ Կիւլպէնկեան» հիմնարկութեան Հայկական բաժանմունքը ուրախ է յայտարարելու, որ Արեւմտահայերէնի ծառադարանը (Treebank) թողարկուեցաւ 15 մայիս 2021-ին եւ այժմ առկայ է Universal Dependencies Consortium-ին մէջ:

Ծառադարանները անհրաժեշտ գործիքներ են լեզուի մը կենսունակութիւնը ապահովելու համար. անոնք կ’երաշխաւորեն, որ լեզուաբանական եւ թեքնաբանական գիտութիւններու ոլորտներուն մէջ լեզուն քայլ պահէ արդի զարգացումներուն հետ: Ծառադարաններու շնորհիւ համակարգչային ծրագիրներ «կը մարզուին», որպէսզի ճանչնան նախադասութեան մը քերականական եւ լեզուական տարբեր տարրերը. այսինքն` ծրագիրը կը ճանչնայ բայը, գոյականը, առոգանութեան ու կէտադրութեան նշանները եւ աւելին: Ծառադարանները քերականական մանրամասն ծանօթագրութիւններով օժտուած նախադասութիւններու շտեմարաններ են: Անոնց շնորհիւ յեղափոխութիւն մը տեղի ունեցաւ իննսունական թուականներուն միջազգային «Բնական լեզուի մշակում»-ի ոլորտին մէջ:

Ծառադարանները կենսական դեր կը խաղան լեզուաբանական ժամանակակից մշակումի համակարգերուն մէջ. օրինակ` համակարգչային մեքենայական թարգմանութիւններ, իմաստաբանական վերլուծիչներ, լեզուին բաղադրիչ մասնիկներու ծանօթագրութիւններ եւ այլն: Բաժանմունքի տնօրէն Ռազմիկ Փանոսեան կը բացատրէ. «Որպէսզի լեզու մը ուղղագրութիւն եւ քերականութիւն սրբագրելու գործիքներ ունենայ, կամ մեքենայական թարգմանութիւն իրականացնէ, այդ լեզուն պէտք է ծառադարան մը ունենայ: Ուրախ ենք, որ հիմնարկութիւնը կենսական դեր խաղաց այս ժամանակակից գործիքը ի սպաս դնելու անոնց, որոնք կը փափաքին լեզուի եւ արհեստագիտութեան ոլորտին մէջ աշխատիլ»:

Universal Dependencies-ը ծրագիր մըն է, որ կը մշակէ տարբեր լեզուներու համար միջլեզուական հասարակաց ծառադարաններ, որոնց այժմ մաս կը կազմեն թէ՛ արեւելահայերէնը, եւ թէ՛ արեւմտահայերէնը: Այս ծրագիրը այլազան լեզուներու հասարակաց շարահիւսութիւնները կը ճանչնայ եւ կը ծանօթագրէ` արտօնելով նաեւ լեզուական իւրայատկութիւններու ծանօթագրութիւնները:

Այս նոր ծառադարանը մշակած է ArmTDP խումբը, համաղեկավարութեամբ` Մարատ Եաւրումեանին (Երեւանի պետական համալսարան) եւ Հրանդ Խաչատրեանին («ԵրեւանԷՆ YerevaNN» հետազօտական կեդրոն), եւ հիմնուած է «Հայերէնի շարահիւսական ծառերու UD դարան»-ի արեւմտահայերէնի բաժինին վրայ: Արեւմտահայերէնի ծառադարանը կ՛աւելնայ 114 տարբեր լեզուներով 202 ծառադարաններուն շարքին: Ծառադարանը ամբողջութեամբ նոր պատրաստուած է, ուրեմն «Բնական լեզուի մշակում»-ի ոլորտին մէջ արեւմտահայերէնի համար ստեղծուող որեւէ գործիքի հիմքը կրնայ հանդիսանալ: 2021-ի աւարտին պիտի թողարկուի ծառադարանին թարմացուած եւ ընդլայնուած տարբերակը:

Արեւմտահայերէնի ծառադարանը այժմ կը պարունակէ 1780 նախադասութիւն եւ 7,5 միլիոն բառ. հիմնուած է 50 հեղինակներու 110 գործերուն վրայգրուած 1895-էն 2010-ի միջեւ: Զանազան գրական աշխատութիւններ ընդգրկուած են վիպագրութիւն, նամակագրութիւն, ճամբորդական օրագրութիւն, քաղաքական եւ գրական դասախօսութիւններ ու ճառեր, յուշագրութիւն եւ աւելին: Ան կ՛օգտուի Հայաստանի ամերիկեան համալսարանի Հայ մատենագրութեան թուանշային գրադարանի շտեմարանէն:

Արեւմտահայերէնի ծառադարանը, եւ իրեն շնորհիւ մշակուած բոլոր «Բնական լեզուի մշակում»-ի գործիքները անհրաժեշտ են, որպէսզի լեզուն օժտուի նորարար միջոցներով եւ քայլ պահէ թեքնաբանական յառաջընթացի արդի մակարդակին հետ:

Այս ծրագիրին եւ այլ նախաձեռնութիւններու մասին յաւելեալ տեղեկութիւններու համար այցելել այս կայքէջը https://gulbenkian.pt/armenian-communities եւ անդամագրուիլ մեր լրատուին:


CIVILNET

Yorumlar kapatıldı.