Skip to main content

Нэг дэх тайлбар "ŋ" .

Дэлхий олон үндэстнүүд өөр хоорондоо ялгаатай янз янзын бичгийн  хэлийг хэрэглэх бөгөөд бичиг үсэг бүрийн мэдээлэл агуулах тэмдэгтүүдийг өөртөө агуулсан  мэдээлэл дамжуулах кодын систем нь юникод. Энэ кодын системийг компьютерын ертөнцийн үйлдвэрлэлийн стандарт гэж хэлэх бөгөөд кодын систем нь өөрийн дүрэм журамтай,  бүтцээр бол байшин шиг олон давхартай, кодуудын харилцан үйлдлийг тодорхойлох функционал кодуудыг өөртөө агуулсан гээд олон нууц ид шидтэй. Түүнийг нь “canonical” буюу тодорхой дүрмийг зөвшөөрөх жаяг, ба  “compatible” буюу хэд хэдэн код хавирга бөөрөөрөө тэврэлдэх, бүүр цаашлаад заримыг нь өвөр түрийнд нь хийж өгөөд өөр нэг кодыг илэрхийлэх боломжийг илэрхийлэгч гэнэ. Энгийн жишээ нь “n ~” хоёр кодыг ашиглаад дээрээ долгионтой ЭН  үсэг гаргах нөхцөлийг “canonical” гэх бөгөөд нэг үсгээ олон янзаар кодолсон үед хэрэглэх боломжтой гэж  хэлдэг.  Харин ff гэсэн хоёр ЭФ -ийг дэгжин бичихэд туслах гэж нэг дүрс бүхий кодоор илэрхийлсэн ээ “compatible” гэж хэлдэг.  Тэгвэл монгол бичгийн хувьд энэ кодын систем юу хийж чадах вэ? гэдэг бидэнд  сонирхолтой байх бол уу.

Ойрын хэд хоног компьютерт монгол бичгээр ажиллах үйл ажиллагааг(процессыг) сонирхогч залуусын хэлэлцүүлэгт оролцоод жил гаруйн өмнө хийгээд л хэрэглэхгүй орхисноос  орхигдуулсан алдааг тэдний дэмээр олж мэдээд урам ороод баярласнаа хэлмээр санагдлаа.     

Монгол бичгийн их инхлэг.  Хэлний хойгуур хэлдэг Н гийгүүлэгчийг  монгол бичигт НГ хоёр үсгээр хамжиж тэмдэглэнэ гэжээ. Инхлэг нь гаанс(гангса), гагнаас(гангнагасу), ган(ганг), гингэнэх(гингинэхү), годонтох(годонгтуху), тунхаглах, хангах, сонгох, өнгөрөөх, сан, өнгө гээд өч төчнөөн үгэнд ордог юм байна. Үүнийг уг нь нэг үсэг гээд Юникодод байр сууц гаргаад өгчихсөн байдаг. Гэтэл энэ гайхлыг судлаачид нь болохоор ŋ гээд тэмдэглэчихсэн байдаг латин үсгээр ng кирилл үсгээр нг гээд тэмдэглэнэ гээд бичээд байхаар нөгөө компьютерт кодоороо шууд үсрээд ороод ирэхгүй, хоёр кодын тусламжтайгаар орж ирнэ. Юникодод өмнө дурдсан зарчмаар дэлгэн харуулахдаа зөв хэлбэрийг харуулаад цаана нууцгай шиг хоёр кодыг хадгалаад байна.

(… tegün-ü qoyina tabdaγar on  tengri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda činggis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möngke bolju :   ...)

(… tegün-ü qoyina tabdaγar on  teŋri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda čiŋgis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möŋke bolju :   ...)  


Цөөхөн хэрэглэгдэх ЛХ гэх нэмэлт үсэг дээр ч ялгаагүй энэ асуудал гарч ирэх байхдаа гэж санаж байна. (Лхагба, Лхасүрэн, Далха ...) Одоогоор монгол бичгээр бичсэн  өгөгдлийн сан их хэмжээгээр үүсээгүй,  үг эрэмбэлэх хэрэгцээгүй, зөв бичгийн дүрэм шалгахгүй, өөр нэг хэл рүү орчуулах эсвэл өөр нэг бичиг рүү хөрвүүлэх шаардлагагүй гээд   хэрэглээ бага байгаа болохоор санаа тавих хэрэггүй илүү асуудал мэт санагдавч ирээдүй хойчид хэрэглээ нь их болох юм билүү, үүнийг жигдлэх хэрэгтэй бол уу? Та юу гэж бодож байна.  Тийм бол яаж , харин үгүй бол яагаад вэ?   


Comments

Залуха said…
Сайн байна уу?
Та бүхний хэлэлцүүлгийг надад их өндөр сэтгэгдэл төрсөн. Өөрөө ч гэсэн та бүхний хийж ажлыг судлаад, оролцох юмсан гэж бодогдсон шүү.
Миний мэдэхээр өвөрмонголчууд цахим хэл шинжлэлийн (computational linguistic) чиглэлээр багагүй зүйлс хийсэн байдаг. Тэднээс энэ чиглэлээр хийсэн зүйлс дээр олон зүйл сурч болох байх гэж бодож байна.
Таны хөндсөн энэ сэдвийн хувьд одоо л жигдлэж авахгүй бол дараа зөндөө асуудлын уг үндэс болно гэж бодож байна.
Энэ талаар уг нь хийх сонирхолтой ажлууд их байдаг гэж би боддог юм. Даан ч сонирхдог монгол залуус цөөхөн юм. Сонирхож үзээд олуулаа болуул их зүйлийг бид монголчууддаа өвлүүлж үлдээж чадна шүү. Монгол бичгээр компьютерт ажиллах боломжийг нь бүрдүүлэх талын суурийг шийдвэрлэх хэрэгтэй байгаа юм. Өвөр монголын их сургуулийн монгол хэл судлалын салбарт Чойжинжав гээд профессор байгаа, судалгааны баг-тай, тэд уг нь их зүйл хийсэн. Хэлний мэргэжлийн олон хүн бий. Нэлээдийг нь би танина. Даан ч програмын хүмүүс нь солигдоод байдаг шиг билээ. Би 1991 онд тэр сургууль дээр очиж хэдэн сар болсон. Одоо бол их зүйл нэмэгдсэн байх аа. Уншиж мэдэх нэмэлт мэдээлэлтэй холбоосууд байвал хэлээрэй. Програмчлал талаас нь гадны хүмүүс (монгол хэлээ мэдэхгүй) үзэхээр эгшиг гийгүүлэгч ээ ялгасаар байгаад л гол зорилго нь өөр болчихдог шиг байгаа юм.
xvv said…
нг үсгийн хувьд тэгээд нг гэж дараалж орсон өөр шүд+г гэж холбогддог үг ер нь байдаггүй юм уу? Гарнаас шууд н гээд оруулахад нг гэсэн нэг тэмдэгтийг шууд өгдөг болох байх тэгэхээр заавал нг биш н гээд галиглачих боломжтой бол болох л юм шиг? Гэхдээ хэл шинжлэлийн хүн биш болохоор бас сайн мэдэхгүй юм аа.

Монггол гэж галиглахаар дараа нь Монгол гэдгээс хөрвүүлэхэд алдаа гарч мэдмээр ч юм шиг...
Нөгөө хэлний угийн Н гээд байгаа нь хойноо эгшиг байхгүй монгол бичгийн НГ гээд байгаа код чинь л дээ. Монгол бичигт н дээр г нэмэхээр (шүд нэмэх чих) :-) гэхээр нөгөө НГ илэрхийлдэг юм байна. Үнэн хэрэгтээ (a1)(a2)(a3)(a4)(a4)(a2)(a5) гээд өөр бас (a1)(a2)(a6)(a4)(a2)(a5) гэж кодоор хадгалчихаар юугаар нь хайх вэ гэдгээл тодорхой болгох гэсэн асуудал байгаа юм шүү дээ. (Монгол хэлний мэргэжилтнээс лавлах хэрэгтэй) Олон улсын стандартад Монгол бичгийн галиг баримт бичигт орсон баталгаат эх сурвалж олдохгүй байна. Draft баримт байна. Failed баримт байна. Үр дүн баримт алга. Монгол стандартын газраас асуусан таг. :-(

Олон уншигдсан

Домог

Монгол бичгийн үүсэл гаралтай холбоо бүхий хоёр зүйлийн домгийг найз багш Мөнх-Учирал маань монгол бичгээр бичиж өгсөн юм(ОпенМН зориулж). Энэ бичвэрийн фонт нь их сайхан, зурлага дээр суурилсан глипс (glyphs) байх, МУИС-ийн Монгол хэл соёлын сургуулийн эх бичиг судлалын тэнхимд (Жамянсүрэн) глипс (glyphs)-ыг зурж бүтээсэн байх гэж бодож байна. Үүнийг Монгол бичгээ сурч, дэлгэрүүлж байгаа залуустаа уншуулахаар орууллаа. Домгийн тухай Гүүгл ахаасаа лавлахад бас ч их зүйл интернэтэд байна аа. Нэг нь “Хэдэргэний домог” хэмээдэг, XVIII зууны үед Равжамба Данзандагвын зохиосон “Зүрхэн толтын тайлбар огторгуйн маани” хэмээх хэл зүйн бичигт гардаг “... Зая Бандид (Саж Бандид Гунгаажалцан) Монгол улсад аль үсгээр туслах болох хэмээн шөнө тугдам барьж эрт манагар бэлэглэхүйд нэгэн эхнэр хүн мөрөн дээрээ хэдрэгэ модыг тавьж ирээд мөргөвөөс, тэрхүү бэлгээр Монгол улсын үсгийг хэдрэгэний дүрсээр эр, эм, эрс гурваар, чанга хийгээд хөндий ба саармаг гурваар зохиосон болой” гэсэн домог юм. Энд өг...

Хөдөө талын үзэсгэлэн "Монгол бичгээр"

Монгол, Живхтэй жаал хүүгийн бичсэн хэд хэдэн бичлэгийг уншиж байснаа гэнэт урам орж бараг арван долоо найман жилийн өмнө хэрэглэж байсан хайрцаг дүүрэн цаас бичгээ уудалж эхэлтэл миний хувьд эрдэнэс болох сайхан зүйлүүд гарч ирлээ. Ерээд оны эхэнд монгол бичгийн бичвэр бичих СУДАР нэртэй програмыг хийх гэж оролдож байхдаа монгол бичгийн фонтын загвар болгох гээд Т. Дашцэдэн (МУИС) багшаар бичүүлж авсан хуудаснууд байна. Үүнийг би бүүр сканердаж байгаад хүнд үзүүлмээр санагдлаа. Харин кириллээр бичсэн хувилбарыг Гүүгл-ээр хайвал олон сайтаас уншиж болох болжээ. Монгол бичиг сурч буюу хүнд унших өгүүллэгийн нэг нь болох болтугай.  Д.Нацагдорж : Хөдөө талын үзэсгэлэн Хөдөө талын зэрэглээ мяралзан жирвэгнэхийн дунд хэдэн өндөр юм сүүмэлзэн үзэгдэх нь харь газрын аяны хүний нүдэнд яахин даруй танигдана. Хурдлан довтлох уурын тэрэгний өмнөөс намрын салхи хүчтэй үлээхэд хоёр нүдэнд нулимс гялтганан холын барааг харж ядна. Өвгөн жолооч ухасхийх, хийг нэмэхэд дөрвөн хүрд чө...

Бичгийн тиг

Гэртээ очоод аав ээж, ах дүү, найз нөхөд, хамт ажиллаж байсан багш нартаа гаа уулзаж учрах нь үнэхээр сайхан байлаа. Үүний зэрэгцээ манай миний сургууль гэж дуудах дуртай их сургуулиараа өдөр бүр л орж гарсаар найз нөхөд багш нарынхаа хийж бүтээсэн янз янзын шинэ сайхан зүйлийг сонсож мэдээд баярлаж хөөрөөд цаг хугацаа өнгөрөхийг ч мэдсэнгүй. Сүүлийн хэдэн сар интернетээр найз залуучууд маань монгол бичгийн фонтыг хөгжүүлэх, вэб фонт бүтээх, түүний хэрэглээг нэмэгдүүлэх талаар санаа тавьж хичээнгүйлэн ажил өрнүүлж байгааг таних мэдэх багш нартаа дуулгаж бас тэдний зүгээс хамтран ажиллаа ч гэж хүслээ. Хэдэн жилийн өмнө МУИС-ын Монгол хэл соёлын сургуулийн эх хэлний судалгааны төвд хэрэгжсэн ЮНИСКО-гийн төсөл ажлын нэг хэсэг болох ( зурлага дээр суурилж ) монгол бичгийн фонт бүтээгдсэн ийг мэдэж байсан тул эх сурвалжийг асууж лавлаад, хэрэглэж байгаа аргын нь тодруулав.  Энэ зурган дээр үзүүлэх зүүн гар талын дөрвөн фонтыг зурлага дээр түшиглээд бэлдэж англи үсгийн га...

Шувуун саарал

Саяхан интернэтээр сонин(Өдрийн сонин) уншиж байгаад Дамдин багшийн тухай “ Англи хэлний Дамдин ” гэсэн гарчигтай сайхан өгүүлэл уншсан юм. Багшийн орчуулгын ажлын талаар бичсэн байсан нь сонирхол татаад интернэтээр Д.Нацагдоржын “Шувуун саарал” -ыг хайтал шууд л 2006 онд сонин дээр хэвлүүлсэн орчуулга нь mongolnews.mn вэб хуудсны холбоосоор дороо гараад ирлээ. Багшийн орчуулгыг  олзуурхаад монгол хэлээр бичсэнтэй нь хамт дээр нь монгол бичгээ сурч байгаа танд зориулаад монгол бичигтэй нь хамт тэмдэглэл дээрээ  тавилаа. (Монгол бичгээр бичиж явуулсан найз охиндоо баярлалаа. ;-) ) .   Enjoy reading. Д.Нацагдорж Шувуун саарал (1) Хөндий талын зэрэглээ мяралзан жирэлзэх нь холоос үзэхэд сонин. Хэдэн жижигхэн юм түүний дунд сүүмэлзэх нь яахин даруй танигдана. Уудам газар дураар сэлгүүцэх хээр хөдөөгийн цэнгэл, хурдан морины яралзан ирэх эр хүний бахдал, ойртон үзвэл, хэдэн залуус морь тарлаж байна. (2) Сүрэнхүү саарал морины амыг арайхан тогтоож, овооны дэр...

Илжигний "И"

"И" үсгийг би илжиг гэх үгийг бичихэд хэрэглэх "и" үсэг гэж хэлдэг юм. Цагаан толгойн үсэг нүдлүүлэхэд ишиг, идээ, ингэ гээд олон үг жишээ болгож авдаг байх л даа. Харин электрон гэх үгийн “e” үсгийг орлож орсон, кирилл бичгээр бол “э” үсэгтэй “email” үгийг “и-мэйл/и-майл” гэж галиглаад бичээд байх юм аа. Гэтэл “email” гэсэн үгийг “э-шуудан” бүүр болохгүй бол “э-мэйл” гэж хэлмээр санагдах юм. Хэрэв “и” үсгээрээ галиглана гэж муйхарлаад энд тэндгүй хэрэглээд байхад би илжиг шиг зүтгээд “э” үсгээр бичнэ гээд байдаг. Энэ олон “э”-г яах ч юм билээ дээ. ebook = э-ном ebook reader = э-ном уншуур ecard = э-ил захидал, электрон ил захидал ecash = э-мөнгө, электрон мөнгө ecatalog = э-лавлах, э-жагсаалт ecommerce = э-худалдаа ecruiting = э-элсүүлэлт, электрон элсүүлэлт ejournal = э-сэтгүүл, электрон сэтгүүл elancer = э-гэрээт ажилтан electronic business = электрон бизнес electronic cheque = электрон чек electronic commerce = электрон худалдаа electronic journal = э...

Хиймэл оюуны загварын тухай үргэлжлэл

Энэ сайхан өдрийн мэндийг уншигч найз нартаа хүргэе.    Хиймэл оюуны загварын тухай үргэлжлэл (хоёрдугаар хэсэг). Би: Тэгвэл Google AI эсвэл Facebook AI юу нь дээр суурьлаж ажилладаг бэ? Өө энэ чинь маш сонирхолтой сэдэв байна 🤓. Google, Facebook (Meta) хоёрын хиймэл оюуны “тархи” нь GPT-ээс ялгаатай боловч мөн адил нейрон сүлжээ + transformer архитектур дээр суурилдаг. Харин өөр өөр нэртэй, өөр өөр зорилготой загварууд хөгжүүлсэн байдаг. Google AI Google-ийн гол хиймэл оюуны технологиуд: Transformer (2017) Google-ийн судлаачид анх бүтээсэн. Энэ нь GPT, BERT, LLaMA гээд бүх том хэлний загварын үндэс болсон. BERT (2018) Голдуу хайлтын системийг сайжруулахад хэрэглэсэн. Хэлний утга, өгүүлбэрийн холбоо ойлгоход сайн. PaLM (2022) → дараа нь PaLM 2 Google-ийн GPT-тэй төстэй том загвар. Bard (дараа нь Gemini нэртэй болсон) chatbot нь PaLM дээр суурилж ажилладаг. Gemini (2023–) Одоогийн Google AI-ийн гол “тархи”. Multimodal буюу зураг, текст, код, видео зэрэг олон төрлийн өг...

Цэгэлбэрээс вектор фонт

Фонт үүсгэж засварлах олон янзын програм байдаг ч тэр болгон хүн худалдаж аваад хэрэглэх боломжгүй нилээд үнэтэй байдаг тул нээлттэй эхийн Fontforge програмыг http://fontforge.sourceforge.net/   татаж аваад хэрэглэж болно. Олон жилийн өмнө сургалтын хэрэгцээнд авсан програмууд шинэ технологийн үзүүлэлтүүдийг тусгаагүй тул хэрэглэх эд тохиромжгүй болжээ. Ингээд энэ фонт үүсгэж засварлах програмыг найзуудаасаа сонсоод судалж байгаад  хэрэглээд үзсэн их дажгүй санагдсан. MongolianScript  ( MongolianScript-tar ) фонтын 2008 оны хувилбар болох  Монгол бичгийн Opentype фонтыг үүсгэж дүрмүүдийг энэ програмаар оруулж өгсөн юм. Фонтод  үсгүүдийг дараалж бичихэд хэрэглэдэг Глип байрлуулах(Glyph Positioning ) гэх дүрмийг үсэг бүрийн хувьд тодорхойлох хэрэгтэй байдаг гэхдээ үүнийг одоогоор энэ фонтод тодорхойлоогүй.  Учир нь монгол бичгээр хооронд нь холбож бичиж байгаа МОДОН БАРЫН энэ хэв төвөггүй холбогдчихсон юм. Хэрэв монгол үсгийн гоё дэгжин фонтыг үүсгэх бо...