Дэлхий олон үндэстнүүд өөр хоорондоо ялгаатай янз янзын бичгийн хэлийг хэрэглэх бөгөөд бичиг үсэг бүрийн мэдээлэл агуулах тэмдэгтүүдийг өөртөө агуулсан мэдээлэл дамжуулах кодын систем нь юникод. Энэ кодын системийг компьютерын ертөнцийн үйлдвэрлэлийн стандарт гэж хэлэх бөгөөд кодын систем нь өөрийн дүрэм журамтай, бүтцээр бол байшин шиг олон давхартай, кодуудын харилцан үйлдлийг тодорхойлох функционал кодуудыг өөртөө агуулсан гээд олон нууц ид шидтэй. Түүнийг нь “canonical” буюу тодорхой дүрмийг зөвшөөрөх жаяг, ба “compatible” буюу хэд хэдэн код хавирга бөөрөөрөө тэврэлдэх, бүүр цаашлаад заримыг нь өвөр түрийнд нь хийж өгөөд өөр нэг кодыг илэрхийлэх боломжийг илэрхийлэгч гэнэ. Энгийн жишээ нь “n ~” хоёр кодыг ашиглаад дээрээ долгионтой ЭН үсэг гаргах нөхцөлийг “canonical” гэх бөгөөд нэг үсгээ олон янзаар кодолсон үед хэрэглэх боломжтой гэж хэлдэг. Харин ff гэсэн хоёр ЭФ -ийг дэгжин бичихэд туслах гэж нэг дүрс бүхий кодоор илэрхийлсэн ээ “compatible” гэж хэлдэг. Тэгвэл монгол бичгийн хувьд энэ кодын систем юу хийж чадах вэ? гэдэг бидэнд сонирхолтой байх бол уу.
Ойрын хэд хоног компьютерт монгол бичгээр ажиллах үйл ажиллагааг(процессыг) сонирхогч залуусын хэлэлцүүлэгт оролцоод жил гаруйн өмнө хийгээд л хэрэглэхгүй орхисноос орхигдуулсан алдааг тэдний дэмээр олж мэдээд урам ороод баярласнаа хэлмээр санагдлаа.
Монгол бичгийн их инхлэг. Хэлний хойгуур хэлдэг Н гийгүүлэгчийг монгол бичигт НГ хоёр үсгээр хамжиж тэмдэглэнэ гэжээ. Инхлэг нь гаанс(гангса), гагнаас(гангнагасу), ган(ганг), гингэнэх(гингинэхү), годонтох(годонгтуху), тунхаглах, хангах, сонгох, өнгөрөөх, сан, өнгө гээд өч төчнөөн үгэнд ордог юм байна. Үүнийг уг нь нэг үсэг гээд Юникодод байр сууц гаргаад өгчихсөн байдаг. Гэтэл энэ гайхлыг судлаачид нь болохоор ŋ гээд тэмдэглэчихсэн байдаг латин үсгээр ng кирилл үсгээр нг гээд тэмдэглэнэ гээд бичээд байхаар нөгөө компьютерт кодоороо шууд үсрээд ороод ирэхгүй, хоёр кодын тусламжтайгаар орж ирнэ. Юникодод өмнө дурдсан зарчмаар дэлгэн харуулахдаа зөв хэлбэрийг харуулаад цаана нууцгай шиг хоёр кодыг хадгалаад байна.
(… tegün-ü qoyina tabdaγar on tengri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda činggis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möngke bolju : ...)
(… tegün-ü qoyina tabdaγar on teŋri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda čiŋgis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möŋke bolju : ...)
Цөөхөн хэрэглэгдэх ЛХ гэх нэмэлт үсэг дээр ч ялгаагүй энэ асуудал гарч ирэх байхдаа гэж санаж байна. (Лхагба, Лхасүрэн, Далха ...) Одоогоор монгол бичгээр бичсэн өгөгдлийн сан их хэмжээгээр үүсээгүй, үг эрэмбэлэх хэрэгцээгүй, зөв бичгийн дүрэм шалгахгүй, өөр нэг хэл рүү орчуулах эсвэл өөр нэг бичиг рүү хөрвүүлэх шаардлагагүй гээд хэрэглээ бага байгаа болохоор санаа тавих хэрэггүй илүү асуудал мэт санагдавч ирээдүй хойчид хэрэглээ нь их болох юм билүү, үүнийг жигдлэх хэрэгтэй бол уу? Та юу гэж бодож байна. Тийм бол яаж , харин үгүй бол яагаад вэ?
Ойрын хэд хоног компьютерт монгол бичгээр ажиллах үйл ажиллагааг(процессыг) сонирхогч залуусын хэлэлцүүлэгт оролцоод жил гаруйн өмнө хийгээд л хэрэглэхгүй орхисноос орхигдуулсан алдааг тэдний дэмээр олж мэдээд урам ороод баярласнаа хэлмээр санагдлаа.
Монгол бичгийн их инхлэг. Хэлний хойгуур хэлдэг Н гийгүүлэгчийг монгол бичигт НГ хоёр үсгээр хамжиж тэмдэглэнэ гэжээ. Инхлэг нь гаанс(гангса), гагнаас(гангнагасу), ган(ганг), гингэнэх(гингинэхү), годонтох(годонгтуху), тунхаглах, хангах, сонгох, өнгөрөөх, сан, өнгө гээд өч төчнөөн үгэнд ордог юм байна. Үүнийг уг нь нэг үсэг гээд Юникодод байр сууц гаргаад өгчихсөн байдаг. Гэтэл энэ гайхлыг судлаачид нь болохоор ŋ гээд тэмдэглэчихсэн байдаг латин үсгээр ng кирилл үсгээр нг гээд тэмдэглэнэ гээд бичээд байхаар нөгөө компьютерт кодоороо шууд үсрээд ороод ирэхгүй, хоёр кодын тусламжтайгаар орж ирнэ. Юникодод өмнө дурдсан зарчмаар дэлгэн харуулахдаа зөв хэлбэрийг харуулаад цаана нууцгай шиг хоёр кодыг хадгалаад байна.
(… tegün-ü qoyina tabdaγar on tengri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda činggis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möngke bolju : ...)
(… tegün-ü qoyina tabdaγar on teŋri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda čiŋgis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möŋke bolju : ...)
Цөөхөн хэрэглэгдэх ЛХ гэх нэмэлт үсэг дээр ч ялгаагүй энэ асуудал гарч ирэх байхдаа гэж санаж байна. (Лхагба, Лхасүрэн, Далха ...) Одоогоор монгол бичгээр бичсэн өгөгдлийн сан их хэмжээгээр үүсээгүй, үг эрэмбэлэх хэрэгцээгүй, зөв бичгийн дүрэм шалгахгүй, өөр нэг хэл рүү орчуулах эсвэл өөр нэг бичиг рүү хөрвүүлэх шаардлагагүй гээд хэрэглээ бага байгаа болохоор санаа тавих хэрэггүй илүү асуудал мэт санагдавч ирээдүй хойчид хэрэглээ нь их болох юм билүү, үүнийг жигдлэх хэрэгтэй бол уу? Та юу гэж бодож байна. Тийм бол яаж , харин үгүй бол яагаад вэ?
Comments
Та бүхний хэлэлцүүлгийг надад их өндөр сэтгэгдэл төрсөн. Өөрөө ч гэсэн та бүхний хийж ажлыг судлаад, оролцох юмсан гэж бодогдсон шүү.
Миний мэдэхээр өвөрмонголчууд цахим хэл шинжлэлийн (computational linguistic) чиглэлээр багагүй зүйлс хийсэн байдаг. Тэднээс энэ чиглэлээр хийсэн зүйлс дээр олон зүйл сурч болох байх гэж бодож байна.
Таны хөндсөн энэ сэдвийн хувьд одоо л жигдлэж авахгүй бол дараа зөндөө асуудлын уг үндэс болно гэж бодож байна.
Монггол гэж галиглахаар дараа нь Монгол гэдгээс хөрвүүлэхэд алдаа гарч мэдмээр ч юм шиг...