Skip to main content

Нэг дэх тайлбар "ŋ" .

Дэлхий олон үндэстнүүд өөр хоорондоо ялгаатай янз янзын бичгийн  хэлийг хэрэглэх бөгөөд бичиг үсэг бүрийн мэдээлэл агуулах тэмдэгтүүдийг өөртөө агуулсан  мэдээлэл дамжуулах кодын систем нь юникод. Энэ кодын системийг компьютерын ертөнцийн үйлдвэрлэлийн стандарт гэж хэлэх бөгөөд кодын систем нь өөрийн дүрэм журамтай,  бүтцээр бол байшин шиг олон давхартай, кодуудын харилцан үйлдлийг тодорхойлох функционал кодуудыг өөртөө агуулсан гээд олон нууц ид шидтэй. Түүнийг нь “canonical” буюу тодорхой дүрмийг зөвшөөрөх жаяг, ба  “compatible” буюу хэд хэдэн код хавирга бөөрөөрөө тэврэлдэх, бүүр цаашлаад заримыг нь өвөр түрийнд нь хийж өгөөд өөр нэг кодыг илэрхийлэх боломжийг илэрхийлэгч гэнэ. Энгийн жишээ нь “n ~” хоёр кодыг ашиглаад дээрээ долгионтой ЭН  үсэг гаргах нөхцөлийг “canonical” гэх бөгөөд нэг үсгээ олон янзаар кодолсон үед хэрэглэх боломжтой гэж  хэлдэг.  Харин ff гэсэн хоёр ЭФ -ийг дэгжин бичихэд туслах гэж нэг дүрс бүхий кодоор илэрхийлсэн ээ “compatible” гэж хэлдэг.  Тэгвэл монгол бичгийн хувьд энэ кодын систем юу хийж чадах вэ? гэдэг бидэнд  сонирхолтой байх бол уу.

Ойрын хэд хоног компьютерт монгол бичгээр ажиллах үйл ажиллагааг(процессыг) сонирхогч залуусын хэлэлцүүлэгт оролцоод жил гаруйн өмнө хийгээд л хэрэглэхгүй орхисноос  орхигдуулсан алдааг тэдний дэмээр олж мэдээд урам ороод баярласнаа хэлмээр санагдлаа.     

Монгол бичгийн их инхлэг.  Хэлний хойгуур хэлдэг Н гийгүүлэгчийг  монгол бичигт НГ хоёр үсгээр хамжиж тэмдэглэнэ гэжээ. Инхлэг нь гаанс(гангса), гагнаас(гангнагасу), ган(ганг), гингэнэх(гингинэхү), годонтох(годонгтуху), тунхаглах, хангах, сонгох, өнгөрөөх, сан, өнгө гээд өч төчнөөн үгэнд ордог юм байна. Үүнийг уг нь нэг үсэг гээд Юникодод байр сууц гаргаад өгчихсөн байдаг. Гэтэл энэ гайхлыг судлаачид нь болохоор ŋ гээд тэмдэглэчихсэн байдаг латин үсгээр ng кирилл үсгээр нг гээд тэмдэглэнэ гээд бичээд байхаар нөгөө компьютерт кодоороо шууд үсрээд ороод ирэхгүй, хоёр кодын тусламжтайгаар орж ирнэ. Юникодод өмнө дурдсан зарчмаар дэлгэн харуулахдаа зөв хэлбэрийг харуулаад цаана нууцгай шиг хоёр кодыг хадгалаад байна.

(… tegün-ü qoyina tabdaγar on  tengri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda činggis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möngke bolju :   ...)

(… tegün-ü qoyina tabdaγar on  teŋri bolba : külüg qaγan üker jil-tü ajuγu : -:- tegün-ü qoyina tabdaγar on boluγsan-tur : boγda čiŋgis qaγan-u odqan anu tolui ejen : tegün-ü köbegün möŋke bolju :   ...)  


Цөөхөн хэрэглэгдэх ЛХ гэх нэмэлт үсэг дээр ч ялгаагүй энэ асуудал гарч ирэх байхдаа гэж санаж байна. (Лхагба, Лхасүрэн, Далха ...) Одоогоор монгол бичгээр бичсэн  өгөгдлийн сан их хэмжээгээр үүсээгүй,  үг эрэмбэлэх хэрэгцээгүй, зөв бичгийн дүрэм шалгахгүй, өөр нэг хэл рүү орчуулах эсвэл өөр нэг бичиг рүү хөрвүүлэх шаардлагагүй гээд   хэрэглээ бага байгаа болохоор санаа тавих хэрэггүй илүү асуудал мэт санагдавч ирээдүй хойчид хэрэглээ нь их болох юм билүү, үүнийг жигдлэх хэрэгтэй бол уу? Та юу гэж бодож байна.  Тийм бол яаж , харин үгүй бол яагаад вэ?   


Comments

Залуха said…
Сайн байна уу?
Та бүхний хэлэлцүүлгийг надад их өндөр сэтгэгдэл төрсөн. Өөрөө ч гэсэн та бүхний хийж ажлыг судлаад, оролцох юмсан гэж бодогдсон шүү.
Миний мэдэхээр өвөрмонголчууд цахим хэл шинжлэлийн (computational linguistic) чиглэлээр багагүй зүйлс хийсэн байдаг. Тэднээс энэ чиглэлээр хийсэн зүйлс дээр олон зүйл сурч болох байх гэж бодож байна.
Таны хөндсөн энэ сэдвийн хувьд одоо л жигдлэж авахгүй бол дараа зөндөө асуудлын уг үндэс болно гэж бодож байна.
Энэ талаар уг нь хийх сонирхолтой ажлууд их байдаг гэж би боддог юм. Даан ч сонирхдог монгол залуус цөөхөн юм. Сонирхож үзээд олуулаа болуул их зүйлийг бид монголчууддаа өвлүүлж үлдээж чадна шүү. Монгол бичгээр компьютерт ажиллах боломжийг нь бүрдүүлэх талын суурийг шийдвэрлэх хэрэгтэй байгаа юм. Өвөр монголын их сургуулийн монгол хэл судлалын салбарт Чойжинжав гээд профессор байгаа, судалгааны баг-тай, тэд уг нь их зүйл хийсэн. Хэлний мэргэжлийн олон хүн бий. Нэлээдийг нь би танина. Даан ч програмын хүмүүс нь солигдоод байдаг шиг билээ. Би 1991 онд тэр сургууль дээр очиж хэдэн сар болсон. Одоо бол их зүйл нэмэгдсэн байх аа. Уншиж мэдэх нэмэлт мэдээлэлтэй холбоосууд байвал хэлээрэй. Програмчлал талаас нь гадны хүмүүс (монгол хэлээ мэдэхгүй) үзэхээр эгшиг гийгүүлэгч ээ ялгасаар байгаад л гол зорилго нь өөр болчихдог шиг байгаа юм.
xvv said…
нг үсгийн хувьд тэгээд нг гэж дараалж орсон өөр шүд+г гэж холбогддог үг ер нь байдаггүй юм уу? Гарнаас шууд н гээд оруулахад нг гэсэн нэг тэмдэгтийг шууд өгдөг болох байх тэгэхээр заавал нг биш н гээд галиглачих боломжтой бол болох л юм шиг? Гэхдээ хэл шинжлэлийн хүн биш болохоор бас сайн мэдэхгүй юм аа.

Монггол гэж галиглахаар дараа нь Монгол гэдгээс хөрвүүлэхэд алдаа гарч мэдмээр ч юм шиг...
Нөгөө хэлний угийн Н гээд байгаа нь хойноо эгшиг байхгүй монгол бичгийн НГ гээд байгаа код чинь л дээ. Монгол бичигт н дээр г нэмэхээр (шүд нэмэх чих) :-) гэхээр нөгөө НГ илэрхийлдэг юм байна. Үнэн хэрэгтээ (a1)(a2)(a3)(a4)(a4)(a2)(a5) гээд өөр бас (a1)(a2)(a6)(a4)(a2)(a5) гэж кодоор хадгалчихаар юугаар нь хайх вэ гэдгээл тодорхой болгох гэсэн асуудал байгаа юм шүү дээ. (Монгол хэлний мэргэжилтнээс лавлах хэрэгтэй) Олон улсын стандартад Монгол бичгийн галиг баримт бичигт орсон баталгаат эх сурвалж олдохгүй байна. Draft баримт байна. Failed баримт байна. Үр дүн баримт алга. Монгол стандартын газраас асуусан таг. :-(

Олон уншигдсан

Хөдөө талын үзэсгэлэн "Монгол бичгээр"

Монгол, Живхтэй жаал хүүгийн бичсэн хэд хэдэн бичлэгийг уншиж байснаа гэнэт урам орж бараг арван долоо найман жилийн өмнө хэрэглэж байсан хайрцаг дүүрэн цаас бичгээ уудалж эхэлтэл миний хувьд эрдэнэс болох сайхан зүйлүүд гарч ирлээ. Ерээд оны эхэнд монгол бичгийн бичвэр бичих СУДАР нэртэй програмыг хийх гэж оролдож байхдаа монгол бичгийн фонтын загвар болгох гээд Т. Дашцэдэн (МУИС) багшаар бичүүлж авсан хуудаснууд байна. Үүнийг би бүүр сканердаж байгаад хүнд үзүүлмээр санагдлаа. Харин кириллээр бичсэн хувилбарыг Гүүгл-ээр хайвал олон сайтаас уншиж болох болжээ. Монгол бичиг сурч буюу хүнд унших өгүүллэгийн нэг нь болох болтугай.  Д.Нацагдорж : Хөдөө талын үзэсгэлэн Хөдөө талын зэрэглээ мяралзан жирвэгнэхийн дунд хэдэн өндөр юм сүүмэлзэн үзэгдэх нь харь газрын аяны хүний нүдэнд яахин даруй танигдана. Хурдлан довтлох уурын тэрэгний өмнөөс намрын салхи хүчтэй үлээхэд хоёр нүдэнд нулимс гялтганан холын барааг харж ядна. Өвгөн жолооч ухасхийх, хийг нэмэхэд дөрвөн хүрд чө...

Хиймэл оюуны загварын тухай үргэлжлэл

Энэ сайхан өдрийн мэндийг уншигч найз нартаа хүргэе.    Хиймэл оюуны загварын тухай үргэлжлэл (хоёрдугаар хэсэг). Би: Тэгвэл Google AI эсвэл Facebook AI юу нь дээр суурьлаж ажилладаг бэ? Өө энэ чинь маш сонирхолтой сэдэв байна 🤓. Google, Facebook (Meta) хоёрын хиймэл оюуны “тархи” нь GPT-ээс ялгаатай боловч мөн адил нейрон сүлжээ + transformer архитектур дээр суурилдаг. Харин өөр өөр нэртэй, өөр өөр зорилготой загварууд хөгжүүлсэн байдаг. Google AI Google-ийн гол хиймэл оюуны технологиуд: Transformer (2017) Google-ийн судлаачид анх бүтээсэн. Энэ нь GPT, BERT, LLaMA гээд бүх том хэлний загварын үндэс болсон. BERT (2018) Голдуу хайлтын системийг сайжруулахад хэрэглэсэн. Хэлний утга, өгүүлбэрийн холбоо ойлгоход сайн. PaLM (2022) → дараа нь PaLM 2 Google-ийн GPT-тэй төстэй том загвар. Bard (дараа нь Gemini нэртэй болсон) chatbot нь PaLM дээр суурилж ажилладаг. Gemini (2023–) Одоогийн Google AI-ийн гол “тархи”. Multimodal буюу зураг, текст, код, видео зэрэг олон төрлийн өг...

Шувуун саарал

Саяхан интернэтээр сонин(Өдрийн сонин) уншиж байгаад Дамдин багшийн тухай “ Англи хэлний Дамдин ” гэсэн гарчигтай сайхан өгүүлэл уншсан юм. Багшийн орчуулгын ажлын талаар бичсэн байсан нь сонирхол татаад интернэтээр Д.Нацагдоржын “Шувуун саарал” -ыг хайтал шууд л 2006 онд сонин дээр хэвлүүлсэн орчуулга нь mongolnews.mn вэб хуудсны холбоосоор дороо гараад ирлээ. Багшийн орчуулгыг  олзуурхаад монгол хэлээр бичсэнтэй нь хамт дээр нь монгол бичгээ сурч байгаа танд зориулаад монгол бичигтэй нь хамт тэмдэглэл дээрээ  тавилаа. (Монгол бичгээр бичиж явуулсан найз охиндоо баярлалаа. ;-) ) .   Enjoy reading. Д.Нацагдорж Шувуун саарал (1) Хөндий талын зэрэглээ мяралзан жирэлзэх нь холоос үзэхэд сонин. Хэдэн жижигхэн юм түүний дунд сүүмэлзэх нь яахин даруй танигдана. Уудам газар дураар сэлгүүцэх хээр хөдөөгийн цэнгэл, хурдан морины яралзан ирэх эр хүний бахдал, ойртон үзвэл, хэдэн залуус морь тарлаж байна. (2) Сүрэнхүү саарал морины амыг арайхан тогтоож, овооны дэр...

Хиймэл оюуны загвар GPT

  Энэ сайхан өдрийн мэндийг уншигч найз нартаа хүргэе. Ойрд ChatGPT апп ашиглаж олон сэдвээр сонирхолтой ярилцлага хийж үзээд олж мэдсэн зүйлсээ найз нартайгаа хуваалцмаар санагдав. Орчин үед AI (хиймэл оюун ухаан) талаар байга яригддаг болсон ч тэр болгон хүмүүс юу юм бэ гэдгийг нарийвчлан сонирхож байгаагүй байдаг. Ингээд би ChatGPT ярилцаж түүгээр  тайлбарлуулав. Би: AI (хиймэл оюун ухаан) гэж юу вэ?   Түүний өгүүлэх нь их энгийн тэрээр хэлэхдээ: 👉 Хиймэл оюун ухаан (AI) гэдэг нь хүний оюун ухааны зарим чадварыг дуурайж хийдэг компьютерийн хөтөлбөр эсвэл систем юм. Жишээлбэл: Хүн зураг хараад юу байгааг хэлж чаддаг шиг → AI зураг таньж чадна. Хүн яриаг ойлгож хариу хэлдэг шиг → AI хүний хэл яриаг ойлгож, ярьж эсвэл бичиж чадна. Хүн туршлагаасаа суралцдаг шиг → AI өгөгдлөөс суралцаж, улам ухаалаг болдог. Хиймэл оюун ухааныг ойлгоход туслах жишээ нь: Google Translate – хэлнээс хэл рүү автоматаар орчуулдаг. Siri, Google Assistant – таны асуултад хариулж, ажил г...

Ховордсон зургийн дижитал хадгалалт

Хоёр гурван жилийн өмнөөс гарч эхэлсэн Монголчууд XVII-XX зууны эхэн үе зурагт түүх, Монголчууд XX зууны эхэнд зурагт түүх гэсэн сайхан цуврал номуудыг авч уншиж үзсэн.  Энэ намар Монголчууд XX зуун зурагт түүх гэх гуравдугаарх цувралыг номын дэлгүүрт хараад би нэлээд хэдэн жилийн өмнө 2009 онд British Library санхүүжүүлж хэрэгжүүлсэн EAP264: Ховордсон монгол зургийн негативуудыг дижиталаар хадгалж хамгаалах төслийн зургуудыг Британи номын сангийн веб хуудаснаас үзэж байснаа санав. Интернет өргөн дэлгэр хэрэглэх болсон өнөө үед та бид ч ялгаагүй дээрх төслийн тухай дээр холбоосоор ороод үзэж болно. Энэ төслийн талаар уг веб хуудсанд бичигдсэн зүйлээс хэсгийн та нартаа монгол хэл рүү хөрвүүлээд энд орууллаа. “ Монгол кино гэрэл зураг, дуу бичлэгийн архивд 160 мянга гаруй гэрэл зургийн хальс, 10552 шилэн негативыг хадгалж байдаг.  Энэ төслийн зорилго олонх нь огт хэвлэгдээгүй 1921-ээс 1945 оны хооронд авсан гэрэл зургийн шилэн негативуудыг дижитал зураг хэлбэрт оруу...

Клуб Хаус Аппликейшн

  Клуб Хаус (Clubhouse) аппликейшн (апп) гэж юу вэ,  яагаад гэнэт хаа сайгүй яриад эхлэв ээ? Ард нь радиогоор ярьж, хэсэг нь хурал цуглаан ч гэмээр, нөгөө хэсэг нь гэртээ баяр ёслол тэмдэглээд ч байгаа шиг энэ бүгдийг багтаасан аудио чат(хөөрөлдөх) дээр суурилсан нийгмийн сүлжээний програмыг Клуб Хаус(гэр) гэж нэрэлжээ. Хэрэглэгчид, янз бүрийн сэдвээр сонирхолтой хүмүүсийн хоорондох харилцан яриа, ярилцлага, хэлэлцүүлгийг сонсох боломжтой, энэ нь яг подкастай төстэй боловч шууд (амьд ) үйл явцад нэмэлт давхарга програмаар оролцох ба оролцох хүмүүс  бүгд уригдсан байна. Клуб Хаус зөвхөн уригдсанд үйлчилнэ. Та үүнийг апп дэлгүүрээс татаж аваад данс үүсгэх боломжгүй.   Бодит амьдрал дээрх орон нутгийн эсвэл дарвуулт онгоцны клубын нэгэн адил клубын одоо байгаа гишүүн таныг урих болно.   Бодит амьдрал дээрх Элитийн клубыг орчин үед виртуал болгосон хэлбэр.  Та элсэх үедээ өөрийн сонирхдог сэдэв жишээлбэл техник, ном, бизнес эсвэл эрүүл мэнд гэх мэтчил...

Домог

Монгол бичгийн үүсэл гаралтай холбоо бүхий хоёр зүйлийн домгийг найз багш Мөнх-Учирал маань монгол бичгээр бичиж өгсөн юм(ОпенМН зориулж). Энэ бичвэрийн фонт нь их сайхан, зурлага дээр суурилсан глипс (glyphs) байх, МУИС-ийн Монгол хэл соёлын сургуулийн эх бичиг судлалын тэнхимд (Жамянсүрэн) глипс (glyphs)-ыг зурж бүтээсэн байх гэж бодож байна. Үүнийг Монгол бичгээ сурч, дэлгэрүүлж байгаа залуустаа уншуулахаар орууллаа. Домгийн тухай Гүүгл ахаасаа лавлахад бас ч их зүйл интернэтэд байна аа. Нэг нь “Хэдэргэний домог” хэмээдэг, XVIII зууны үед Равжамба Данзандагвын зохиосон “Зүрхэн толтын тайлбар огторгуйн маани” хэмээх хэл зүйн бичигт гардаг “... Зая Бандид (Саж Бандид Гунгаажалцан) Монгол улсад аль үсгээр туслах болох хэмээн шөнө тугдам барьж эрт манагар бэлэглэхүйд нэгэн эхнэр хүн мөрөн дээрээ хэдрэгэ модыг тавьж ирээд мөргөвөөс, тэрхүү бэлгээр Монгол улсын үсгийг хэдрэгэний дүрсээр эр, эм, эрс гурваар, чанга хийгээд хөндий ба саармаг гурваар зохиосон болой” гэсэн домог юм. Энд өг...