Skip to main content

Posts

Showing posts from November, 2009

Хоёр дахь тайлбар “MVS, NNBSP”

Монгол бичгээр бичвэрийг компьютерт дүрслэхэд тодорхой үүрэг хүлээх  функционал кодууд юникодод орсон байгаа. Энэ кодуудыг зөв хэрэглэснээр бичвэрийг  байх ёстой дүр зургаар нь харах нөхцөл зөв бүрдэхээс гадна хурааж шахах аргаар хадгалсан хэл зүйн корпус болон өгөгдлийн санг бэлтгэхэд хүртэл ашиг тусаа үзүүлнэ. Энэ функционал кодуудаас MVS (Mongolian vowel separator) монгол эгшиг тусгаарлагч , NNBSP (Narrow no-break space) тасрахгүй богино зайг    яаж хэрэглэх талаар товчхон өгүүлье. Монгол эгшиг тусгаарлагч зөвхөн үгийн төгсгөлд бичих орхиц “а”, “э” үсгийн өмнө орж ирэх бөгөөд ижил галигтай дүр нь өөр хоёр үгийг ялгаж бичих үед хэрэглэнэ. Жишээ нь ...н_а, ...х_а, ...г_а, ...м_а, ...л_а, ...с_а, ...ж_а  төгсгөлтэй үгийг эгшиг тусгаарлагчтай байвал яаж бичих үү тусгаарлагч байхгүй бол яаж бичих вэ гэдгийг харьцуулан харуулж байна. Тасрахгүй богино зайг Монгол бичгийн үгийн дагаврыг үгээс салгахгүй байх зорилготой. Өнгөн талаасаа харахад ердийн сул зай мэт б...

Бүтээлч олны лиценз

Англи хэл дээрх эх сурвалж Википедиад  дээр Creative Commons Licenses холбоос дээр байгаа. 2001 онд “ Бүтээлч олон(Creative Commons) ” ашгийн бус корпорац нь АНУ-д байгуулагдсан бөгөөд тус байгууллага нь зохиогчийн эрх бүхий хэд хэдэн лиценз дээр тулгуурлан “ Бүтээлч олны лиценз (Creative Commons licenses) ” -ийг боловсруулж 2002 оны 12-р сарын 16 -наас албан ёсоор хэрэгжүүлж эхэлсэн байна. Ихэнх лиценз нь нэн ялангуяа оригинал буюу эх лицензүүд з охиогчийн эрхтэй (copyrighted) бүтээлүүдийг өөрчлөхгүй, төлбөр авахгүйгээр түгээх эрхтэй гэх мэт “ суурь зарчим эрх/баримтлал ( baseline rights ) ” -ыг зөвшөөрнө. Зарим шинэ гарсан лицензүүд энэ баримтлалыг баримталдаггүй байна.   Бүтээлч олны лицензүүд дэлхийн нийтийн шүүн таслах 43 ялгаатай эрх одоогоор авах боломжтой байгаа ба нэмж  арван есийг   хөгжүүлж байна. АНУ-аас гадна лицензийн шүүн таслах эрх (jurisdictions) -ийг “Олон улс дахь бүтээлч олон (Creative Commons International)” -ий үйл ажиллагааны хүрэ...

Стандарт баримт бичиг

Монгол бичгээр компьютерт ажиллах ажиллагааг хангах зорилгоор Монгол бичгийн үсгийн код , програм хангамжийг боловсруулахад зориулж монгол бичгээр үг илэрхийлэх бичихэд хэрэглэх функционал кодуудыг олон улсын стандартад оруулах үүднээс олон хүний хөдөлмөрөөр их хэмжээний баримт бичиг боловсруулсан юм. Үүнийг зөвхөн Олон улсын стандартын байгууллагын WG 2 (ажлын бүлэг хоёр) оор орж ирсэн баримт бичгүүд дээр тулгуурлаж монгол бичигтэй холбоотой баримтын жагсаалтын нэг хэсгийг гаргаж ирлээ. Энэ бүгдийг монгол бичгийн холбогдолтой програм хангамжийг боловсруулах мөн хэлний судалгааны хэрэгсэл (tools) боловсруулах хүсэлтэй хэн боловч уншиж судлахад илүүдэхгүй болов уу гэж бодлоо. Би хувьдаа хэдэн жил монгол бичгийн энэ чиглэлийн асуудлыг сонирхож байхдаа олон сайхан хүнээс юм сурч мэдсэн бөгөөд баримт бичгүүдэд мэдээллийг боловсруулж хөгжүүлэхэд санаа оноо болох их хэмжээний мэдээлэл байдгийг мэдэж авсан. Харин кодлох гэсэн зорилгодоо чиглэгдээд олон сайхан өвөрмөц санаа хэрэгжилгүй...

Галиг (transliteration)

 Монгол бичгийг компьютерт галиглахыг олон аргаар шийдэх гэж оролдсоныг янз янзын баримтыг уншиж сурвалжилсны үндсэн дээр гаргаж ирлээ. Эндүү ташаа зүйл байвал бичээрэй. Энэхүү хүснэгтийг дараах холбоосоор ороод  харьцуулж үзэхэд галиглах  мөн гараас оруулах төрөл бүрийн санаа оноог гаргах боломжтой  байж магад. Олуулаа хэлэлцвэл илүү зөв  хувилбарыг олох нь магадлал өндөртэй байх болов уу гэж бодлоо. Олон янзын галиглах саналуудыг  харьцуулсан хүснэгтийг галиг файл    аас үзэж болно. Виндовз 7 дээр гараас яаж оруулсныг хэн нэг нь бичээд өгвөл хүснэгтэд нэмээд оруулъя. Монгол бичгийн галигийг шийдвэрлэх талаар монгол, өвөр монголын хэлний мэргэжилтнүүдийн болон стандартын газруудын хамтарсан хурлаар гаргасан баримт бичгийг олон улсын стандартад танилцуулсан баримт бичгийг ISO/TC 46/WG 3 № ?   уншиж болно. (Интернетээс хайж олсон бөгөөд ямар үр дүнд хүрснийг баримтаар сурвалжилж байна. Энэ баримтад дугаар оноосон байх ёстой бөгөөд тэ...

Нэг дэх тайлбар "ŋ" .

Дэлхий олон үндэстнүүд өөр хоорондоо ялгаатай янз янзын бичгийн  хэлийг хэрэглэх бөгөөд бичиг үсэг бүрийн мэдээлэл агуулах тэмдэгтүүдийг өөртөө агуулсан  мэдээлэл дамжуулах кодын систем нь юникод. Энэ кодын системийг компьютерын ертөнцийн үйлдвэрлэлийн стандарт гэж хэлэх бөгөөд кодын систем нь өөрийн дүрэм журамтай,  бүтцээр бол байшин шиг олон давхартай, кодуудын харилцан үйлдлийг тодорхойлох функционал кодуудыг өөртөө агуулсан гээд олон нууц ид шидтэй. Түүнийг нь “canonical” буюу тодорхой дүрмийг зөвшөөрөх жаяг, ба  “compatible” буюу хэд хэдэн код хавирга бөөрөөрөө тэврэлдэх, бүүр цаашлаад заримыг нь өвөр түрийнд нь хийж өгөөд өөр нэг кодыг илэрхийлэх боломжийг илэрхийлэгч гэнэ. Энгийн жишээ нь “ n ~ ” хоёр кодыг ашиглаад дээрээ долгионтой ЭН  үсэг гаргах нөхцөлийг “canonical” гэх бөгөөд нэг үсгээ олон янзаар кодолсон үед хэрэглэх боломжтой гэж  хэлдэг.  Харин ff гэсэн хоёр ЭФ -ийг дэгжин бичихэд туслах гэж нэг дүрс бүхий кодоор илэрхийлсэн ээ “com...

Хураангуй

Хэд хоног олон янзын хураангуй үгтэй баримт бичиг эргүүлж тойруулж уншиж байтал “Acronym” -ийн хажуугаар барагтай л анзаардаггүй байсан “numeronym” тухай  Википедиагаас уншлаа. Энэ тоонд суурилсан хураангуй үгийн тухай бусад хүнд сонин байж магад гэж бодлоо. Хураах арга нь үгийнхээ эхлэл төгсгөлийн үсгийг оруулаад дунд нь байгаа үсгийн ширхгийн тоог голд нь тавина. Цахим тооцоолуурын орчны  зарим үгсийг глобалчлалын үед  дараах хураангуйгаар хэрэглэж байгаа юм байна.  a11y – Accessibility “ Ямар ч хүн компьютерыг хэрэглэх боломжтой болгох програм техник хангамжийн олон асуудлыг хамарсан технологи боловсруулах ажлыг илэрхийлэхэд олон улс хэрэглэх нэр томъё. Жишээ нь муу хардаг, сонсгол сул, яриж чадахгүй хүн зориулж ажиллагааг хялбарчлах олон янзын технологи байж болно. Програмууд дээр бол бүтэн үг байдлаар байж байдаг.” c11y - Consumability c14n - Canonicalisation / Canonicalization d11n - Documentation “Цахим тооцоолуурын орчинд баримтжуулалт, баримт би...

Эртний загвар

Монгол бичгийн талаар олон жилийн өмнө хийж байсан загварчлалын ажил байгаа юм. Хэрэгтэй хүндээ бол уншаад үзвэл сонин байж магад гээд хаягуудыг нь энд  холбоосоор хавсаргаад тавилаа. Гүүгл-дээд хайвал үндсэн санаа дээр нь суурилсан ажлуудын холбоосууд олдож магад. My Report 75 :      Миний бичсэн 75 дугаартай баримт бичгийн .PDF холбоос Myatav Erdenechimeg and Richard Moore. Multi-directional Multi-lingual Script Processing. Technical Report 75, UNU-IIST, P.O.Box 3058, Macau, June 1996. Published in Proceedings of the Seventeenth International Conference on the Computer Processing of Oriental Languages, Hong Kong, April 2 - 4, 1997, under the title Multi-directional Multi-lingual Script Processing.  {abstract} Although there are increasingly many text processing systems which support multiple languages, the majority of these do not allow the different languages to retain their traditional writing direction, instead imposing either that of the European famili...