Skip to main content

Глип орлуулах хүснэгт GSUB

Нээлттэй төрөл (Opentype) фонт сүүлийн үеийн фонтын нэгэн төрөл бөгөөд нэлээд өвөрмөц бүтэц загвартай. Опентайп технологийг Адоби, Майкрософт  компаниуд хамтран боловсруулсан мөн  үүнийг үйлдлийн бүх систем дээр хүлээн зөвшөөрөөд хэрэглээд нэлээд хэдэн жил болжээ. Опентайп фонт нь өөртөө бичгийн хэлний шинж чанарыг илэрхийлэхэд  туслах мэдээллийг агуулах боломжтой болсон бөгөөд тэр бүгдийг фонтын GSUB ба GPOS хүснэгтүүдэд тодорхойлж өгөөд  бичвэр боловсруулах клиент програмаар түүнийг ашиглах боломжтой юм. Монгол бичгийн Опентайп фонтыг үүсгэж ОпенОфист турших үүднээс Опентайпын талаар нэлээд зүйлийг уншиж судлахдаа ойлгосон зүйлээсээ фонтын талаар анхны ойлголттой залуусдаа тус болох бол уу гэж дараах бичлэгийг бичлээ.       

Глип орлуулах/сэлгэх хүснэгт GSUB (The Glyph Substitution Table)

Глип орлуулах хүснэгт нь фонт дахь хэлний бичлэгийн зарчим(систем) -ыг хангах ба бичлэгт орлуулах глипүүдийн  сэлгэх хувирлын тухай мэдээллийг агуулна. Олон хэлний бичигт орлуулагч глипийг шаарддаг. Жишээлбэл: монгол бичигт үсэг нь үгэнд орох байрлалаасаа хамаар ч өөр өөр зурлагаар бичигддэг. Глип гэдгийг та нэг үсэг эсвэл тэмдгийг зурж харуулах дүрс гэж ойлгож болно. Фонтын тухай дэлгэрэнгүй ойлгохын тул лигатур (ligature) гэсэн өөр нэг ухагдахууныг ойлгох хэрэгтэй. Зарим бичгийн хэлэнд глип орлуулгыг бичгийн гоо зүйн үүднээс лигатур  хэрэглэнэ. Жишээ нь Англи хэлэнд “ffi” үсгүүдийг холбож бичихэд хэрэглэж болно. Мөн үүнийг монгол бичигт “БО, БҮ, ПӨ, ПҮ” гэх үе, “МЛ” үсгийг зэрэгцүүлж бичих үед хэрэглэж болно.     

Ерөнхий төсөөлөл

Олон фонт глип  тэмдэгтэд буух буулгалт нэгээс нэг гэх нэг тэмдэгт нэг глиптэй байна гэсэн тэмдэгтийн кодлолын стандартаар хязгаарлаж хэрэглэдэг. Энэ нь фонтын глип бүр нэг тэмдэгтийн кодын утгад харгалздаг.

Хэд хэдэн тэмдэгтийн кодыг нэг глипэд буулгаж чадахгүй, үүнд лигатур глипүүд хэрэгтэй ба хэд хэдэн глип нэг тэмдэгтийн кодод буулгалт хийж чадахгүй мөн үүнд лигатурыг задалж хэд хэдэн глипээр илэрхийлэх хэрэгтэй.     
Глип орлуулахын тулд фонт хөгжүүлэгчид тэмдэгтийн кодууд нь ялгаатай байхаар  глипүүд болон орлуулагч глипийг нэг фонтонд эсвэл нэмэлт фонтыг үүсгэх эсвэл тэмдэгтүүдийн олонлог үүсгэдэг.  Энэ глипүүдэд хандахын тулд хэрэглэгчид тэмдэгтүүдийн код буюу тэмдэгтүүдийн олонлог эсвэл фонтын хооронд ээлжлэн шилждэг.

OpenType-д глипүүдийн хооронд сэлгэх буюу орлуулах.


Опентайп(OpenType)-ын GSUB хүснэгт нь глип орлуулалтыг бүрэн дэмждэг. Глип орлуулахдаа, GSUB нь глип индекс эсвэл  “cmap” хүснэгтэд тодорхойлсон индексүүдийг  глип индекс эсвэл глип орлуулагчийн индексүүдэд харгалзуулж буулгана. Жишээ нь: Хэрэв фонтод монгол бичгийн А үсгийн бичлэг буюу глип  дөрвөн өөр глип хэлбэрээр байвал “cmap” хүснэгтэд  монгол бичгийн А үсгийн кодыг(юникод) орлогч нь энэ дөрвөн глипийн зөвхөн нэг нь байх болно. Үлдсэн гурван глипийг энэ ганц индексээр гаргаж  ирэхийг GSUB хүснэгтэд зааж өгнө.

Бичвэр боловсруулагч клиент програм нь GSUB өгөгдлөөр глип сэлгэх үйлдлээ гүйцэтгэнэ. GSUB нь глипүүдийн орж ирэх болон глип бүрийг орлуулж гаргах ажиллагааг таньж, хаана хэзээ клиент програм глип орлуулгыг хэрэглэхийг тодорхойлж, мөн глип орлуулах үйл ажиллагаанд даалгавар өгч зохицуулдаг. Хэчнээн ч тооны орлуулгыг фонт дохь бичгийн эсвэл хэлний систем төлөөлөгчид тодорхойлж өгч болно.

GSUB хүснэгт олон улсын хэвлэлийн технологид өргөн хэрэглэдэг глип орлуулгын зургаан төрлийг дэмждэг. Үүнд:

Дан орлуулга (A single substitution), нэг глипийг өөр нэг глипээр солих. Глипийн хувилбарыг байрлалаас хамааруулж хувиргахад хэрэглэнэ. Өөрөөр хэлбэл үсгийн үгийн эхэнд, дунд, адагт бичигдэх хувилбарын өөр хэлбэрүүдийг бичихэд хэрэглэнэ.  

Үржих орлуулга (A multiple substitution), нэг глипийг хоёр болон түүнээс дээш глипээр орлуулна. Үүнийг лигатур-ыг задлах мэт үйлдлийг тодорхойлоход хэрэглэдэг. Жишээлбэл монгол бичгийн БҮ гэсэн үеийг Б ба Ү гэсэн хоёр тусдаа бичихээр салгана л гэсэн утга.     

Хувилбар(ондоо) орлуулга (An alternate substitution), үүрэг нь ижил глипийн харагдах хэлбэр нь ондоо байхыг тодорхойлох орлуулга. Энэ глипүүд нь ихэнхдээ үзэмж гоо зүйн үүднээс ондоо өөр байна. Жишээлбэл фонт монгол бичгийн төгсгөл Б -г эсвэл төгсгөл О-г  хоёр ялгаатай глипээр бичиж хэрэглэж байвал, нэг глипийг өгөгдмөл индексээр “сmap” хүснэгтэд тодорхойлно. Тэгээд клиент програм нь өгөгдмөл глипийг хэрэглээд өөр хэлбэрийг нь орлуулгаар хэрэглэж болно.

Лигатур орлуулга (A ligature substitution), хэд хэдэн глип индексийг цугтан  нэг глип индексээр солино, Араб бичгийн хэлэнд бие даасан хэд хэдэн глипийн стринг лигатураар орлуулж болно. Цувсан олон глип буюу стринг нь орлуулгаар ганц лигатур болж болно. Энэ тохиолдолд эхний глип лигатур болсон гэсэн үг. Стрингээс ийм аргаар устгагдаад үлдэх глипүүдэд “lookup” дарцгуудыг энэ глидүүдийг алгасаж байна гээд нэгтгэж өгдөг.  

Үүнтэй адил монгол бичгийн нум зурлагатай гийгүүлэгч үсгүүдийг эгшгээр амилуулсан үеийг бичихдээ нум дотор арын эгшгийг оруулж ирээд бичгийн сайхан хэвээр дүрслэх лигатурыг хэрэглэнэ. (Уг нь үүнийг хэрэглэхгүйгээр ерээд оны эхэнд SUDAR-т ажиллаж байсан, мэргэжлийн олон хүн  юникодыг боловсруулах явцдаа лигатургүй байхгүй бол төрөл бүрийн фонт үүсгэхэд төвөгтэй гэснээр лигатур бэлтгэсэн. Лигатур хэрэглэхгүй Монгол бичгийн фонтын GPOS-ийг ашиглаад байрлалаар тохируулах арга буюу нумтай үсгийн дараа орсон  О,У,Ө,Ү  гэх мэтийг нумын дунд хүртэл курсорыг шилжүүлж байрлуулаад бич гээд хүснэгтээр зааж өгч бичиж  болно.:-) )

Хамааралтай орлуулга (Contextual substitution), хамгийн хүчтэй төрөл бөгөөд глипүүдийн зарим дүрмээр(pattern) нэг эсвэл нэлээд глипийг орлуулах хамаарлын нөхцөлтэйгөөр глип орлуулгуудыг тодорхойлно. Орлуулга бүрт орох нэг эсвэл хэдэн глип дараалал ба дараалал дээр гүйцэтгэх нэг эсвэл хэдэн орлуулга тодорхойлогдоно. Хамааралтай орлуулга нь тодорхой глип дараалал(sequences), глип ангиар(classes), глипүүдийн олонлогоор(sets) хэрэгжинэ.

Жишээ нь монгол бичгийн үе ба үгийн адагт доороо эгшиггүй дэвсгэрлэн ордог үсгийг олонлог болгож ялгаад дэвсгэрлээгүй  үедээ нэг янзаар бичих дэвсгэрлэсэн үедээ өөрөөр бичихийг ялгаж хэрэглэж болно.

Гинжилсэн хамааралтай орлуулга (Chaining contextual substitution), хамааралтай орлуулгын хүчин чадлыг өргөтгөх зорилготой. Үүгээр орох дарааллын глипүүдийн дүрмээр нэг эсвэл хэдэн глипээр нэг эсвэл хэдэн орлуулгыг гүйцээж болно. Мөн оруулах дарааллыг “буцаж явах” ба/эсвэл “урьдчилан харах” дараалалтай холбож шинжилнэ. Ийм орлуулга бүрийн орох дарааллыг
  • глипүүдтэй ажиллах
  • глип ангиудаар
  • глип олонлогоор
гэсэн гурван форматыг ашиглаж хэрэгжүүлж чадна. Форматууд дор бүрдээ нэг эсвэл хэд хэдэн “буцаж явах”, оруулах ба “урьдчилан харах” дарааллуудыг тодорхойлж чадна.

Гинжилсэн хамааралтай дан орлуулгыг буцаах (Reverse Chaining contextual single substitution), энэ нь “буцаж явах” ба/эсвэл “урьдчилан харах” дарааллаар гинжлэн оруулсан глипээр орлуулж солигдсон ганц глипийг буцаахыг зөвшөөрнө. Энэ төрөл бусад “lookup” төрлөөс ялгагдах ялгаа нь оруулах глипийн дараалал төгсгөлөөсөө эхлэл рүү чиглэж боловсруулах ажиллагааг гүйцэтгэнэ.
Дараах баримт бичгүүдээс дэлгэрүүлэн судалж болно.

http://partners.adobe.com/public/developer/opentype/index_table_formats1.html
http://www.microsoft.com/typography/otspec/gsub.htm

Хэвлэлийн технологийн мэргэжилтнүүд бичгийн ТЭГ / ТИГ гээд яриад байгаа л даа.  Би үүнийг фонт, глип, лигатур, фонтын төрлийн алийг нь хэлээд байгааг оноож хэлж мэддэггүй. Мэдвэл туслаарай залуусаа.

Comments

Ochko said…
Хэрэгтэй мэдээлэл тавьжээ. Баярлалаа.

Popular posts from this blog

Хөдөө талын үзэсгэлэн "Монгол бичгээр"

Монгол, Живхтэй жаал хүүгийн бичсэн хэд хэдэн бичлэгийг уншиж байснаа гэнэт урам орж бараг арван долоо найман жилийн өмнө хэрэглэж байсан хайрцаг дүүрэн цаас бичгээ уудалж эхэлтэл миний хувьд эрдэнэс болох сайхан зүйлүүд гарч ирлээ. Ерээд оны эхэнд монгол бичгийн бичвэр бичих СУДАР нэртэй програмыг хийх гэж оролдож байхдаа монгол бичгийн фонтын загвар болгох гээд Т. Дашцэдэн (МУИС) багшаар бичүүлж авсан хуудаснууд байна. Үүнийг би бүүр сканердаж байгаад хүнд үзүүлмээр санагдлаа. Харин кириллээр бичсэн хувилбарыг Гүүгл-ээр хайвал олон сайтаас уншиж болох болжээ. Монгол бичиг сурч буюу хүнд унших өгүүллэгийн нэг нь болох болтугай.  Д.Нацагдорж : Хөдөө талын үзэсгэлэн Хөдөө талын зэрэглээ мяралзан жирвэгнэхийн дунд хэдэн өндөр юм сүүмэлзэн үзэгдэх нь харь газрын аяны хүний нүдэнд яахин даруй танигдана. Хурдлан довтлох уурын тэрэгний өмнөөс намрын салхи хүчтэй үлээхэд хоёр нүдэнд нулимс гялтганан холын барааг харж ядна. Өвгөн жолооч ухасхийх, хийг нэмэхэд дөрвөн хүрд чөлөө

Шувуун саарал

Саяхан интернэтээр сонин(Өдрийн сонин) уншиж байгаад Дамдин багшийн тухай “ Англи хэлний Дамдин ” гэсэн гарчигтай сайхан өгүүлэл уншсан юм. Багшийн орчуулгын ажлын талаар бичсэн байсан нь сонирхол татаад интернэтээр Д.Нацагдоржын “Шувуун саарал” -ыг хайтал шууд л 2006 онд сонин дээр хэвлүүлсэн орчуулга нь mongolnews.mn вэб хуудсны холбоосоор дороо гараад ирлээ. Багшийн орчуулгыг  олзуурхаад монгол хэлээр бичсэнтэй нь хамт дээр нь монгол бичгээ сурч байгаа танд зориулаад монгол бичигтэй нь хамт тэмдэглэл дээрээ  тавилаа. (Монгол бичгээр бичиж явуулсан найз охиндоо баярлалаа. ;-) ) .   Enjoy reading. Д.Нацагдорж Шувуун саарал (1) Хөндий талын зэрэглээ мяралзан жирэлзэх нь холоос үзэхэд сонин. Хэдэн жижигхэн юм түүний дунд сүүмэлзэх нь яахин даруй танигдана. Уудам газар дураар сэлгүүцэх хээр хөдөөгийн цэнгэл, хурдан морины яралзан ирэх эр хүний бахдал, ойртон үзвэл, хэдэн залуус морь тарлаж байна. (2) Сүрэнхүү саарал морины амыг арайхан тогтоож, овооны дэргэд буун, хөлсий нь

Бичгийн тиг

Гэртээ очоод аав ээж, ах дүү, найз нөхөд, хамт ажиллаж байсан багш нартаа гаа уулзаж учрах нь үнэхээр сайхан байлаа. Үүний зэрэгцээ манай миний сургууль гэж дуудах дуртай их сургуулиараа өдөр бүр л орж гарсаар найз нөхөд багш нарынхаа хийж бүтээсэн янз янзын шинэ сайхан зүйлийг сонсож мэдээд баярлаж хөөрөөд цаг хугацаа өнгөрөхийг ч мэдсэнгүй. Сүүлийн хэдэн сар интернетээр найз залуучууд маань монгол бичгийн фонтыг хөгжүүлэх, вэб фонт бүтээх, түүний хэрэглээг нэмэгдүүлэх талаар санаа тавьж хичээнгүйлэн ажил өрнүүлж байгааг таних мэдэх багш нартаа дуулгаж бас тэдний зүгээс хамтран ажиллаа ч гэж хүслээ. Хэдэн жилийн өмнө МУИС-ын Монгол хэл соёлын сургуулийн эх хэлний судалгааны төвд хэрэгжсэн ЮНИСКО-гийн төсөл ажлын нэг хэсэг болох ( зурлага дээр суурилж ) монгол бичгийн фонт бүтээгдсэн ийг мэдэж байсан тул эх сурвалжийг асууж лавлаад, хэрэглэж байгаа аргын нь тодруулав.  Энэ зурган дээр үзүүлэх зүүн гар талын дөрвөн фонтыг зурлага дээр түшиглээд бэлдэж англи үсгийн гар дээр ү

Програмын нэр монголоор

Залуусаа, програмыг нутагшуулахад энэ олон нэрийг яаж бичвэл зүйтэй вэ? Empathy -г Үбүнтүнд эгшин зуур зурвас илгээгч клиентээр өгөгдмөл болгодог. Empathy -гаар та AIM, Gadu-Gadu, Google Talk, GroupWise, ICQ, IRC, Jabber, MSN, Napster, Salut, Sametime, QQ, ба Yahoo хэрэглэгчидтэй ярьж чадахаас гадна ганц цонхонд өөрийн бүх найзуудыг жагсаана. Empathy is the default instant messenger client in Ubuntu. With Empathy you can talk to people who use AIM, Gadu-Gadu, Google Talk, GroupWise, ICQ, IRC, Jabber, MSN, Napster, Salut, Sametime, QQ, and Yahoo, and list all your buddies in a single window. Жишээ нь бид Ubuntu=Үбүнтү, Openoffice.org=Оренофис.орг, Firefox=Галт үнэг, Joomla=Жуумло, Google=Гүүгли, Thunderbird(Цахилах шувуу) гэсэн нэрээр хэрэглээд байгаа. Одоогоор энд тэнд янз янзаар бичээд байгаа байх. Би сая дээрх орчуулгыг launchpad(Өрнүүлэх талбар) дээр хийж байсан аа гэнэт нэг сайн санаат нь (volunteer) зөвхөн програмын нэрийг Монголоор зөв бичихэд зориулсан онлайн товъёог

Домог

Монгол бичгийн үүсэл гаралтай холбоо бүхий хоёр зүйлийн домгийг найз багш Мөнх-Учирал маань монгол бичгээр бичиж өгсөн юм(ОпенМН зориулж). Энэ бичвэрийн фонт нь их сайхан, зурлага дээр суурилсан глипс (glyphs) байх, МУИС-ийн Монгол хэл соёлын сургуулийн эх бичиг судлалын тэнхимд (Жамянсүрэн) глипс (glyphs)-ыг зурж бүтээсэн байх гэж бодож байна. Үүнийг Монгол бичгээ сурч, дэлгэрүүлж байгаа залуустаа уншуулахаар орууллаа. Домгийн тухай Гүүгл ахаасаа лавлахад бас ч их зүйл интернэтэд байна аа. Нэг нь “Хэдэргэний домог” хэмээдэг, XVIII зууны үед Равжамба Данзандагвын зохиосон “Зүрхэн толтын тайлбар огторгуйн маани” хэмээх хэл зүйн бичигт гардаг “... Зая Бандид (Саж Бандид Гунгаажалцан) Монгол улсад аль үсгээр туслах болох хэмээн шөнө тугдам барьж эрт манагар бэлэглэхүйд нэгэн эхнэр хүн мөрөн дээрээ хэдрэгэ модыг тавьж ирээд мөргөвөөс, тэрхүү бэлгээр Монгол улсын үсгийг хэдрэгэний дүрсээр эр, эм, эрс гурваар, чанга хийгээд хөндий ба саармаг гурваар зохиосон болой” гэсэн домог юм. Энд өг

Шувуун саарал монгол бичгээр

Гүүгл нэмэхээр олон нийтийн сүлжээнд холбогдохдоо олон залуустай танилцаж сонирхлынхоо дагуу зарим нэгээс нь суралцаж, мэдэх чадах зүйлсээ хоорондоо хуваалцаж тэдэнтэй сайхан нөхөрлөж явна. Сүүлийн хэдэн долоо хоног Монгол бичгээ дэмжих хамт олны буланд олон янзын хэлэлцүүлэг өрнөж байх үеэр сонин санаа төрж  +Lkhamsuren Amarjargal   хүүд хэлтэл bootstrap ашиглаад хийх боломжтой гэж хэлэнгүүт сонгодог " Шувуун саарал "  аа ашиглаад энэ хуудсыг хийж үзэхээр болж тэр дороо л өнгөрсөн долоо хоногийн сүүлээр би бэлтгэл ажилд Амаржаргал туршилт ажилдаа шууд оров. bootstrap-getting-started   нь хэрэглэгчийг вэб хуудастай холбож өгөх интерфейсийг хялбар хөгжүүлэх хэрэгсэл бөгөөд Апачи лицензтэйгээр Твиттерт нээлттэй эхээр хөгжүүлжээ. Өөрийн нүүр хуудсандаа " Хурдан, хялбар вэб хөгжүүлэхдээ: тансаг, уяан хатан, хүчтэй, анхнаасаа л хөдөлгөөнтэй нүүрэн талын фрэймворкыг бүтээх хэрэгсэл" гэж тодорхойлжээ. Энэ хэрэгсэлийг ашиглах бүрэн хэмжээний зааварууд энд бий.

Илжигний "И"

"И" үсгийг би илжиг гэх үгийг бичихэд хэрэглэх "и" үсэг гэж хэлдэг юм. Цагаан толгойн үсэг нүдлүүлэхэд ишиг, идээ, ингэ гээд олон үг жишээ болгож авдаг байх л даа. Харин электрон гэх үгийн “e” үсгийг орлож орсон, кирилл бичгээр бол “э” үсэгтэй “email” үгийг “и-мэйл/и-майл” гэж галиглаад бичээд байх юм аа. Гэтэл “email” гэсэн үгийг “э-шуудан” бүүр болохгүй бол “э-мэйл” гэж хэлмээр санагдах юм. Хэрэв “и” үсгээрээ галиглана гэж муйхарлаад энд тэндгүй хэрэглээд байхад би илжиг шиг зүтгээд “э” үсгээр бичнэ гээд байдаг. Энэ олон “э”-г яах ч юм билээ дээ. ebook = э-ном ebook reader = э-ном уншуур ecard = э-ил захидал, электрон ил захидал ecash = э-мөнгө, электрон мөнгө ecatalog = э-лавлах, э-жагсаалт ecommerce = э-худалдаа ecruiting = э-элсүүлэлт, электрон элсүүлэлт ejournal = э-сэтгүүл, электрон сэтгүүл elancer = э-гэрээт ажилтан electronic business = электрон бизнес electronic cheque = электрон чек electronic commerce = электрон худалдаа electronic journal = э