எனது வலைப்பதிவு பட்டியல்

திங்கள், 20 ஜனவரி, 2025

யுனிக்கோட் - பயன்பாடு

அறிமுகம்


   ஆங்கில மொழியைத் தவிர பிறமொழிகளிலும் பலரும் பல்வேறு குறியேற்றங்களையும் எழுத்துருக்களையும் பயன்படுத்தி வந்தனர். இந்த முறையில் ஒரே நேரத்தில் இரண்டு மொழிகளை மட்டுமே கையாள முடிந்தது. இத்தகைய சிக்கலைத் தீர்த்து, பல மொழிகளை ஒரே நேரத்தில் கையாளத் தேவையான ஒரு குறியேற்ற முறையை அமைக்க உலக அளவில் மென்பொருள் உருவாக்கும் நிறுவனங்கள் ஒன்றிணைந்து உலகின் அனைத்து மொழிகளையும் கணினியில் பயன்படுத்தும் வகையில் ஒரு குறியேற்றத்தை உருவாக்க முடிவுசெய்தது. இம்முடிவின் விளைவாக 1991இல் ஒருங்குறிச் சேர்த்தியம் (Unicode Consortium) என்ற கூட்டமைப்பிளை உருவாக்கினர். இதன்வழி உருவாக்கப்பட்டது தான் Universal Code எனப்படும் யுனிக்கோட் ஒருங்குறி ஆகும்.

யுனிக்கோட் - செயல்பாடு 

          இந்த ஒருங்குறிச் சேர்த்தியம் 16 பிட்டு அமைப்பு கொண்ட யுனிகோடு (Unicode) என்னும் குறியேற்றத்தை வடிவமைத்தது. இந்தக் குறியேற்ற அமைப்பில் 65,536 இடங்கள் உள்ளன. இம்முறை உலக மொழிகள் அத்தனைக்கும் தேவையான  இடங்களைக்  கொண்டிருந்தது.  ஒருங்குறிச் சேர்த்தியம் இந்திய மொழிகள் ஒவ்வொன்றுக்கும் 128 இடங்கள் ஒதுக்கப்பட்டிருந்த பட்டியலைக் கொடுத்தது. அதில் தமிழுக்கும் 128 இடங்களே ஒருங்குறியில் ஒதுக்கப்பட்டு  இருந்தது.

       குறிப்பாக, 16Bit குறியேற்றத்தில் உள்ள 65,536 இடங்களில் தமிழ் எழுத்துகள் 2944 முதல் 3071 வரை உள்ளன.  இந்த 128 இடங்களிலும் 50 இடங்கள் காலியாக உள்ளன.

          இதில் உயிர் எழுத்துகள் 12, அகரம் ஏறிய மெய்யெழுத்துகள் 18 ஆகிய 30 எழுத்துகள் உள்ளன. இவற்றைக் கொண்டு உயிர்மெய் எழுத்துகளை உருவாக்கிக்கொள்ளவேண்டும். தமிழில் உள்ள எல்லா எழுத்துகளுக்கும் தனித்தனி இடங்கள் இல்லாததால் இரண்டு எழுத்துகளைக் கொண்டு மூன்றாவது எழுத்தை உருவாக்க வேண்டியுள்ளது. இதற்குத்தான் இடையூக்கி மென்பொருள்கள் உதவுகின்றன. 

    2000ஆம் ஆண்டு Microsoft நிறுவனம் தான் வெளியிட்ட Windows 2000 என்ற இயங்குதளத்தில் தமிழைப் பயன்படுத்துவதற்கு ஒருங்குறியில் உருவாக்கப்பட்ட Latha என்ற எழுத்துருவைச் சேர்த்து வழங்கியது. இன்றளவும் விண்டோஸ் இயங்குதளங்களில் யுனிகோடு குறியேற்றத்தில் தட்டச்சு செய்ய இயல்பிருப்பாக (Default) லதா எழுத்துருதான் பயன்படுத்தப்படுகிறது. இணையதளங்கள் முழுமையும் இந்த யுனிக்கோடு முறையில் லதா எழுத்துருவில் இருக்கிறது.

   யுனிக்கோடு தமிழ்க் குறியேற்றத்தில் உயிர் எழுத்துகள்(12), அகரமேறிய மெய் எழுத்துகள்(18), ஆய்தம்(1) ஆக 31 எழுத்துகள் மட்டுமே இடம்பெற்றுள்ளன. எனவே பிற உயிர்மெய் எழுத்துகளை உள்ளிடுவதற்குத் தனியொரு மென்பொருள் தேவைப்படுகிறது. இதனைத் தவிர்க்கத் தமிழில் உள்ள 247 எழுத்துகளையும் தமிழ் எண்களையும் கிரந்த எழுத்துகளையும் சேர்த்து 313 இடங்களைக் கொண்டதாகத் தமிழ் அனைத்து எழுத்துக் குறியேற்றம் (Tamil All Character Encoding-TACE) என்ற ஒன்றினை 16பிட் குறியேற்றத்தில் கொண்டுவருவதற்காக உருவாக்கப்பட்டது. இதன் காரணமாக  தற்போது  தமிழுக்கான அனைத்து எழுத்துகளுக்கும் யுனிக்கோடு குறியேற்றத்தில் இடம் கிடைத்துள்ளது.

யுனிக்கோட் - பயன்கள் 

   யுனிக்கோட் வருகையால் இணைய செயல்பாடுகள் புதிய வளர்ச்சி அடைந்துள்ளது. குறிப்பாக,

#.உலக மொழிகளுக்கான பொதுவான எழுத்துக்கள் கிடைத்துள்ளன.

#. எடுத்துருக்களின் சிக்கலின்றிப் பயன்படும் பொது மொழியாக யுனிக்கோட் காணப்படுகிறது.

#.எல்லா இயங்கு தளங்களிலும் இயங்கக் கூடியதாக விளங்குகிறது.

#. முழுவதும் தமிழ் மொழியில் வடிவமைக்கப்பட்ட தமிழ் இயங்கு தளங்கள் உருவாக்கப்பட்டுள்ளன.

இவை போன்ற பயன்பாடுகள் யுனிக்கோட் வருகையால் தமிழ் இணையங்களில் ஏற்பட்டுள்ளது. 

தமிழ் யுனிக்கோட் - சிக்கல்கள் 

     தமிழ் மொழியில் யுனிக்கோடு எழுத்துக்களைப் பயன்படுத்தும் பொழுது சில சிக்கல்கள் ஏற்படுகின்றன. குறிப்பாக, விண்டோஸ் 98 போன்ற பழைய இயங்கு தளங்களில் பயன்படுத்துவதில் சிக்கல்கள் காணப்படுகின்றன. மேலும் சில அச்சு மென்பொருள்களிலும் யுனிக்கோட் பயன்பாடு ஏற்படுத்தப்படாமல் இருக்கிறது.

    இத்தகைய சிக்கல்களைத் தீர்ப்பதற்காக தமிழ் இணையப் பல்கலைக்கழகம், கணினித்தமிழ்ச் சங்கம், இன்ஃபிட் ஆகிய தொழில் நுட்ப உறுப்பினர்களை ஒன்றிணைத்துப் புதிய தமிழ்க் குறியீட்டு முறைக்கான பரிந்துரைகளையும், அதன் முறையில் உருவாக்கப்பட்ட சில எழுத்துருக்களையும் வெளியிட்டன. புதிய யூனிக்கோட் முறையில் சீர்திருத்தம் காண அண்ணா பல்கலைக்கழக முன்னாள் துணைவேந்தர் முனைவர் மு.அனந்த கிருஷ்ணன் தலைமையில் பன்னாட்டு வல்லுநர்களைக் கொண்ட தரக்குழு அமைத்து அதற்கான அரசாணையையும் தமிழக அரசு வெளியிட்டது.

    இக்குழுவின் முயற்சியால் புதிய யுனிக்கோட் எழுத்துருக்கள் உருவாக்கப்பட்டன. ஆனால், யுனிக்கோடி சர்வதேசக் கூட்டமைப்பான கன்சார்டியம் இக்குழுவின் பரிந்துரைகளை ஏற்று குறியீட்டு முறையில் சீர்திருத்தம் கொண்டு வர தயக்கம் காட்டுகிறது. எனினும் இத்தகைய சிக்கல்களைப் பொருட்படுத்தாமல் தமிழ் யுனிக் கோர்ட் பயன்பாடு சிறந்த நிலையில் காணப்படுகின்றது.

@ உதவி -கணினித் தமிழ் 

**** இராஜாலி****


கருத்துகள் இல்லை:

கருத்துரையிடுக

யுனிக்கோட் - பயன்பாடு

அறிமுகம்    ஆங்கில மொழியைத் தவிர பிறமொழிகளிலும் பலரும் பல்வேறு குறியேற்றங்களையும் எழுத்துருக்களையும் பயன்படுத்தி வந்தனர். இந்த முறையில் ஒரே ...