தமிழ்த்தாயையும் பாரதமாதாவையும் பேசவைப்போம்

கீழே இருப்பது உங்களுக்குப் பொருந்துகிறதா என்றுப் பாருங்கள்.

உங்களுக்குத் தமிழைத் தவிர வேறு ஒரு இந்திய மொழியும் தெரியும். புரிந்துக்கொள்வதில் பெரிய சிரமம் எதுவும் இல்லை. ஓரளவுப் பேசவும் செய்வீர்கள். அந்த மொழியில் படங்கள் பார்க்கவும் பாடல் கேட்கவும் செய்வீர்கள். ஆனால் வாசிக்கத் தெரியாது. வாசிக்க முடிந்தால் நன்றாகத் தான் இருக்கும். இணையத்திலேயே அந்த மொழியில் அமைந்த நூற்றுக்கணக்கான வலைப்பக்கங்கள் உள்ளன. அவற்றில் சுவையான, தரமான ஆக்கங்கள் பலவும் இருக்கக்கூடும். ஆனால் அந்த மொழியின் எழுத்துக்களைக் கற்றுக்கொண்டு, கணினித் திரையில் ஒவ்வொரு எழுத்தாகக் கூட்டி ஆமை வேகத்தில் வாசிப்பது நடைமுறைக்கு ஒத்துவருவதாகத் தெரியவில்லை.

கொஞ்சம் பொருந்துகிற மாதிரி தெரிகிறதா? மேலே -அதாவது கீழே- படியுங்கள்.

ஒருங்குறி (Unicode) அறிமுகப்படுத்தப்பட்டப் பிறகு இணையத்தில் பல்லாயிரக்கணக்கான இந்திய மொழிப் பக்கங்கள் தோன்றிவிட்டன. வலைப்பதிவுகள், இணைய இதழ்கள் தவிர இந்திய மொழிகளில் உள்ள சிறப்பான இலக்கிய ஆக்கங்களை இணையத்திலேற்றும் பணியையும் பல ஆர்வலர்கள் செய்து வருகின்றனர். எனக்கு மலையாளம், இந்தி ஆகிய மொழிகளுடன் ஓரளவு அறிமுகம் உண்டு. ஆனால் இந்த மொழிகளை இணையத்தில் வாசிப்பதற்கு பெரும் தடையாக இருப்பது எழுத்துக்கள். எனக்கு மலையாளத்தையும் இந்தியையும் தட்டுத் தடுமாறி வாசிக்கத் தெரியும் என்றாலும் தமிழ்/ஆங்கிலம் வாசிக்கும் வேகத்தில் பத்தில் ஒருப் பங்கு வேகத்தில் கூட என்னால் அவற்றை வாசிக்க முடியாது.

இப்படி மொழி புரியும் ஆனால் எழுத்துத் தெரியாது என்றிருக்கும் ஏராளமானவர்களுக்கு எழுத்துப்பெயர்ப்பு (transliteration) ஒரு தீர்வாக அமையக்கூடும். தமிழ் எழுத்துக்களை ஆங்கில (உரோம) எழுத்துக்களுக்கு மாற்றும் செயலிகள் இணையத்தில் கிடைப்பதுப் போல மற்ற மொழிகளுக்கும் இருக்கலாம். AnAl inthiya mozikalai Angkila ezuththukaLai koNdu ezuthi vAcippathu oru kodumaiyAna anupavam. இதற்கான சில காரணங்கள் கீழே:

(1) இந்திய அரிச்சுவடிகள் (scripts) கிட்டத்தட்ட முழுமையாக ஒலி அடிப்படையில் (phonetic) அமைந்தவை. அதாவது ஒரு எழுத்து எந்த இடத்தில் வந்தாலும் ஒரே போல தான் ஒலிக்கும். ஆனால் ஆங்கில எழுத்துக்களின் உச்சரிப்பு இடத்துக்கு ஏற்றவாறு மாறும். எடுத்துக்காட்டாக i என்ற எழுத்தை bit என்பதில் இ என்றும் bite என்பதில் ஐ என்றும் உச்சரிக்கவேண்டும். C என்ற எழுத்து cat, space ஆகியச் சொற்களில் வெவ்வேறு விதமாக ஒலிக்கும்.

(2) இந்திய அரிச்சுவடிகள் உயிர் + மெய் = உயிர்மெய் என்ற அமைப்புடைய அபிகுடா எழுத்து முறையைச் சேர்ந்தவை. உரோம அரிச்சுவடி அப்படியல்ல.

இந்திய அரிச்சுவடிகளுக்கிடையே மேலேக் குறிப்பிட்ட ஒற்றுமைகளைத் தவிர வேறொரு முக்கியமான ஒற்றுமையும் உண்டு. அவை யாவுமே பிரம்மி அரிச்சுவடியிலிருந்து தோன்றியவை. (இன்று தெற்காசியாவில் பயன்படுத்தப்படும் பெரும்பான்மையான அரிச்சுவடிகளின் மூதாதையான பிராமி அசோகர் காலத்தில் தோன்றியது என்ற எண்ணத்தில் அசோகன் பிராமி என்றே அழைக்கப்பட்டு வந்தாலும் அது அசோகருக்கு முன்னூறு ஆண்டுகளுக்கு முன்பே தமிழகத்திலும் இலங்கையிலும் பயன்படுத்தப்பட்டிருக்கலாம் என்பதற்கானச் சான்றுகள் அண்மையில் கிடைத்திருக்கின்றன.) இந்த ஒற்றுமைகளின் காரணமாக மற்றொரு இந்திய மொழியை தமிழ் அரிச்சுவடியைக் கொண்டு எழுதுவது உரோம எழுத்துக்களைக் கொண்டு எழுதுவதை விட வாசிப்பதற்கு சுலபமாக இருக்கும். பல்வேறு வட இந்திய மொழிகள் இப்படி ஒன்றுக்கு மேற்பட்ட அரிச்சுவடிகளைக் கொண்டு எழுதப்படுகின்றன.

மற்ற இந்திய மொழிகளில் நிரம்பியிருக்கும் ஏராளமான வடமொழிச் சொற்களை எழுதுவதற்கு தமிழ் எழுத்துக்கள் போதுமானதாக இல்லை என்றுச் சிலர் சொல்லக்கூடும். ஆனால் அறுபது ஆண்டுகளுக்கு முன் வரை மணிப்பிரவாள நடை என்றப் பெயரில் ஏராளமான வடமொழிச் சொற்கள் அதே வடிவிலேயே தமிழ் எழுத்துக்களைக் கொண்டு எழுதப்பட்டு வந்ததுக் கவனிக்கத்தக்கது. (எடுத்துக்காட்டாக தற்போது சுதந்திரம், விவகாரம், பிரபலம் என்றுத் தமிழ்படுத்தப்பட்டிருக்கும் சொற்கள் முறையே ஸ்வதந்திரம், வ்யவஹாரம், பிரபல்யம் என்றே எழுதப்பட்டு வந்தன.) எனவே இதை ஒருப் பெரிய குறைபாடாக நான் கருதவில்லை.

மலையாளம், இந்தி போன்ற மொழிகளைத் தமிழ் எழுத்துக்களுக்குப் பெயர்க்கும் செயலி ஏதாவது இருக்கிறதா என்று இணையத்தில் தேடினேன். திரு. அன்புமணி என்பவரால் உருவாக்கப்பட்ட இந்தி எழுத்துக்களைத் தமிழுக்கு மாற்றும் ஒரு செயலியைத் தவிர வேறு எதுவும் கிடைக்கவில்லை. இந்த செயலியும் ஏனோ வேலைச் செய்வதாகத் தெரியவில்லை. (சுட்டித் தருவதற்காக இப்போது தேடிப்பார்த்தபோது அந்தப் பக்கத்தைக் காணவில்லை.) ஒரு வாரம் செலவிட்டால் நாமே ஒருச் செயலியை உருவாக்கிவிடலாம் என்ற நம்பிக்கையில் வேலையைத் தொடங்கினேன். காலை விட்டப் பிறகு தான் ஆழம் தெரிந்தது. கடந்த ஒரு மாதத்திற்கு மேலாக ஒய்வு நேரம் முழுவதையும் அதற்கே ஒப்புக்கொடுக்கும்படி ஆகிவிட்டது. இப்போது ஒருவழியாக வேலை வெற்றிகரமாக முடிந்துவிட்டது. இதன் மூலம் மலையாளம், இந்தி மட்டுமல்ல வேறு எந்த இந்திய மொழியையும் தமிழ் எழுத்துக்களுக்கு மாற்ற முடியும். இந்த செயலியின் செயல்பாட்டுக்கு சில எடுத்துக்காட்டுகளைக் கீழேத் தருகிறேன்.

കാവിരിപ്പട്ടണത്തിലെ ഒരു ധനികവ്യാപാ‍രിയുടെ മകനായ കോവലന്‍ അതിസുന്ദരിയായ കണ്ണകി എന്ന യുവതിയെ വിവാഹം ചെയ്തു. കാവേരിപൂമ്പട്ടണം എന്ന നഗരത്തില്‍ ഇരുവരും സസുഖം ജീവിക്കവേ കോവലന്‍ മാധവി എന്ന നര്‍ത്തകിയെ കണ്ടുമുട്ടുകയും അവരില്‍ പ്രണയാസക്തനാവുകയും ചെയ്തു. കണ്ണകിയെ മറന്ന കോവലന്‍ തന്റെ സ്വത്തുമുഴുവന്‍ മാധവിക്കുവേണ്ടി ചിലവാക്കി. ഒടുവില്‍ പണമെല്ലാം നഷ്ടപ്പെട്ടപ്പോള്‍ കോവലന്‍ തന്റെ തെറ്റുമനസിലാക്കി കണ്ണകിയുടെ അടുത്തേക്ക് തിരിച്ചുപോയി. അവരുടെ ആകെയുള്ള സമ്പാദ്യം കണ്ണകിയുടെ രത്നങ്ങള്‍ നിറച്ച ചിലമ്പുകള്‍ മാത്രമായിരുന്നു. കണ്ണകി സ്വമനസ്സാലെ തന്റെ ചിലമ്പുകള്‍ കോവലനു നല്‍കി. ഈ ചിലമ്പുകള്‍ വിറ്റ് വ്യാപാരം നടത്തുവാന്‍ കോവലനും കണ്ണകിയും മധുരയ്ക്കു പോയി.

மேலே இருப்பது ஒரு மலையாள விக்கிபீடியா கட்டுரையிலிருந்து எடுக்கப்பட்ட சில வரிகள். நான் இதை எழுத்துக் கூட்டிப் படிப்பதானால் சில நிமிடங்களைச் செலவிடவேண்டி வரும். ஆனால் எழுத்துப்பெயர்ப்புச் செயலியைப் பயன்படுத்தி ஒரே நொடியில் கீழே இருப்பது போலத் தமிழுக்கு மாற்றிவிட்டேன். சில விநாடிகளில் படித்தும் விட்டேன். உங்களுக்குப் புரிகிறதா என்றுப் பாருங்கள்.

காவிரிப்பட்டணத்திலெ ஒரு தனிகவ்யாபாரியுடெ மகனாய கோவலன் அதிஸுந்தரியாய கண்ணகி எந்ந யுவதியெ விவாஹம் செய்து. காவேரிபூம்பட்டணம் எந்ந நகரத்தில் இருவரும் ஸஸுகம் ஜீவிக்கவே கோவலன் மாதவி எந்ந நர்த்தகியெ கண்டுமுட்டுகயும் அவரில் ப்ரணயாஸக்தனாவுகயும் செய்து. கண்ணகியெ மறந்ந கோவலன் தன்றெ ஸ்வத்துமுழுவன் மாதவிக்குவேண்டி சிலவாக்கி. ஒடுவில் பணமெல்லாம் நஷ்டப்பெட்டப்போள் கோவலன் தன்றெ தெற்றுமனஸிலாக்கி கண்ணகியுடெ அடுத்தேக்கு திரிச்சுபோயி. அவருடெ ஆகெயுள்ள ஸம்பாத்யம் கண்ணகியுடெ ரத்னங்ஙள் நிறச்ச சிலம்புகள் மாத்ரமாயிருந்நு. கண்ணகி ஸ்வமனஸ்ஸாலெ தன்றெ சிலம்புகள் கோவலனு நல்கி. ஈ சிலம்புகள் விற்று வ்யாபாரம் நடத்துவான் கோவலனும் கண்ணகியும் மதுரய்க்கு போயி.

ஒருகாலத்தில் மிகவும் விருப்பத்திற்குரியதாக இருந்த இந்த இந்திப் பாடலைச் செயலியில் இட்டேன்.

तुझे देखा तो ये जाना सनम
प्यार होता है दीवाना सनम
अब यहाँ से कहाँ जाएं हम
तेरी बाहों में मर जाएं हम

தமிழில் இப்படி வந்தது:

துஜே தேகா தோ யே ஜானா ஸனம்
ப்யார் ஹோதா ஹை தீவானா ஸனம்
அப் யஹான் ஸே கஹான் ஜாயேன் ஹம்
தேரீ பாஹோன் மேன் மர் ஜாயேன் ஹம்


எனக்கு மலையாளம், இந்தி தவிர மற்ற இந்திய மொழி எழுத்துக்கள் பழக்கமில்லையென்றாலும் முடிந்த அளவு தெலுங்கு, கன்னடம், வங்காளம், ஒரியா, குஜராத்தி போன்ற மொழிகளைச் சோதித்துப் பார்த்தேன். கீழே இருப்பது ஒரு வங்காளப் பாடல்.

জনগণমন-অধিনায়ক জয় হে ভারতভাগ্যবিধাতা!
পঞ্জাব সিন্ধু গুজরাট মরাঠা দ্রাবিড় উত্কল বঙ্গ
বিন্ধ্য হিমাচল যমুনা গঙ্গা উচ্ছলজলধিতরঙ্গ
তব শুভ নামে জাগে, তব শুভ আশিস মাগে!


தமிழுக்கு மாற்றிய போது கீழே உள்ளது போல வந்தது. (வங்காள மொழியில் வ என்ற ஒலிக்குப் பதில் ப பயன்படுத்தப்படுகிறது.)

ஜனகணமன-அதினாயக ஜய ஹே பாரதபாக்யபிதாதா!
பஞ்ஜாப ஸிந்து குஜராட மராடா த்ராபிட உத்கல பங்க
பிந்த்ய ஹிமாசல யமுனா கங்கா உச்சலஜலதிதரங்க
தப ஷுப நாமே ஜாகே, தப ஷுப ஆஷிஸ மாகே!


இந்திய மொழிகளுக்கான ஒருங்குறி ஒதுக்கீட்டைப் பற்றி மேலோட்டமாக அறிந்திருப்பவர்கள் (நான் முதலில் நினைத்ததைப் போல) இந்த செயலியை உருவாக்குவது எளிதான வேலை என்று நினைக்கக்கூடும். இதற்குக் காரணம் என்னவென்றால் ஒருங்குறி முறையில் ஒவ்வொரு எழுத்துக்கும் உரிய இடத்தை ஒதுக்குவதில் ஒரு ஒழுங்கு கடைப்பிடிக்கப்படுகிறது. எடுத்துக்காட்டாகத் தமிழுக்கானத் தொகுதியில் க என்ற எழுத்து எந்த நிலையில் இருக்கிறதோ அதே நிலையில் தான் மற்ற மொழிகளிலும் க என்ற எழுத்து இருக்கும். அதனால் ஒரு மொழியில் ஒரு எழுத்துக்குரிய எண்ணுடன் (character code) ஒரு குறிப்பிட்ட எண்ணைக் கூட்டினால் இன்னொரு மொழியில் உள்ள அதே எழுத்துக் கிடைக்கும். ஆனால் இந்த முறையில் இயந்திரத்தனமாக தமிழுக்கு எழுத்துப்பெயர்த்தால் பாதிக்கு மேற்பட்ட இடங்களில் எழுத்துக்களுக்குப் பதில் கட்டங்கள் தான் தெரியும். மற்ற இந்திய மொழிகளில் பயன்படுத்தப்படும் நிறைய எழுத்துக்கள் தமிழ் அரிச்சுவடியில் இல்லாமல் இருப்பதே இதற்கு காரணம். எடுத்துக்காட்டாக தேவநாகரிக்கான ஒருங்குறித் தொகுதியில் உள்ள சுமார் நாற்பது எழுத்துக்களும் குறிகளும் தமிழில் இல்லை. அத்தகைய எழுத்துக்களை அதற்கு மிக நெருக்கமாக ஒலிக்கும் மற்ற தமிழ் எழுத்துக்களுடன் பொருத்தவேண்டும்.

மேலே சொன்னதைச் செய்தப் பிறகு எழுத்துப்பெயர்க்கப்பட்ட தமிழில் கட்டங்கள் மறையுமே தவிர வேறு சில சிக்கல்கள் இருக்கும். தமிழில் உள்ளதை வாசித்துப் பார்த்தால் அது சில இடங்களில் மூல மொழியின் உச்சரிப்பிலிருந்து பெரிதும் வேறுபடுவதைக் காணலாம். பெரும்பாலும் மூல மொழிகளில் உள்ள ஒழுங்கற்ற, வழக்கமான விதிகளுக்குக் கட்டுப்படாத சிறப்பு உச்சரிப்புகளே இதற்குக் காரணம். (தமிழிலேயே இதற்கு ஒரு எடுத்துக்காட்டுச் சொல்வதென்றால் 'றி' என்ற எழுத்து வெறி எனும் சொல்லில் ஒரு விதமாகவும் வெற்றி என்பதில் வேறொரு விதமாகவும் ஒலிப்பதைச் சொல்லலாம்.) எனவே தமிழ் எழுத்துப்பெயர்ப்புச் செம்மையாக அமையவேண்டும் என்றால் மூல மொழிகளின் ஒலியியலை (phonology) முழுமையாக அறிந்திருக்கவேண்டும். இதற்காகக் கல்வித்துறை ஆய்வுக் கட்டுரைகள், விக்கிப்பீடியாக் கட்டுரைகள் என்று நிறையப் படிக்கவேண்டி வந்தது. மலையாளம், இந்தி ஆகிய மொழிகளில் உள்ள ஏராளமானப் வலைப்பக்கங்களைச் சோதித்துப் பார்த்து எழுத்துப்பெயர்ப்பில் உள்ள பிழைகளைக் கண்டறிந்து முடிந்தமட்டும் சரி செய்தேன். இப்படி எழுத்துப்பெயர்ப்பதில் உள்ள சிக்கல்களையும் அவற்றைக் கையாள்வதற்கான வழிமுறைகளையும் பற்றி ஒரு நீளமான ஆய்வுக் கட்டுரையே எழுதலாம் என்றாலும் முக்கியமான சிலவற்றை மட்டும் சுருக்கமாக இங்கேக் குறிப்பிடுகிறேன். இந்திய மொழிகளிலும் அவற்றுக்கான கணினிக் கருவிகளை உருவாக்குவதிலும் ஆர்வம் உள்ளவர்களுக்கு ஒருவேளை சுவாரசியமாக இருக்கக்கூடும்.

(1) இந்திய மொழிகளில் எழுத்துக்களின் உச்சரிப்பு இடத்துக்கு இடம் வேறுபடாது என்று சொல்லியிருந்தேன். ஆனால் விதிவிலக்குகள் உண்டு. இந்தியிலும் வேறு சில மொழிகளிலும் schwa deletion என்று ஒரு முக்கியச் சிக்கல் இருக்கிறது. இந்தி மொழிக்கான உரையிலிருந்து பேச்சுக்கு (text to speech) மாற்றும் செயலிகளை உருவாக்குவதற்கு இது ஒரு முக்கியத் தடையாக இருக்கிறது. பிரச்சனை என்னவென்றால் பல இந்திச் சொற்கள் எழுதப்படும் முறைக்கும் உச்சரிக்கப்படும் முறைக்கும் வேறுபாடுகள் உள்ளன. "அபனா" (अपना) என்று எழுதிவிட்டு "அப்னா" என்று உச்சரிப்பார்கள். "கலம" (कलम) என்று எழுதப்பட்டிருப்பதை "கலம்" என்று உச்சரிக்கவேண்டும். அதாவது சில உயிர்மெய் எழுத்துக்களில் உள்ள 'அ' என்ற உயிரெழுத்தை அகற்றிவிட்டு அதை மெய்யெழுத்தாக்கி உச்சரிக்கவேண்டும். ஆனால் எந்த இடத்தில் உயிரை -அதாவது உயிரெழுத்தை - எடுக்கவேண்டும் எங்கே எடுக்கக்கூடாது என்பதற்குத் தெளிவான விதிகள் கிடையாது. பொதுவாக சொல்லப்படும் சில விதிகளும் சில இடங்களில் பொய்த்துவிடும். எடுத்துக்காட்டாக "அப்னா" என்ற சரியான உச்சரிப்பை வரச் செய்வதற்காக இறுதி எழுத்து நெடிலாக இருந்தால் முந்தைய எழுத்தின் உயிரை அகற்றலாம் என்று ஒரு விதியைக் கொண்டுவந்தால் "சாருலதா" என்றப் பெயர் "சாருல்தா" என்று ஆகிவிடும். இப்படி நிறையச் சிக்கல்கள். இதைப் பற்றிய பத்துக்கும் மேற்பட்ட விரிவான ஆய்வுக் கட்டுரைகளைப் படித்தேன். எந்தத் தீர்வுமே நூறு விழுக்காடு சரியாக இல்லை. நான் பயன்படுத்தியிருக்கும் வழிமுறை தொண்ணூறு விழுக்காட்டுக்கு மேல் சரியாக வருகிறது.

(2) தமிழைத் தவிர மற்ற அனைத்து இந்திய மொழிகளிலும் அனுஸ்வரம் என்று ஒரு எழுத்து/குறி இருக்கிறது. இதற்கு நிலையான ஒரு ஒலிக் கிடையாது. எந்த இடத்தில் வருகிறது என்பதைப் பொறுத்து உச்சரிப்பு மாறுபடும். 'க' என்ற எழுத்துக்கு முன்னால் வந்தால் 'ங்' என்றும் 'ச' எனும் எழுத்துக்கு முன்னால் வந்தால் 'ஞ்' என்றும் ஒலிக்கும். இது தமிழர்களுக்குப் பழக்கமானது தான். ஆனால் மற்ற இடங்களில் வந்தால் எப்படி எழுத்துப்பெயர்ப்பது என்பதில் நிறையக் குழப்பங்கள் உள்ளன. சொல்லின் இறுதியில் அனுஸ்வரம் வந்தால் மலையாளத்தில் ம் என்று ஒலிக்கும். ஸ்வாகதம், வசந்தம் எனும் சொற்களில் இருப்பதுப் போல. ஆனால் இந்தியில் அப்படியல்ல. சொல்லின் இறுதியில் அனுஸ்வரம் வந்தால் முந்தைய எழுத்தை nasalization செய்யவேண்டும். அதாவது மூக்கு வழியாக சிறிதுக் காற்றை வேகமாக வெளியேற்றினால் என்ன ஒலி வருமோ அந்த ஒலியை எழுப்பவேண்டும். அத்தகைய ஒலிகளுக்கான எழுத்துக்கள் ஆங்கிலம் போன்ற மொழிகளில் இல்லையென்பதால் 'ன்' என்ற ஒலியைக் குறிக்கும் எழுத்து அனுஸ்வரத்தைக் குறிக்கப் பயன்படுத்தப்படுகிறது. நானும் அதே முறையைப் பின்பற்றியிருக்கிறேன். "எங்கே" எனும் பொருளுடைய இந்திச் சொல் தமிழில் "கஹான்" என்று எழுத்துப்பெயர்க்கப்படும்.

(3) மலையாள எழுத்துக்களைப் பொறுத்தவரை பழைய லிபி, புது லிபி என்று ஒருக் குழப்பமும், வாதப் பிரதிவாதங்களும் கடந்தக் கால் நூற்றாண்டுக் காலமாக இருந்து வருகின்றன. சீன மொழியுடன் போட்டியிடும் அளவுக்கு அதிகமான எழுத்து வடிவங்களைக் கொண்டுள்ள மலையாள மொழியை தட்டச்சு இயந்திரத்தில் வசப்படுத்தவேண்டிக் கொண்டுவரப்பட்டச் சில சீர்திருத்தங்களை மரபுவாதிகள் ஏற்க மறுத்ததால் ஒரே சொல் இருவேறு விதமாக எழுதப்படும் நிலை ஏற்பட்டது. கணினியில் புது லிபியே பயன்படுத்தப்பட்டாலும் சில சொற்களை எப்படி எழுதுவது என்பதில் இணையத்தில் எழுதுவோரிடம் ஒற்றுமை இல்லை. குறிப்பாக குற்றியலுகரத்தில் முடியும் ஏராளமானச் சொற்களை எப்படி எழுதுவது என்பதில். எப்படி எழுதினாலும் எழுத்துப்பெயர்ப்பு சரியாக வரவேண்டும் என்பதற்காக நிரலில் சில மாற்றங்களைச் செய்தேன். ஆனால் இந்தக் மாற்றங்களினால் பிறமொழிச் சொற்களை எழுத்துப்பெயர்க்கும் போது சில பக்க விளைவுகள் ஏற்படுவதை தவிர்க்கமுடியவில்லை. (எடுத்துக்காட்டாக ஸ்கிரிப்ட் என்று மலையாளத்தில் எழுதப்பட்டிருந்தால் அது தமிழில் ஸ்கிரிப்டு என்று எழுத்துப்பெயர்க்கப்படும்.)

(4) 'ன' என்றத் தமிழ் எழுத்து மலையாளத்தில் இல்லை. 'ந' மட்டும் தான் இருக்கிறது. அதை அப்படியே எழுத்துப்பெயர்த்தால் தமிழில் வாசிப்பதற்கு வசதியாக இருக்காது. எடுத்துக்காட்டாக "அவன்" என்பது "அவந்" என்று இருக்கும். அதற்காக சொல்லின் முதலெழுத்தைத் தவிர மற்ற அனைத்து இடங்களிலும் 'ந' என்பதை 'ன' என்று மாற்றினால் "ஒந்நு", "வந்நு" போன்ற மலையாளச் சொற்களின் உச்சரிப்புக் கெட்டுவிடும். மேலும் "பன்தம்", "சொன்தம்" என்று வாசிப்பது தமிழர்களுக்குக் கொடுமையாக இருக்கும். எனவே இடத்துக்குத் தகுந்ததுபோல 'ந' அல்லது 'ன' வருமாறுச் செய்திருக்கிறேன்.

இந்த எழுத்துப்பெயர்ப்புச் செயலியை பயன்படுத்த / சோதித்துப் பார்க்க இங்கேச் சுட்டுங்கள்.

47 மறுமொழிகள்:

இஷ்டமொழிகளுள் இந்திய மொழியில் மலையாளத்துக்குத் தனியிடம் இருக்கிறது. உங்க புண்ணியத்தில மலையாளம் வாசிக்கலாம் போலிருக்கிறது. இன்னமும் உங்களின் சுட்டியைப் பார்க்கவில்லை. உடனடியாக நன்றி சொல்வதற்காக இந்தப் பின்னூட்டம்.

மிக்க நன்றி ஜெகத்!

-மதி

ஜெகத், கொஞ்ச நாள் முன்னர் தமிழ் தொடர்பான ஒரு முயற்சியில் இருக்கிறேன் என்றீர்கள். இது தானா எது?

பின்னூட்டுப் பக்கத்திற்கான இணைப்பை என்ன நினைக்கிறீர்கள் என்று கேட்டு இருக்கிறீர்கள்.

நான் என்ன நினைக்கிறேன்னா -

சரி, மிரட்டலா இருக்கு உங்க கருவி.

பாராட்டு வார்த்தைகளே இல்லை. அருமை அருமை அருமை. இதை blogspotல இல்லாம தனி வலைத்தளத்துல போட்டு பெரிய அளவில விளம்பரப்படுத்துங்க. இந்தியாவெங்கும் சிதறிக் கிடக்கும் தமிழருக்கு பெரிய உதவியா இருக்கும் இந்த கருவி. பிற மொழிகளை கற்றுக் கொள்ள நேரம் வாய்ப்பு இல்லாதோருக்கும், அவசரத்துக்கும் மாமருந்து.

வாழ்த்துக்கள். கருவி போக, இந்திய மொழிகள் ஒலிப்பு குறித்த உங்க குறிப்புகளும் மிகவும் பயனுள்ளவை.

அற்புதமான காரியம் செய்தீர்கள் ஜெகத். பேசத் தெரிந்து, முழுதாக எழுதப்படிக்கத் தெரியாத ;-) தமிழல்லாத இரண்டு மொழிகளின் சில வலைப்பக்கங்களைச் சோதித்துப் பார்த்தேன் - துல்லியமாக தமிழில் வருகிறது - தெலுங்கில் YSRஐ ஒய்யெஸ் என்று எழுதினால் வெ?யெஸ என்று வருகிறதென்று நினைக்கிறேன் - கன்னடத்திலும் இதேபோல இருக்கிறதா என்று தெரியவில்லை. இதுபோல ஒன்றிரண்டு விஷயங்கள் - இல்லை நான் ஏதும் தவறாகப் பார்க்கிறேனா தெரியவில்லை - சந்தர்ப்பம் வாய்த்தால் பார்க்கவும். முன்பு தமிழ்மணத்தில் காசி ஒரு மொழிமாற்றியை உருவாக்கியிருந்தார் என்று நினைக்கிறேன் - ஆனால் அது ரோமன் எழுத்துருவிற்குத் தமிழை மாற்றியது - அதைவிட இது உபயோகமான விஷயம் என்று தோன்றுகிறது.

பயனுள்ள பதிவு ஜெகத்.

நல்ல முயற்சி. இந்திய மொழிகளுக்கு உள்ள தொடர்பை அறியவும் உங்கள் உளைப்பு உதவும். பாராட்டுக்கள்.

இதே சிந்தனையில் பிறரும் சில முயற்சிகளை மேற்கொண்டிருக்கின்றார்கள்.

தமிழ் எழுத்தின் தேவையை குறைத்து ஒரு பொது எழுத்து சீர்தரத்துக்கும் வழிசெய்யலாம்.

wow, jegath great work!....

அருமை திரு ஜெகன்.
இப்போதெல்லாம் தமிழ்மணத்தை விட்டு வெளியில் போவதற்கே காலம் கிடைப்பதில்லை,இருந்தாலும் முயற்சிக்கலாம்.
தகுந்த பிற மொழி பக்கங்கள்,ஒரளவு படிக்க தெரிந்தவர்களுக்கு உதவியாக இருக்கும்.

ஜெகத்,

நல்ல முயற்சி.

உமர் பன்மொழி மாற்றியில் இந்த வசதி இருக்கிறது. நீங்கள் இக்கட்டுரையில் சொன்னது போல இந்தியிலிருந்து/இந்திக்கு மாற்றும் போது சில மொழி நுட்பங்கள் தேவைப்படுகிறது. சிலவற்றை ஏற்கனவே நிரலாக்கியிருக்கிறேன். இன்னும் சில வழுப்பட்டியலில் இருக்கிறது.

இது தொடர்பான இழையை அன்புடன் குழுமத்தில் காணலாம்.

பி.கு:

1)நாம் இருவரும் ஒன்றுபோல சிந்திக்கிறோம்... இனிவரும் திட்டங்களில் இணைந்து செயல்படலாமே... :)

2) தமிழா!வின் கட்டற்ற தமிழ்க் கணிமை குழுமத்தின் பயனர்களுள் ஒருவன் என்ற வகையில் அதன் திட்டங்களுக்கு உங்களின் பங்களிப்பை வேண்டுகிறேன்.

ஊட்டம் / ஊக்கம் அளித்த நண்பர்கள் அனைவருக்கும் நன்றி.

கோபி,

நான் இன்று இந்த மாதிரி வேலைகள் செய்துக்கொண்டிருப்பதற்கு முக்கியக் காரணமே நீங்கள் தான் :-) ப்ளாகர் பின்னூட்டப் பிரச்சனைக்கான உங்கள் நிரலை ஆராய்ந்ததில் தான் இந்த ஆர்வம் தொற்றிக்கொண்டது.

இந்த வேலையில் இறங்கும் முன்னர் சக்கரத்தை மீண்டும் கண்டுபிடிக்க வேண்டாம் என்ற எண்ணத்தில் இணையத்தில் தேடினேன். உங்கள் பக்கத்தையும் பார்த்தேன். பக்கத்தின் மேற்பகுதியில் "Type in English and get it converted to selected language" என்று இருந்ததை மட்டும் பார்த்துவிட்டு வழக்கமான Roman-to-Indic transliterator என்று நினைத்துவிட்டேன். பக்கவாட்டில் "Convert all existing text to selected language" என்று இருந்ததை இப்போது தான் பார்த்தேன்.

நீங்கள் அளித்த அன்புடன் குழுமம் சுட்டியில் சேதுக்கரசி, முனைவர் நா. கணேசன் ஆகியோர் முன்வைத்த இந்தி மொழிக்கான விரிவான பரிந்துரைகளில் பெரும்பாலானவற்றை (அகரமெய் அகற்றுதல், அனுஸ்வரம்..) செயல்படுத்தி இருக்கிறேன் என்பதைப் பார்க்கும்போது நான் செலவிட்ட நேரம் முழுக்க வீண் அல்ல என்றேத் தோன்றுகிறது. அதேபோல மலையாளத்துக்கு மட்டுமே உரிய சில சிக்கல்களையும் சரி செய்திருக்கிறேன்.

தமிழா!வின் திட்டங்களில் பங்கேற்க அழைத்தமைக்கு நன்றி. தமிழா!வின் ஈ-கலப்பை செயலியைப் பயன்படுத்துபவன் என்ற முறையில் தமிழ்க் கணிமை சார்ந்த முயற்சிகளுக்கு தொண்டாற்ற முடிந்தால் எனக்கு மகிழ்ச்சியே. தமிழ்க் கணிமை குழுமத்தைக் குறித்து மேலும் தெரிந்துக்கொண்டு நான் ஏதாவது செய்ய இயலுமா என்றுப் பார்க்கிறேன். நான் தொழில்முறை மென்பொருளாளன் இல்லை என்பதை மீண்டும் ஒருமுறை சொல்லிவிடுகிறேன் :-)

மதி,

பாரதிக் காலத்து மணிப்பிரவாளத் தமிழையும் சுந்தரி-நீயும்-சுந்தரன்-ஞானும் பாட்டையும் புரிந்துக்கொள்ள முடிகிற ஒருத் தமிழர் கொஞ்சம் முயற்சி செய்தால் மலையாளத்தைப் புரிந்துக்கொள்ளலாம் :-) மலையாளம் வாசிக்கப் பெரும் தடையாக இருப்பது எழுத்துக்கள் மட்டுமே. மற்றபடி எண்கள், உடல் உறுப்புக்கள், நிறங்கள் போன்ற அடிப்படைச் சொற்கள் அனைத்தும் தமிழ்ச் சொற்களே. வேற்றுமை உருபுகளையும் மற்ற இலக்கண விதிகளையும் அரை மணி நேரம் செலவிட்டால் தமிழர்களால் புரிந்துக்கொள்ள முடியும். மீனாட்சி அம்மாவின் பிரபலமான "முப்பது நாளில் மலையாளப் பாஷை" புத்தகம் பயனுள்ளது. தமிழ் எழுத்துக்கள் மூலம் மலையாளம் படிக்க விரும்பும் தமிழர்களுக்கு உதவக்கூடிய சிலக் குறிப்புகளை கூடிய விரைவில் என் பதிவில் இடுகிறேன்.

அடிப்படைச் சொற்கள் யாவும் தமிழே என்பதால் இலகுவான நடையில் எழுதப்பட்ட பெரும்பாலானான ஆக்கங்களையும் உரையாடல்களையும் எளிதில் புரிந்துக்கொள்ளலாம். ஆனால் கலைச்சொற்கள் பெரும்பாலும் சமஸ்கிருதத்திலேயே இருப்பதால் அறிவியல், தத்துவம் போன்றவற்றைக் குறித்த ஆழமானக் கட்டுரைகளை வாசிக்க அகராதியின் துணைத் தேவைப்படும். தொடக்கத்தில் கொஞ்சம் பொறுமையும் நேரமும் தேவை. ஆனால் தகழியும், பஷீரும், எம்.டியும் எழுதிய ஒரு மொழியைப் பழக அந்த விலையைக் கொடுக்கலாம் என்றே எனக்குத் தோன்றுகிறது.

ரவிசங்கர்,

ஆம், இதைத்தான் செய்துக்கொண்டிருந்தேன். சில நாட்கள் ப்ளாக்ஸ்பாட் தரும் இலவச மனையில் குடிசைப் போட்டுவிட்டு அதிகமானவர்கள் வந்து போவதாக இருந்தால் சொந்த வீடுக் கட்டிக்கொள்ளலாம் என்று எண்ணம் :-)

சன்னாசி,

இந்தி, மலையாளம் தவிர மற்ற மொழிகளில் நீங்கள் குறிப்பிட்டதைப் போன்ற சில வழுக்கள் இருக்கும் என்றே எதிர்பார்க்கிறேன். அந்த மொழி எழுத்துக்களும் ஒலியியல் விதிகளும் எனக்குப் பழக்கமில்லாததால் முழுமையாகச் சோதித்துப் பார்க்க முடியவில்லை. இந்த சோதனை ஓட்டத்தின் போது தெரியவரும் எல்லாக் குறைகளையும் குறித்து வைத்துக்கொண்டு பின்னர் முடிந்தவரை சரி செய்துவிடலாம் என்று இருக்கிறேன்.

நல்ல முயற்சி ஜெகத். அருமையான வேலை. நன்றிகள்.

பாராட்டுக்கள் ஜெகத். இந்த மொழிமாற்றி (சரியான பெயர்தானா?) மிகவும் பயனுள்ளதாகும். இன்னும் சோதித்துப் பார்க்கவில்லை. ஆனாலும் இதன் பின்னால் இருக்கக்கூடிய உழைப்பைப் புரிந்துகொள்ள முடிகிறது. வணக்கங்கள்.

முனைவர் நாக. கணேசன் யுனிகோடின் சாத்தியங்களாக இதையும் குறிப்பிட்டு இந்த வகைக் கருவி செய்வதன் முக்கியத்துவத்தைப் பலமுறை சொல்லியிருக்கிறார். அதன் முதல் படியாகவே தமிழிலிருந்து ரோமனுக்கு ஒரு கருவி செய்தோம். பிறகு என்னால் அதில் ஈடுபட நேரம் வாய்க்கவில்லை. உங்கள் விளக்கத்தைப் பார்க்கும்போது என்னால் இந்த அளவு ஈடுபட்டிருக்கமுடியாது என்பதைப் புரிந்துகொள்கிறேன்.

கோபியும் பல வழிகளில் கணிமை முயற்சிகளில் முன்னெடுத்துச் செல்வதைப் பார்க்கிறேன். அவர் சொல்வதுபோல இணைந்து செயல்பட்டு மேலும் பல கருவிகளை அளீப்பீர்கள் என்று நம்புகிறேன்.

தங்கமணி, காசி: வருகைக்கும் கருத்துக்களுக்கும் நன்றி.

தமிழிலிருந்து உரோமன் எழுத்துக்களுக்கு மாற்றுவதும் முக்கியமான ஒன்று என்று நினைக்கிறேன். தமிழ் வாசிக்கத் தெரியாதத் தமிழர்கள் கணிசமான அளவு இருக்கிறார்கள். என்னுடன் பணிபுரியும் தமிழர்களில் கால்வாசி பேருக்கு தமிழ் வாசிக்கத் தெரியாது. சிலர் சிறுவயதை பல்வேறு வட இந்திய ஊர்களில் கழித்தவர்கள். மற்றவர்கள் தமிழகத்தில் இருந்தும் இந்தி அல்லது பிரஞ்ச் படித்தவர்கள்.

நான் குறிப்பிட்டிருந்த இந்தியிலிருந்துத் தமிழுக்கு மாற்றும் செயலி கூட முனைவர் நாக. கணேசன் அவர்களின் பரிந்துரையின் பேரிலேயே உருவாக்கப்பட்டதாக அந்தப் பக்கத்தில் தெரிவிக்கப்பட்டிருந்தது. யூனிகோட் வந்தப் புதிதில் தமிழுக்கு அநீதி இழைக்கப்பட்டு விட்டதாக ஒருப் பேச்சு இருந்தது. (ஒரு எழுத்துக்கு ஒரு இடம் என்று 247 இடங்கள் ஒதுக்கவேண்டும் என்றுக் கோரிக்கை வைக்கப்பட்டதாக நினைவு.) இப்போது பார்க்கும்போது மற்ற இந்திய மொழிகளுக்குக் கடைபிடிக்கப்பட்ட அதே ஒழுங்கின் படித் தமிழுக்கும் இடங்கள் ஒதுக்கியது சரியான முடிவே என்றுத் தோன்றுகிறது.

wow !! super!!! great work.

அன்பு ஜெகத் அவர்களே,
தமிழ்ப்பணியும் தமிழ்மக்களுக்கானபணியும் தொடரட்டும். மேலும் மேலும் தங்களுக்கு வெற்றியும் நலமும் நிறைக.
அன்புடன்
ராதாகிருஷ்ணன்

Wow!!!Great stuff,Jagath..Thanks for this tool.

I would like to link this page in some other places so that many people will get to know this..is that okay with you? :)

//நீங்கள் அளித்த அன்புடன் குழுமம் சுட்டியில் சேதுக்கரசி, முனைவர் நா. கணேசன் ஆகியோர் முன்வைத்த இந்தி மொழிக்கான விரிவான பரிந்துரைகளில் பெரும்பாலானவற்றை (அகரமெய் அகற்றுதல், அனுஸ்வரம்..) செயல்படுத்தி இருக்கிறேன் என்பதைப் பார்க்கும்போது நான் செலவிட்ட நேரம் முழுக்க வீண் அல்ல என்றேத் தோன்றுகிறது. அதேபோல மலையாளத்துக்கு மட்டுமே உரிய சில சிக்கல்களையும் சரி செய்திருக்கிறேன்.
//

உண்மை, உங்களின் சிரத்தை வியக்க வைக்கிறது.

//நான் தொழில்முறை மென்பொருளாளன் இல்லை என்பதை மீண்டும் ஒருமுறை சொல்லிவிடுகிறேன் :-)//

இன்னும் வியப்பாய் இருக்கிறது. :-) (மென்பொருள்துறையில் இருக்கும் பலருக்கே JavaScript ஒரு கசக்கும் மொழி)

கடுமையான உழைப்பு இருந்தால் எல்லா தடைகளையுமே உடைக்கலாம் என செயலால் சொல்கிறீர்கள் :-)

கண்டிப்பாக நீங்கள் கட்டற்ற தமிழ்க் கணிமைத் திட்டங்களில் பங்கேற்க வேண்டும் என மறுபடியும் அழைக்கிறேன்.

Gopalan, you need not even ask. In fact, I should thank you for helping to popularize this page.

ராதாகிருஷ்ணன், உங்கள் வாழ்த்துக்களுக்கு மிக்க நன்றி.

உங்களை போல தமிழ் காதலர்களால்தான் தமிழ் இன்னும் வாழ்கிறது

நன்றி

இது போல மொழிபெயர்ப்பு கருவிகளையும் யாராவது உருவாக்கினால் நன்றாக இருக்கும்.

நல்லதொரு விடயம் ஜெகத். மிக்க நன்றி.

ஜெகத். ரெம்ப அருமையான தகவல், முயற்சி.

இதுபோன்ற கருவிகளை தொகுக்க ஏதேனும் முயற்சி மேற்கொள்ளவேண்டும்.

பாப்போம் எப்படி செய்யலாம் என்று.
தொடர்ந்து கலக்குங்க...

:)

//இதுபோன்ற கருவிகளை தொகுக்க ஏதேனும் முயற்சி மேற்கொள்ளவேண்டும்.//

பதிவர் யக்ஞாவின் முயற்சியில் தமிழ்மணத்தில் தமிழ்மென்பொருள் ஆர்வலர் மையம் என்று ஒரு விக்கித் தொகுப்பு ஆரம்பிக்கப் பட்டது. அதில் இம்மாதிரி முயற்சிகள் அனைத்தும் தொகுத்து வந்தோம். இப்போது அந்த விக்கித் தொடுப்பை தமிழ்மணத்தில் காணவில்லை.

எல்லா மொழிகளிலிருந்தும் கட்டுரைகளை படிக்கவும். பிற மொழிகளுடன் நம்மை அறிமுகப்படுத்திக் கொள்ளவும் உதவும் ஒரு அற்புதமான எத்தணிப்பு இது. வாழ்த்துக்கள். வேறு என்ன சொல்ல....... இது போன்ற தன்முனைப்பான முயற்சிகளை எப்படி பாராட்டுவது என்று தெரியவில்லை, வார்த்தைகள் தட்டுப்பாடு என்று சொல்லலாம்.

அசுரன்

அருமையாக இயங்குகிறது. மலையாளம், இந்தி வாசிக்க எனக்கு உதவும்.

//blogspotல இல்லாம தனி வலைத்தளத்துல போட்டு//

அப்படி போட்டாலும் இது இருக்கட்டும். காரணம் பேண்ட் விட்த், உரிமம், தள பராமரிப்பு போன்ற பிரச்சினைகள் இல்லாமல் நிலையாக இருப்பதால் பிளாக்ஸ்பாட்டில் இருப்பதும் அவசியமானதே.

ஜெகத் - பல்கலைக்கழகங்கள், நிறுவனங்கள் கூட செய்யாத ஆனால் செய்திருக்க வேண்டிய, செய்திருக்க சவாலாக இருக்கக் கூடிய வேலைகளை தனியாளாக செய்திருக்கிறீர்கள். இன்னொரு முறை பாராட்டுக்கள்.

ஆனால், இது போன்ற கருவிகள் உருவாக்குவதற்கான எளிமையை வைத்து தற்போதைய தமிழ் ஒருங்குறி முறைமை சரி என்று சொல்ல முடியாது. இம்முறையின் முக்கியமான குறைகள் பலதும் அலசப்பட்டு விட்டது. நீங்கள் அறிந்திருப்பீர்கள். ஆனால், இந்தக் குறிப்புகள் இங்கு தேவை இல்லாததால் விட்டு விடுவோம்.

இனியன் என்று பெயர் வைத்ததற்கு சிறப்புக் காரணம் இருக்கா? நல்ல தமிழ்ப் பெயர்.

உமாசங்கர் - மொழிபெயர்ப்புக் கருவி என்று போகிற போக்கில் ஒரு வரியில் சொல்லிட்டீங்க - அது பெரும் சவாலான பணி. பலரும் பல ஆண்டுகள் கூட உழைக்க வேண்டி இருக்கக்கூடியதாய் இருக்கும் திட்டம். ஒன்றுபட்டால் முயன்று பார்க்கலாம்.

கருத்துத் தெரிவித்த நண்பர்கள் அனைவருக்கும் நன்றி. தொடர்ந்து ஏதாவதுப் பயனுள்ளதாகச் செய்யவேண்டும் என்ற எண்ணத்தை உங்கள் ஆதரவு எனக்கு ஏற்படுத்துகிறது.

ரவிசங்கர்,

இதைவிட மிகவும் முக்கியமான முரசு அஞ்சல், ஈ-கலப்பை போன்றக் கருவிகள் எல்லாம் தனியாளாகச் செய்யப்பட்டவைத் தானே? இதுபோன்ற ஒரு எழுத்துப்பெயர்ப்புக் கருவியைக் கூட எனக்கு முன்பே கோபி செய்திருக்கிறார்.

இனியன் எனக்கு மிகவும் பிடித்த தமிழ்ப் பெயர். என் மகனுக்கும் அதைத் தான் வைத்திருக்கிறேன்.

எ-கலப்பை, கோபியின் எழுத்துப் பெயர்ப்புக் கருவிகளும் பாராட்டுக்குரியவை. ஆனால், உங்கள் விவரிப்பில் இருந்து பார்த்தால் தனியாளுக்கு அதிக அளவிலேயே உழைப்பைத் தந்திருக்கிறீர்கள். மென்பொருள் உருவாக்கம் தவிர, மொழியியல் வகையிலும் அதிக கவனம் தேவைப்படும் வேலை இல்லை. இதைச் செய்வதற்கு எல்லாருக்கும் ஆர்வம், திறம், உழைப்பு இருக்கும் என்று சொல்ல முடியாது.

இனி என்று சொல்லும்போதே இனிக்கிற பெயர். யாழினி, தமிழினி, இனியன் என்று அருமையான பெயர்கள்.

நல்லதொரு விடயம் ஜெகத். மிக்க நன்றி

ஜெகத்,

மிக அற்புதமான கருவி. உங்கள் முயற்சியையும், உழைப்பையும் எவ்வளவு பாராட்டினாலும் தகும்.

தமிழ் பேசத் தெரிந்து எழுதத் தெரியாமல் இருக்கும் பிற மாநிலங்களில் வாழும் தமிழ் நண்பர்களுக்கும், உறவினர்களுக்கும் அம்மானில மொழி எழுத்துக்களின் மூலம் தமிழ் படைப்புக்களைப் படிக்க இது போன்ற முயற்சி கை கொடுக்கும். அதுவே தமிழ் மொழியறிவை வளர்த்துக் கொள்ளவும், எழுத்துக்களைக் கற்கவும் உந்துதலாகவும் இருக்கும்

நன்றி - சொ. சங்கரபாண்டி

(பின் குறிப்பு: உங்களுடைய முந்தைய மெக்காலே இடுகையை ஒழித்துக் கட்டியது என்னுடைய பிளாக்கர்-ஐடி மூலம் இட்ட கடைசிப் பின்னூட்டம் தான். ரவிசங்கருடன் சேர்ந்து நான் செய்த ஒரு சோதனை மூலம் இது உறுதியாகியது. என்னுடைய பிளாக்கர்-ஐடியைச் சரி செய்து விட்டேன் என்றாலும் சற்று பயமாகத் தான் உள்ளது. அதனால் இங்கு அனானியாகப் பின்னூட்டமிட்டுள்ளேன். முடிந்தால் அந்த மெக்காலே பதிவை பின்னூட்டங்களுடன் மீள்பதிவு செய்யவும். மேலும் பலர் படிக்க வேண்டிய பதிவு.)

அருமையான முயற்சி ..
நன்றிகளும் , பாராட்டுக்களும் தெரிவித்துக் கொள்கிறேன்.

சங்கரபாண்டி கருத்தைப் படிக்கையில் உங்கள் கருவியை தலைகீழாகப் புரிந்து கொண்டாரோ என்று தோன்றுகிறது. பிற மொழி எழுத்துக்களை தமிழ் மூலம் படிக்கத்தானே இந்தக் கருவி? ஆனால், தமிழை பிற மொழி மூலம் படிக்க இந்தக் கருவி என்கிறார்? ஆனால், இதுவும் நல்ல யோசனை தான். இந்தக் கருவியையே தலைகீழாக மாற்றி தமிழ் எழுத்துக்களை பிற மாநில மொழிகளில் படிக்குமாறு ஒரு கருவி செய்ய முடியுமா? அவர் சொல்வது போல் பிற மாநிலங்களில் தலைமுறைகளாக வாழும் எண்ணற்ற தமிழ் மக்களுக்கு உதவும்.

அப்புறம், இந்தக் கருவியில் ஒலிபெயர்ப்புக் குறி இடும் வசதியை இப்பொழுது தான் கவனித்தேன். இது குறித்து திரு. செல்வகுமார் நீண்ட நாட்களாக எழுதி வருகிறார்.

பார்க்க - http://tamilveli.blogspot.com/2007/03/blog-post_13.html

அதில் அவர் இந்தக் குறிகளை எழுத்துக்கு முன் தருகிறார். நீங்கள் பின் தருகிறீர். செல்வகுமார் அப்படி செய்வதற்கு காரணம் ஏதும் இருந்தால் தெரிந்து கொள்ளுங்கள். பெரும்பாலும் இது போன்ற குறிகள் பயன்படுத்தும் மொழிகள் அவற்றை எழுத்துக்களுக்கு முன் இடலாம் என்பது என் கணிப்பு. கேட்டு உறுதிப்படுத்திக்கொண்டு தேவைப்பட்டால் நிரலில் மாற்றம் கொண்டு வாருங்களேன். இது போன்ற குறியிடல்கள் உலகளாவிய அளவில் சீர்தரமாக இருந்தால் நல்லது தானே?

செல்வநாயகி, சங்கரபாண்டி, ஜீவன்: உங்கள் கருத்துக்களுக்கு நன்றி.

மெக்காலே இடுகையை விரைவில் மீள்பதிவு செய்கிறேன்.

ரவிசங்கர்: திரு. செல்வகுமார் அவர்களின் பரிந்துரையைக் குறித்து அறிந்திருக்கிறேன். ஜ, ஹ, ஷ, ஸ போன்ற வழக்கிலிருக்கும் கிராந்த எழுத்துக்களுக்குத் தமிழ் ஒருங்குறித் தொகுதியில் இடங்கள் ஒதுக்கப்பட்டிருக்கும் நிலையில் அவற்றைத் தவிர்த்துவிட்டு சிறப்புக்குறிகளைப் பயன்படுத்தும் யோசனைப் பரவலாக ஏற்றுக்கொள்ளப்படுமா என்பது சந்தேகமே. ஆனால் ga, da, dha, ba ஆகிய ஒலிகளுக்கு ஒலிபெயர்ப்புக் குறித் தேவை என்பதில் மாற்றுக்கருத்து இல்லை. இந்தக் குறியை எழுத்துக்கு முன்னால் இடுவதா அல்லதுப் பின்னால இடுவதா என்பது முடிவு செய்யப்படவேண்டும். பிற இந்தியமொழிகளைத் தமிழ் எழுத்துக்களைக் கொண்டு (மொழிப் பயிற்றுவிக்கும் நூல்கள் போன்றவற்றில்) எழுதும்போது க, ச, ட, த, ப ஆகிய எழுத்துக்களுக்கு பின்னால் 2,3 அல்லது 4 என்று ஒரு எண்ணை superscript ஆகப் பயன்படுத்துவது வழக்கம். நான் எண்களுக்குப் பதிலாக ' என்றக் குறியைப் பயன்படுத்துகிறேன். இதை ஒரு superscript -ஆகப் பார்ப்பதானால் எழுத்துக்கு பின்னால் இடுவதே மரபு. குறியை எழுத்துக்கு முன்னால் இடுவதுக் குறித்துக் கருத்தொற்றுமை (குறைந்தபட்சம் விக்கிப்பீடியா போன்றத் திட்டங்களில்) ஏற்படுமானால் மாற்றிக்கொள்வதில் எந்தத் தயக்கமும் இல்லை.

தேவநாகரியில் மெய்யெழுத்துக்களுக்குக் கீழே ஒருப் புள்ளியை இடுவதன் மூலம் ஒலிப்பை வேறுபடுத்திக் காட்டுகிறார்கள். ன, ற, ழ போன்ற திராவிட மொழி ஒலிகளைக் குறிக்க இந்த முறையைக் கையாள்வது மட்டுமல்லாமல் அவற்றுக்கு ஒருங்குறித் தொகுதியில் தனி இடமும் ஒதுக்கியிருக்கிறார்கள். தமிழுக்கானத் தொகுதியில் பாதிக்கு மேற்பட்ட இடங்கள் காலியாகத் தான் இருக்கின்றன. தமிழிலும் இப்படி ஒரு ஏற்பாடு செய்யப்பட்டிருந்தால் தற்போது இணையத்தில் பரவலான அங்கீகாரத்தைப் பெற்றிருக்கக்கூடும்.

//சங்கரபாண்டி கருத்தைப் படிக்கையில் உங்கள் கருவியை தலைகீழாகப் புரிந்து கொண்டாரோ என்று தோன்றுகிறது. //

ரவி,

இல்லை. நான் ஜெகத் கொடுத்த இனியன் மொழி மாற்றியை பயன் படுத்திப் பார்த்த பின்பு அடுத்து என்ன செய்யலாம் என்று கருதியே எழுதினேன். எனவே தான் "இது போன்ற முயற்சி கை கொடுக்கும்" என்று எழுதினேன்.

கடந்த நான்கு வருடங்களாக எங்கள் பகுதியில் வார இறுதியில் ஒரு தமிழ்ப் பள்ளியை நடத்தி வருகிறோம். ஒரு மாத கோடைக்காலத் தமிழ் மொழிப் பயிற்சி முகாமையும் நடத்தினோம். அது போல நான் டெல்லியிலும், மும்பையிலும் நண்பர்கள், உறவினர்கள் குழந்தைகளையும் பார்த்திருக்கிறேன். அவர்களில் சிலர் சரளமாகத் தமிழ் பேச, புரிந்து கொள்பவர்களாக இருப்பர். ஆனால் எழுதப் படிக்கத் தெரிந்திருக்காது. அவர்கள் தமிழ் மொழி படைப்புக்களை படிக்கும் ஆர்வத்துக்கு ஜெகத்தின் இனியன் போன்ற ஒரு (reverse) கருவி இருந்தால் உதவியாக இருக்கும் என்ற அர்த்தத்தில் எழுதினேன். அவர்கள் தமிழ் மொழிப் படைப்புக்களை விரும்பிப் படிப்பானார்கள் என்றால் ஒரு கால கட்டத்தில் தமிழ் எழுத்துக்களையும் படிக்க வேண்டும் என்ற ஆர்வம் பிறக்கலாம் என்றும் எழுதினேன்.

நன்றி - சொ. சங்கரபாண்டி

ஜெகத்,

நீங்கள் சொல்வது போல் ஜ, ஸ, ஹ, ஷ, ஸ்ரீ போன்று தமிழ் ஒருங்குறியில் இருக்கும் கிரந்த எழுத்துக்களை இது போன்ற கருவிகளில் தாராளமாகப் பயன்படுத்தலாம். ஒதுக்கத் தேவையில்லை. dha, ga போன்றவற்றுக்குத் தான் ஒலிபெயர்ப்புக் குறிகள் தேவை. இந்தக் குறிகளை எழுத்துக்கு முன்னால் இடுவதா பின்னால் இடுவதா என்று சொல்ல எனக்கு மொழியியல் அறிவு கிஞ்சித்தும் இல்லை. ஆனால், இது போன்ற குறிகளை நீங்கள் கருவியில் சேர்க்கும் முன் சில மொழி அறிஞர்களிடம் கருத்துக் கேட்பது, விவாதித்து ஒரு முடிவுக்கு வருவது நல்லது. (ஒருவேளை இது குறித்த முயற்சிகளை நீங்கள் ஏற்கனவே செய்திருக்கலாம் கட). ஏனெனில் இது போன்ற இணைய ஒலிபெயர்ப்புக் கருவிகளுக்கு இனியன் ஒரு முன்னோடியாக இருக்கும் பட்சத்தில் தவறான ஒலிபெயர்ப்பு முறைகள் நிலைத்து விடக்கூடாது.

தமிழ் விக்கிபீடியாவில் செல்வா அவர்களின் பரிந்துரை ஏற்றுக் கொள்வதில் பயனர்கள் பெரும் தயக்கம் கொண்டுள்ளார்கள். மொழியியல் கட்டுக்கள் தவிர, மீடியாவிக்கி மென்பொருளில் உள்ள நுட்பக் கட்டுக்களும் முக்கியக் காரணம். ஆனால், இனியன் போன்ற கருவிகள் தயங்காமல் இம்முறைகளை அறிமுகப்படுத்து வேண்டும். இது போன்ற கருவிகளில் எவ்வளவு துல்லியமாக பலுக்கல்களை (உச்சரிப்புகளை) சொல்லித் தருகிறோம் என்பது தான் முதன்மையானதாக இருக்க வேண்டும். விக்கிபீடியாவில் இது முதன்மை நோக்கம் கிடையாது என்பதால் இப்பரிந்துரை இது வரை ஏற்கப்படவில்லை

அற்புதமான முயற்சி ஜெகத், வாழ்த்துக்கள்..

பயனுள்ள ஒன்று. மிக்க நன்றி.

நல்ல முயற்சி ஜெகத்!

இந்தி மற்றும் மலையாளங்களை சோதித்துப் பார்த்தேன். வியந்தேன்.

அப்படியே ஆங்கிலத்தை தமிழ் படுத்த ஏதேனும் வழி இருக்கா.. அதையும் செய்தால்.. என்னைப் போன்றவர்களுக்கும்.. மாணவர்களுக்கும் வசதியாக இருக்கும் தானே..

(அப்புறம்.. இதனை சேமித்து வைத்து ஆப்லைனில் உபயோகப்படுத்தும் படி செய்தால்.. நன்றாக இருக்குமே... இன்னும் பல இடங்களில் இணைய வசதி போய்ச் சேரவில்லை. சுரதா.காம் சமாச்சாரங்கள் ஆப்லைனிலும் வேல்லை செய்கிறது.)

தங்களின் உழைப்புக்கு வந்தனங்கள்!

ஜெகத், மிக அருமையான முயற்சி. பாராட்டுக்கள்.

தமிழ்த் தாயும் மற்ற அனைத்து மொழி அன்னையரும் ஒன்று கூடிய உருவானவள் தான் பாரதமாதா.
"ஸுஹாஸினீம் சுமதுர பாஷிணீம்" என்று வந்தே மாதரம் பாடல் பாரதத்தின் இனிமை மிக மொழிகள் எல்லாவற்றையும் போற்றுகிறது.

உங்கள் கருவியை கன்னடத்துடன் பயன்படுத்தி பார்த்தேன்.

பசவேஸ்வரர் வசனம் :
ಉಳ್ಳವರು ಶಿವಾಲಯ ಮಾಡುದರು
ನಾನೆನ್ದು ಮಾಡುವದು ಬಡವನಯ್ಯಾ
ಕಾಲೇ ಖಂಬಾ ದೇಹವೇ ಥಿಗಳು
ಶಿರಸೇ ಹೊನ್ನಿನ ಕಲಶವಯ್ಯಾ
தமிழ் வடிவம்:
உள்ளவரு ஷிவாலய மாடுதரு
நானெந்து மாடுவது படவனய்யா
காலே கம்பா தேஹவே திகளு
ஷிரஸே ஹொன்னின கலஷவய்யா

அனேகமாக சரியாகவே வந்திருக்கிறது என்பேன், கொஞ்சம் திருத்தங்கள் செய்தால் இன்னும் அழகாக இருக்கும். உதாரணமாக, "ஷ" இடத்தில் "ச" வந்தால் தமிழ் வடிவம் இயல்பாக இருக்கும்.

கோபியின் மொழிமாற்றியில் தமிழில் இல்லாத ஒலி வடிவங்களுக்கு எண்களையும் தருகிறது. இது மிகவும் துல்லியமான மொழிமாற்றம் என்று கருதுகிறேன்.

தமிழில் இருந்து மற்ற மொழிகளுக்கு மாற்றுவது எப்படி என்று யோசித்தீர்களா? ஒரே எழுத்திற்குத் தமிழில் 2-3 ஒலிவடிவம் இருப்பது இதை மிகவும் கடினமாக்கும். அதுவும், மற்ற மொழிகளில் இதே சொல் இருக்கும்போது அதை சரியாக மொழியாக்கினால் தான் அந்த மொழிக்காரருக்கு ஒழுங்காகப் புரியும்.. இதற்கான பொது விதிமுறை உருவாக்கினாலும், அதில் நிறைய விதிவிலக்கு வரும் - ஒரு விதமான fuzzy logic problem .

பால் - paal (bot baal)
பாலன் - baalan (not paalan)
பஸ் - bas (not pas)
ரொம்ப - romba (not rompa)
கங்கை - gangai (not kankai)
..
உமர் கருவியில் தமிழில் எழுதி கன்னடம், ஹிந்தியில் மொழிமாற்றிப் பார்த்தேன்.. சுத்தமாக உருமாறி படிக்கவே இயலாதமாதிரி வந்தது!

பொன்ஸ், Fast Bowler, பாலபாரதி, ஜடாயு: உங்கள் கருத்துக்களுக்கு நன்றி. சில வழுக்கள் தெரியவந்திருக்கின்றன. நேரம் கிடைக்கும் போது அவற்றை சரி செய்வதற்குத் தேவையான மாற்றங்களை நிரலில் செய்வதாக இருக்கிறேன். அப்போது உங்கள் கருத்துக்களையும் பரிந்துரைகளையும் கவனத்தில் கொள்கிறேன்.

தமிழ் உரையை மற்ற மொழி எழுத்துக்களைக் கொண்டு எழுதினாலும் பேச்சுத் தமிழோடு நல்ல அறிமுகம் உள்ளவர்களால் மட்டுமே அதை விளங்கிக்கொள்ள இயலும். இதற்கு ka-ga, pa-ba போன்ற ஒலிகளை தமிழில் வேறுபடுத்த முடியாதது மட்டும் காரணமல்ல. மற்ற மொழிக்காரர்களுக்குப் பழக்கமானச் சொற்களாக இருந்தாலும் கூடத் தமிழில் அவை எப்படி உச்சரிக்கப்படும் என்பதைத் தெரிந்தாலன்றி அவர்களுக்குப் புரியாது. உதாரணமாக உதாரணம் என்றச் சொல்லையே எடுத்துக்கொண்டால் உதாஹரணம் என்று எழுதினால் தான் ஒரு மலையாளிக்கு விளங்கும். இந்தச் சிக்கல் அனைத்து மொழிகளுக்கும் உண்டு. college என்பதை காலேஜ் என்று எழுதும் தமிழ்நாட்டவர்க்கு எழுத்துப்பெயர்க்கப்பட்ட மலையாளக் கட்டுரையில் கோளேஜ் என்று வருவதுப் புரியாமல் போகலாம். ஆனால் மலையாள உச்சரிப்பை அறிந்தவர்களுக்கு அதைப் புரிந்துக்கொள்வதில் எந்த சிரமமும் இருக்காது. எனவே இதுபோன்ற எழுத்துப்பெயர்ப்புக் கருவிகள் எழுத்துத் தெரியாதவர்களுக்கு மட்டுமே. மொழியும் உச்சரிப்பும் தெரிந்திருக்க வேண்டும்.

//எனவே இதுபோன்ற எழுத்துப்பெயர்ப்புக் கருவிகள் எழுத்துத் தெரியாதவர்களுக்கு மட்டுமே. மொழியும் உச்சரிப்பும் தெரிந்திருக்க வேண்டும்.//

நல்ல விளக்கம்.

ரொம்ப பயனுள்ளதா இருக்கும் என்று நினைக்கிறேன், நீங்க கொடுத்து உள்ள ஹிந்தி பாட்டு சரியா தான் மாற்றி தருது. உபயோகமான utility அறிமுகப்படுத்திய கில்லிக்கு நன்றி

சும்மா கொஞ்சம் படிக்க ஆரம்பிச்சேன்...அதாவது மலையாள ட்ரேன்ஸ்லேசன் வரைக்கும்...என்ன சொல்றதுனு தெரியலீங்க....இப்படி எல்லாம் சாத்தியமானு வாய பொளந்துட்டேன் இந்த சாதாரன பாமரன்...

நிலா நிலா ஓடி வான்னு தான் கேட்டு இருக்கேன்...அந்த நிலா ஓடி வந்து இப்ப தான் பாக்கறேன்...இது கண்டிப்பா சாதனைக்கு எல்லாம் சாதனை...உங்கள் முயர்ச்சி தொடர வாழ்த்துக்கள்...

தமிழ் வலையுலகிற்கு புதியவன் நான்.
ரவிசங்கரின் சுட்டியினூடாக இங்கே வந்தேன். மிகவும் பயனுள்ள தமிழுக்கான பணிகளை மேற்கொண்டுவரும் உங்கள் எண்ணப்பாடுகள் மிகவும் பாராட்டுக்குறியது.

நன்றி!