ইউনিকোড বিষয়ক দুই-পাঁচ ফান্ডা-
নীচের প্রায়-প্রবন্ধটা আমার লেখা নয়। ঈশানদা'র লেখা। ইউনিকোড বিষয়ে প্রাথমিক ধারণার জন্যে এটা কাজে লাগতে পারে ভেবে এখানে তুলে দিলাম।
---------------------------------------------------
এক৷ কম্পু কি বোঝে?
কম্পু শুধু নম্বর বোঝে৷ অক্ষর বোঝেনা৷ শব্দ বোঝেনা৷ এ বি সি ডি কম্পু বোঝেনা, ক খ গ বোঝেনা৷ প্রতিটি অক্ষরের জন্য আছে এক একটি সংখ্যা৷ যথা, A মানে ৬৫৷ a মানে ৯৭৷ এইরকম প্রতিটি অক্ষরের জন্য আছে এক এক খানা নম্বর৷
দুই৷ টেক্সট ফাইলে কি থাকে
অতএব টেক্সট ফাইলে কোনো অক্ষর থাকেনা৷ জাস্ট নম্বর লেখা থাকে, বিভিন্ন কায়দায়, যাকে এনকোডিং বলে৷ ধরা যাক একখানা প্লেন টেক্সট ফাইলে যদি aa লিখে সেভ করা হয়, তাহলে সেই ফাইলে জাস্ট দুটো সংখ্যা লেখা থাকবে: ৯৭ এবং ৯৭৷ পরপর৷ ব্যস৷ আর কিচ্ছু না৷
তিন৷ তাহলে লেখা পড়ি কি করে?
এই খানেই আসে ফন্টের গপ্পো৷ ফন্ট ফাইল হল এমন একখানি ফাইল যেখানে নম্বর এবং তার গ্রাফিক্যাল রিপ্রেসেন্টেশনের একখানা ম্যাপিং থাকে৷ সোজা বাংলায়, নম্বরের ছবি আঁকা থাকে৷ যে, এই হল ৯৭ নম্বরের ছবি৷ আর ইনি হলেন ৯৮৷অর্থাত্ ইনি b এর মতো দেখতে৷
এবার, ঐ aa লেখা ফাইল খুলে নোটপ্যাড কি করে, পরপর নম্বর গুলো পড়ে নেয়৷ তারপর ফন্ট ফাইলে গিয়ে দেখে নম্বরগুলোর ছবি কেমন৷ ছবি পেলে এঁকে দেয়, না পেলে চৌকো বাক্স দেখায়৷
চার৷ স্ট্যান্ডার্ড৷
এখানে বোঝা যাচ্ছে, যে, এই ফন্ট ফাইলে নম্বর বনাম ছবির যে ম্যাপিং তার একটা ইউনিভার্সাল স্ট্যান্ডার্ড থাকা দরকার৷ অর্থাত্ ৯৭ মানে a হলে, সবাইকেই সেটা মেনে চলতে হবে৷ নইলে ঘোর বিপদ৷ কেউ যদি ৯৭ মানে b ধরে নেয়, তাহলে আমাদের aa লেখা ফাইল তার মেশিনে খুললে bb দেখাবে৷
পাঁচ৷ ইউনিকোড এবং স্ট্যান্ডার্ড
আমরা যারা বাংলায় এটা-সেটা করি, তারা জানি যে স্ট্যান্ডার্ডের অভাবে কি কি হয়৷ বিভিন্ন সাইট থেকে বাংলা কপি পেস্ট করতে পারিনা, এক সফটওয়্যারে লিখি তো আরেক সফটওয়্যারে হিজি বিজি দেখায়, কারণ ফন্টের ব্যাপারে কেউ কোনো স্ট্যান্ডার্ড ফলো করেনা৷
এখন ইউনিকোড হল সেই স্ট্যান্ডার্ড, যেটা বাংলায় সকলের মেনে চলার কথা৷ সারা পৃথিবীর প্রায় সমস্ত ভাষার প্রতিটা অক্ষরের জন্য এই স্ট্যান্ডার্ডে নম্বর বরাদ্দ করা হয়েছে৷ সেই ভাষার লিস্টিতে বাংলাও আছে৷ ইউনিকোদ সকলে মেনে চললে যা-যার ঝামেলা হয় বাংলা লিখতে, সেটা আর থাকার কথা না৷
---------------------------------------
এ বিষয়ে আর কিছু ক্যাচাল পড়তে চাইলে ক্লিক করুন এইখানে।
সহজ করে আর কিছু যোগ করতেই হল, কারন অনেকেই জানতে চাচ্ছেন ইউনিকোড দিয়ে আসলে কি হাতিটা বা ঘোড়াটা হবে?
পয়েন্ট করে বলি।
১। আপনি ইয়াহু বা অন্য সব মেসেঞ্জারে বাংলায় চ্যাট করতে পারবেন।
২। যে কোনো সাইটে- বাংলায় মন্তব্য লিখতে পারবেন।
৩। গুগল এখন বাংলা সাপোর্ট দিচ্ছে, সুতরাং- ওখানে কেউ যদি বাংলা লিখে সার্চ করে, তবে ইউনিকোড -এ লেখা সব সাইট গুগল দেখাতে পারবে।
৪। কম্পিউটারে যে কোনো একটি ইউনিকোড ফন্ট থাকলেই হল, যে কেউ আপনার সাইট পড়তে পারবে।
এর মধ্যে আমি সবচেয়ে বেশি গুরুত্ব দিবো গুগলের ব্যাপারটা। কারন মানুষ সাইট বানায়-ই সবার কাছে পৌছানর জন্যে। আর এ ক্ষেত্রে সবচে' বেশি সাহায্য করে গুগল । আপনার লেখা সাইট-টি হয়ত মুক্তিযুদ্ধ বিষয়ক হলো, গুগলে কেউ বাংলায় ' মুক্তিযুদ্ধ' লিখলেই আপনার সাইট-টি তিনি পেয়ে যাবেন সামনে। এবং পুরো ব্যাপারটি-ই হবে কেবল এবং কেবল যদি আপনি আপনার সাইট-টি ইউনিকোড- এ বানান।
আরো বেশি মানুষের কাছে বাংলা পৌছাতে হলে আমাদের উচিৎ সবাইকে ইউনিকোড বাংলায় সাইট বানাতে উৎসাহি করা।
---------------------------------------------------
এক৷ কম্পু কি বোঝে?
কম্পু শুধু নম্বর বোঝে৷ অক্ষর বোঝেনা৷ শব্দ বোঝেনা৷ এ বি সি ডি কম্পু বোঝেনা, ক খ গ বোঝেনা৷ প্রতিটি অক্ষরের জন্য আছে এক একটি সংখ্যা৷ যথা, A মানে ৬৫৷ a মানে ৯৭৷ এইরকম প্রতিটি অক্ষরের জন্য আছে এক এক খানা নম্বর৷
দুই৷ টেক্সট ফাইলে কি থাকে
অতএব টেক্সট ফাইলে কোনো অক্ষর থাকেনা৷ জাস্ট নম্বর লেখা থাকে, বিভিন্ন কায়দায়, যাকে এনকোডিং বলে৷ ধরা যাক একখানা প্লেন টেক্সট ফাইলে যদি aa লিখে সেভ করা হয়, তাহলে সেই ফাইলে জাস্ট দুটো সংখ্যা লেখা থাকবে: ৯৭ এবং ৯৭৷ পরপর৷ ব্যস৷ আর কিচ্ছু না৷
তিন৷ তাহলে লেখা পড়ি কি করে?
এই খানেই আসে ফন্টের গপ্পো৷ ফন্ট ফাইল হল এমন একখানি ফাইল যেখানে নম্বর এবং তার গ্রাফিক্যাল রিপ্রেসেন্টেশনের একখানা ম্যাপিং থাকে৷ সোজা বাংলায়, নম্বরের ছবি আঁকা থাকে৷ যে, এই হল ৯৭ নম্বরের ছবি৷ আর ইনি হলেন ৯৮৷অর্থাত্ ইনি b এর মতো দেখতে৷
এবার, ঐ aa লেখা ফাইল খুলে নোটপ্যাড কি করে, পরপর নম্বর গুলো পড়ে নেয়৷ তারপর ফন্ট ফাইলে গিয়ে দেখে নম্বরগুলোর ছবি কেমন৷ ছবি পেলে এঁকে দেয়, না পেলে চৌকো বাক্স দেখায়৷
চার৷ স্ট্যান্ডার্ড৷
এখানে বোঝা যাচ্ছে, যে, এই ফন্ট ফাইলে নম্বর বনাম ছবির যে ম্যাপিং তার একটা ইউনিভার্সাল স্ট্যান্ডার্ড থাকা দরকার৷ অর্থাত্ ৯৭ মানে a হলে, সবাইকেই সেটা মেনে চলতে হবে৷ নইলে ঘোর বিপদ৷ কেউ যদি ৯৭ মানে b ধরে নেয়, তাহলে আমাদের aa লেখা ফাইল তার মেশিনে খুললে bb দেখাবে৷
পাঁচ৷ ইউনিকোড এবং স্ট্যান্ডার্ড
আমরা যারা বাংলায় এটা-সেটা করি, তারা জানি যে স্ট্যান্ডার্ডের অভাবে কি কি হয়৷ বিভিন্ন সাইট থেকে বাংলা কপি পেস্ট করতে পারিনা, এক সফটওয়্যারে লিখি তো আরেক সফটওয়্যারে হিজি বিজি দেখায়, কারণ ফন্টের ব্যাপারে কেউ কোনো স্ট্যান্ডার্ড ফলো করেনা৷
এখন ইউনিকোড হল সেই স্ট্যান্ডার্ড, যেটা বাংলায় সকলের মেনে চলার কথা৷ সারা পৃথিবীর প্রায় সমস্ত ভাষার প্রতিটা অক্ষরের জন্য এই স্ট্যান্ডার্ডে নম্বর বরাদ্দ করা হয়েছে৷ সেই ভাষার লিস্টিতে বাংলাও আছে৷ ইউনিকোদ সকলে মেনে চললে যা-যার ঝামেলা হয় বাংলা লিখতে, সেটা আর থাকার কথা না৷
---------------------------------------
এ বিষয়ে আর কিছু ক্যাচাল পড়তে চাইলে ক্লিক করুন এইখানে।
সহজ করে আর কিছু যোগ করতেই হল, কারন অনেকেই জানতে চাচ্ছেন ইউনিকোড দিয়ে আসলে কি হাতিটা বা ঘোড়াটা হবে?
পয়েন্ট করে বলি।
১। আপনি ইয়াহু বা অন্য সব মেসেঞ্জারে বাংলায় চ্যাট করতে পারবেন।
২। যে কোনো সাইটে- বাংলায় মন্তব্য লিখতে পারবেন।
৩। গুগল এখন বাংলা সাপোর্ট দিচ্ছে, সুতরাং- ওখানে কেউ যদি বাংলা লিখে সার্চ করে, তবে ইউনিকোড -এ লেখা সব সাইট গুগল দেখাতে পারবে।
৪। কম্পিউটারে যে কোনো একটি ইউনিকোড ফন্ট থাকলেই হল, যে কেউ আপনার সাইট পড়তে পারবে।
এর মধ্যে আমি সবচেয়ে বেশি গুরুত্ব দিবো গুগলের ব্যাপারটা। কারন মানুষ সাইট বানায়-ই সবার কাছে পৌছানর জন্যে। আর এ ক্ষেত্রে সবচে' বেশি সাহায্য করে গুগল । আপনার লেখা সাইট-টি হয়ত মুক্তিযুদ্ধ বিষয়ক হলো, গুগলে কেউ বাংলায় ' মুক্তিযুদ্ধ' লিখলেই আপনার সাইট-টি তিনি পেয়ে যাবেন সামনে। এবং পুরো ব্যাপারটি-ই হবে কেবল এবং কেবল যদি আপনি আপনার সাইট-টি ইউনিকোড- এ বানান।
আরো বেশি মানুষের কাছে বাংলা পৌছাতে হলে আমাদের উচিৎ সবাইকে ইউনিকোড বাংলায় সাইট বানাতে উৎসাহি করা।