বাংলা ভাষা নিয়ে আমাদের অনেক আবেগ কাজ করে। আমরা ভাষার অবমাননা সহ্য করতে পারি না। তাই গুগল অনুবাদে সম্প্রতি যখন বাংলা যোগ হল তখন সেটার অনুবাদের ফলাফল আমাদের অনেকেরই নিত্য হাস্য কৌতুকের খোরাক হয়ে দাঁড়ায় (বিশেষ করে ফেইসবুকে)। এসব হাসি তামাসার ফাঁকে ধামা চাপা পড়ে যাচ্ছে যুগান্তকারী একটি অগ্রযাত্রা। সেটাই আজ বোঝার চেষ্টা করব।
ওয়েবের শক্তি সম্পর্কে কারুরই সন্দেহের অবকাশ নেই। বিশ্বের যে কোন কোনার মানুষের সাথে নিমিষে কথোপকথন, একে অপরকে জানা সম্ভব অনায়াসেই এমন সব প্রযুক্তি আমাদের হাতের মুঠোয়। কিন্তু তাতে বাধ সাধে একটি বিষয় - ভাষা। আমরা ব্রিটিশ কলোনির বাসিন্দা বলে আমাদের একটু সুবিধা আছে। ইংরেজিটা কিছুটা হলেও জানি। ফলে বেশীরভাগ ইন্টারনেটের কন্টেন্ট বুঝতে তেমন সমস্যা হয় না। এবং এখানেই বেঁধেছে বড় একটা গোল।
বিশ্বের ৬০ কোটি ইন্টারনেট ব্যবহারকারীদের ২৭.৩% হচ্ছে ইংরেজী ভাষী (সূত্র) আর ২২.৬% হচ্ছে চৈনিক ভাষী। অন্যান্য ভাষাভাষীরা অনেক পিছিয়ে (স্প্যানিশ ৭.৮%, জাপানী ৫%, পর্তুগীজ ৪.৩%, জার্মান ৩.৮%, আরবী ৩.৩%) - বাংলা, হিন্দিভাষী বিশাল জনগোষ্ঠী ইন্টারনেটে তাদের ভাষায় কথা বলে তুলনামূলকভাবে কম। রয়েছে আরও অসামঞ্জস্যতা - ৩১৩ বিলিয়ন ওয়েবপেইজের ৬৮.৪% ইংরেজী ভাষায় তার পরে মাত্র ৫.৯% জাপানি ভাষায় আর ৫.৮% জার্মান ভাষায় (সূত্র)। ২২.৬% চৈনিক ভাষী ব্যবহারকারী ওয়েব কন্টেন্টের মাত্র ৩.৯% তৈরি করে।
এই সব পরিসংখ্যান একটি কথা বলে - আমরা বিশ্বকে জানি বা দেখি ইংরেজী ভাষীদের দৃষ্টিতে - হবেই না কেন বিশ্বের ৬২.৫৫% সংবাদপত্র/ম্যাগাজিন, ২২% বই, ৪৫% জার্নাল, ৩৫% ছবি ও ভিডিও ইংরেজী ভাষায়। কিন্তু এটি একে অপরকে বোঝার ক্ষেত্রে সমস্যার সৃষ্টি করছে নানা স্টেরিওটাইপ তৈরির মাধ্যমে। আমরা ব্রাজিলের কোন ব্লগারের বক্তব্য জানতে পারব না যদি না কেউ অনুবাদ করে দেয় তার ব্লগ। তেমনি সচলদের লেখা একজন ব্রাজিলিয় পড়তে পারে না।
বিশ্ব সমাজকে এগিয়ে নিতে গেলে তাই অনুবাদ একটি গুরুত্বপূর্ণ মাধ্যম। অনুবাদের কার্যকরী টুলটি সেক্ষেত্রে একটি জরুরী উদ্ভাবন। কিন্তু বাস্তবিক ক্ষেত্রে মেশিন ট্রান্সলেশন কি পর্যায়ে আছে? এক ক্লিকে অনুবাদের ব্যবস্থাটি এখনও নিখুঁত নয়। তার চেয়ে বড় কথা হল মেশিন সব অনুবাদ করে দেবে এই ধারনাটি কম্পিউটার কবিতা লিখবে এরই সমার্থক।
অনুবাদ একটি শিল্প। একজন অনুবাদকের দুই ভাষা ও সংস্কৃতি সম্পর্কে ধারণা থাকা লাগে, পাঠকদের কথা চিন্তা করতে হয় - তবেই সে সঠিক অর্থ ফুটিয়ে তুলতে পারে। আমাদের অনেকেরই জানা নেই যে অনুবাদ একটি ১৮-২০ বিলিয়ন ডলার ইন্ডাস্ট্রি। বিশ্বাস হচ্ছে না? ছবির সাবটাইটেল একটি বড় অনুবাদের জায়গা। এরপর ধরুন ইউরোপিয়ান ইউনিয়নের অনেক প্রকাশনা নিয়ম অনুযায়ী সদস্য দেশগুলোর ২৩টি ভাষায় অনূদিত হয়। অনেক পেশাদারী অনুবাদের প্রতিষ্ঠান রয়েছে এসব ক্ষেত্রে কর্মরত। তাদের কাজের সুবিধার জন্যে নানা সফট্ওয়্যারের উদ্ভব হয়েছে - যেমন প্রোপাইটরী সিসট্রান, ট্রাডোস ইত্যাদি - বা ওপেন সোর্স - যেমন লিঙ্গোটেক, লুসি সফটওয়্যার, আপেরিটিয়াম ইত্যাদি। এইসব সফট্ওয়্যারের মূল মন্ত্র হচ্ছে একই বাক্যের অনুবাদ যাতে দুইবার না করতে হয়। সেজন্যে তারা সাহায্য নেয় ট্রান্সলেশন মেমোরির। মেশিন অনুবাদে যেই ভাষায় সবচেয়ে বেশী কন্টেন্ট পাওয়া যায় সেই ভাষায় অনুবাদ সবচেয়ে বোধগম্যভাবে হয়। কিন্তু এইসব ট্রান্সলেশন মেমোরি বিনামূল্যের নয় - বাজারে বিক্রি হয়। তবে যেই সফ্টওয়্যার ব্যবহার করা হোক মানুষ কর্তৃক মান নিয়ন্ত্রণই সফল বাণিজ্যিক অনুবাদের চাবিকাঠী।
অনুবাদকে তার ব্যয়বহুল ইন্ডাস্ট্রির কবল থেকে মুক্ত করে সার্বজনীন করার লক্ষ্যে ওপেন ট্রান্সলেশন ধারনার উদ্ভব ঘটে। এখানে ক্রাউড সোর্সিং এবং স্বেচ্ছাসেবী অনুবাদের মাধ্যমে মেশিন ট্রান্সলেশন টুলস ব্যবহার করা হয়। গুগলের ট্রান্সলেটর টুলকিট এমন একটি ওপেন ট্রান্সলেশন টুল যেখানে স্বেচ্ছাসেবীরা নিত্য নতুন অনুবাদ সৃষ্টি করে চলেছে এবং সবার জন্যে উন্মুক্ত ট্রান্সলেশন মেমোরি রিপোজিটরি তৈরি করছে।
টেড তাদের ভিডিও অনুবাদের জন্যে অর্ধ মিলিয়ন ডলার খরচ করেছে। তাদের পেশাদারী সংস্থা দিয়ে করা কিছু বাংলা অনুবাদ দেখে যারপরনাই বিরক্ত হয়েছিলাম এবং তাদের একজনকে বলেছিলাম গ্লোবাল ভয়েসেস বাংলা সংস্করণে স্বেচ্ছাসেবীদের দ্বারা এর থেকে অনেক উঁচু মানের কাজ হয়। তাদের সমস্যা ছিল কাজটি বুঝে নিয়েছিল অবাঙ্গালী কেউ - তাই যা ইচ্ছা বুঝিয়ে দিয়েছিল অনুবাদ সংস্থা। টেড এর পরে কমিউনিটি বেইজড ওপেন ট্রান্সলেশন মডেল চালু করে যা সাফল্য পায়।
বাংলা বা তামিলের মত বহু ব্যবহৃত ভাষার জন্যে কার্যকরী মেশিন ট্রান্সলেশন টুলস এতদিন তৈরি না হওয়ার পেছনে রয়েছে পর্যাপ্ত উদ্যোগ ও অর্থের অভাব - অনুবাদক ও অন্কুর এর মত গুটিকয়েক প্রকল্প বেশি দুর আগাতে পারেনি পৃষ্ঠপোষকতার অভাবে।
এছাড়াও রয়েছে প্রযুক্তিগত চ্যালেঞ্জ - অনুবাদ কিন্তু শুধু শব্দের প্রতিস্থাপন নয় - রয়েছে ব্যাকরণ, বাক্যের গঠন, রুপক, বাগধারা ইত্যাদির প্রভাব। যেমন ধরুন দক্ষিণ এশীয় ভাষাগুলোতে বাক্যগুলো (subject-object-verb * আমি-ভাত-খাই) নিয়মে গঠিত হয় যেখানে ইংরেজীতে বাক্য গঠিত হয় (subject-verb-object * I eat rice) এই নিয়মে। এছাড়াও পর্যাপ্ত উন্মুক্ত কন্টেন্টের অভাব একটি বড় কারন ছিল। বিষয়টা ব্যাখ্যা করি। একটি মেশিন ট্রান্সলেশন টুলস তিনটি নিয়ম মেনে কাজ করতে পারে:
ক) রুলস বেইজড (ব্যাকরণের নিয়ম আর অভিধান)
খ) স্ট্যাটিস্টিকাল (দ্বিভাষী ট্রান্সলেশন মেমোরি বা করপাস নিয়ে কাজ করে) আর
গ) হাইব্রিড (উপরের দুয়ের সংমিশ্রণ)
গুগল প্রথম দিকে রুলস বেইজড প্রক্রিয়ায় অনুবাদ করলেও ২০০৭ সাল থেকে স্ট্যাটিস্কাল মেথড চালু করে। এই প্রক্রিয়ায় বিশালাকার টেক্সট কর্পোরা এর দরকার হয়। এটি কার্যকরী করতে ন্যুনতম ২০ লাখ শব্দ নিয়ে কাজ করতে হয় এবং অনেক কম্পিউটিং শক্তি লাগে। এই প্রক্রিয়ার সুবিধা হল যে এটি অনুবাদকারীকে সুযোগ দেয় বেশ কিছু কাছাকাছি শব্দ থেকে বেছে নিতে।
এই পদ্ধতিতে আরেকটি সুযোগ আছে - ক্রমাগত অনুবাদের মান বৃদ্ধি করা। গুগল ব্লগ অনুযায়ী আপনি ভুল অনুবাদকে ঠিক করতে পারবেন অনায়াসেই এবং গুগল সেটি মনে রাখবে এবং পরবর্তী বার সঠিক অনুবাদ উপস্থাপন করবে।
কাজেই আমি মনে করি গুগল ট্রান্সলেইটে বাংলা ভাষাভাষীদের জন্যে একটি যুগান্তকারী টুল। এটি এযাবৎকালে পাওয়া যাওয়া একমাত্র টুল অনুবাদক অনলাইনের চেয়ে বহুগুণে সমৃদ্ধ। আর এখন বাংলা ভাষা থেকে বিশ্বের ৬২টি ভাষায় (ভুল হলেও) অনুবাদ সম্ভব - এর শক্তি নিশ্চয়ই অনুমেয়। আসুন ওপেন ট্রান্সলেশন ধারনা আপন করে গুগল ট্রান্সলেট এর ভুলগুলো নিজেরা শুদ্ধ করে দেই ভবিষ্যৎ কল্যাণের জন্যে অথবা গুগল ট্রান্সলেটর টুলকিট ব্যবহার করে গুগলের ট্রান্সলেশন মেমরিকে সমৃদ্ধ করি।
ছবির জন্য কৃতজ্ঞতা: অনুবাদক, ইন্টারনেট ওয়ার্ল্ড স্ট্যাটস, গুগল ট্রান্সলেট।
বিবিধ রেফারেন্স:
* ওপেন ট্রান্সলেশন টুলস ম্যানুয়াল
* গুগল ট্রান্সলেট পাঁচটি উপমহাদেশীয় ভাষা যোগ করেছে
* ওপেন ট্রান্সলেশন দিয়ে বিশ্বে পরিবর্তন আনা
* Development of A Morphological analyser for Bengali
* Bootstrapping of a rule based English-Bangla machine translation system using work done for a sister language - BRAC University Institutional Repository
মন্তব্য
গুগল টুলকিট ব্যাবহার করে উইকিপিডিয়ার আর্টিকেলগুলো অনুবাদ করলে এক কাজে দুই কাজ হতে পারে বলে মনে হয়। প্রথমত উইকিতে একটা একটা নতুন বাংলা লেখা যোগ হলো আবার গুগুলও অনুবাদে পোক্ত হলো!
আমি কি ঠিক ভাবছি?
______________________
নিজের ভেতর কোথায় সে তীব্র মানুষ!
অক্ষর যাপন
অবশ্যই। গুগল ট্রান্সলেটর টুলকিটে অটোমেটিক বাংলা ট্রান্সলেশনটা এখনও চালু হয়নি - এটি আলফা লেভেল বলেই হয়ত। তবে অনায়াসেই গুগল ট্রান্সলেট থেকে প্রি-ট্রান্সলেশনটা নিয়ে আসা যায় ঠিক করার জন্যে। আমি অন্যান্য ভাষায় প্রফেশনাল ট্রান্সলেটরদের গুগল ট্রা: টুলকিট ব্যবহার করতে দেখেছি - এটি পাওয়ারফুল। আর এটাতে দারুন একটা বাংলা গ্লোসারি আছে।
পৃথিবী কথা বলছে আপনি কি শুনছেন?
দারুন আইডিয়া। রেজওয়ান ভাইকে
দুর্দান্ত আইডিয়া !
----------------------------------------------------------------------------
একশজন খাঁটি মানুষ দিয়ে একটা দেশ পাল্টে দেয়া যায়।তাই কখনো বিখ্যাত হওয়ার চেষ্টা করতে হয় না--চেষ্টা করতে হয় খাঁটি হওয়ার!!
দারুণ তথ্যসমৃদ্ধ এবং যুক্তিপূর্ণ লেখা ভাইয়া ! আসলে আমরা সবাই মিলে এখন খুব দ্রুত এটাকে একটি মানসম্পন্ন অনুবাদকে পরিণত করে ফেলতে পারি আমাদের ইনপুটগুলো দিয়ে ।
----------------------------------------------------------------------------
একশজন খাঁটি মানুষ দিয়ে একটা দেশ পাল্টে দেয়া যায়।তাই কখনো বিখ্যাত হওয়ার চেষ্টা করতে হয় না--চেষ্টা করতে হয় খাঁটি হওয়ার!!
গুগুল ট্রান্সলেশন টুলকিট ব্যবহারের মাধ্যমে কেমন করে উইকিপিডিয়ার আর্টিকেল অনুবাদ করা যায়, সেটা নিয়ে বাংলা উইকি প্রশাসক বেলায়েত এর বাংলায় একটি সহজবোধ্য টিউটোরিয়াল আছে। উইকিতে অনুবাদের ক্ষেত্রে সেটার সহায়তা নেওয়া যেতে পারে।
টিউটোরিয়ালটির লিংক --
[url=http://bellayet.wordpress.com/2011/03/31/গুগুল-ট্রান্সলেশন-টুলকিট/]গুগুল ট্রান্সলেশন টুলকিটে উইকিপিডিয়ার জন্য সহজে নিবন্ধ অনুবাদ-- বেলায়েত[/url]
(আমি জানি সচলরা বাহিরের লিংক বিতরন পছন্দ করেন না। তবে এই পোস্টের সাথে সংশ্লিষ্ট দেখেই শেয়ার করছি।)
-- সাদাচোখ
দারুণ লিখেছেন। সহমত।
ভালো লাগলো । কালকে ফেসবুকে ফানি পোস্ট দেখে প্রচন্ড বিরক্ত লেগেছে । আমরা সবাই বাংলা ভাষার অনুবাদ করার ক্ষেত্রে এগিয়ে আসলে কাজটা সহজ হয়ে যাবে । লেখকের জন্য শুভেচ্ছা রইল ।
বস, এই লেখাটার খুব দরকার ছিল। প্রথমবারের মত গুগুলের বাংলা অনুবাদ পেয়ে এবং সেইটার 'আপাত সরলতার' সুযোগ নিয়ে অনেক মজা-মশকরা করা হয়ে গেছে ইতমধ্যে। আপনি যে পয়েন্টটা উল্লেখ করেছেন --- এই অনুবাদকর্মটিকে এগিয়ে নিয়ে যেতে হবে আমাদেরই, এই বাংলা ভাষাভাষিদেরকেই---আমি সর্বতো ভাবে সহমত।
শুভেচ্ছা নিরন্তর
কৌস্ত্তভের কথাটাই আমার কথা
বলতে দ্বিধা নেই, শুরুতে আমিও এই মওকা ছাড়িনি, গুগল ট্রান্সলেটর থেকে নির্মল বিনদন নেওয়ার চেষ্টা করেছি। কিন্তু ব্যাপারটা যখন সীমা ছাড়িয়ে যাচ্ছিল তখনই বিরক্তির উদ্রেক হল। এই পোস্টটা ভাষার অপরিমেয় শক্তি ও এর সম্ভাবনাকে আরেকবার চোখে আঙ্গুল দিয়ে দেখিয়ে দিল। ধন্যবাদ রেজওয়ান ভাই...
--------------------------------------------
যদ্যপি আমার গুরু শুঁড়ি-বাড়ি যায়
তথাপি আমার গুরু নিত্যানন্দ রায়।
রেজওয়ান ভাই, প্রথমেই ধন্যবাদ এরকম দরকারী একটা পোস্টের জন্য। আমিও কয়েকদিন থেকে ফেসবুকে দেখছিলাম মানুষজনের স্ট্যাটাস। আজ আমি নিজে চেষ্টা করলাম। মজার, তবে অনেক কাজও করার আছে। আমরা চাইলে একে বেশ শক্তিশালী একটা টুল হিসেবে পরিণত করতে পারি।
তবে গুগল ট্রান্সলেটর টুলকিট কিভাবে ব্যবহার করে এটা সম্পর্কে লিখলে ভালো হত। সবাই ব্যাপারটা জানতে পারত।
------------------------------------------
হায়রে মানুষ, রঙিন ফানুস, দম ফুরাইলে ঠুস
তবুও তো ভাই কারোরই নাই, একটুখানি হুঁশ।
শেয়ার দিলাম।
________________________________________
"আষাঢ় সজলঘন আঁধারে, ভাবে বসি দুরাশার ধেয়ানে--
আমি কেন তিথিডোরে বাঁধা রে, ফাগুনেরে মোর পাশে কে আনে"
এই লেখাটার দরকার ছিল...ফেইসবুকে শেয়ার করলাম আমিও...
দরকারী পোস্ট।
পোস্টে আগুন দাগালাম।
তবু কিছু অনুবাদ দেখে অবাক হলাম:
সূত্র: খোমাবই।
আপনি এখন এগুলো ট্রাই করে দেখেন। আমি এগুলো ঠিক করে দিয়েছি। আমার এখানে আর এসব দেখাচ্ছে না।
------------------------------------------
হায়রে মানুষ, রঙিন ফানুস, দম ফুরাইলে ঠুস
তবুও তো ভাই কারোরই নাই, একটুখানি হুঁশ।
আমার ভালো লেগেছে গুগলের কাজটা। আর আশা করি ভূলগুলোও দ্রুত ঠিক হয়ে যাবে।
বাংলা ছড়িয়ে যাবে সারা বিশ্বে।।
অতি চমৎকার একটা কাজ হয়েছে এটা! যারা করেছে তাদের সাধুবাদ জানাই! কিছু ভুল-ত্রুটিতো থাকবেই! যতটুকু ভালো, ওইটাই গ্রহন করি! এই লেখাটির জন্য বিশেষ ধন্যবাদ!
আমার ভালো লেগেছে গুগলের কাজটা। শেয়ার দিলাম
দারুন! সাফল্য কামনা করি!
------------------------------------------------------------------------------------------------------------------------
আমি এক গভীরভাবে অচল মানুষ
হয়তো এই নবীন শতাব্দীতে
নক্ষত্রের নিচে।
পোস্টের জন্যে অনেক ধন্যবাদ। পোস্টটা দারুণ সময়ে এসেছে।
আমার ধারণা যারা ফান করছে (আমিও অন্তর্ভুক্ত), তাদের অনেকেই জানেন যে এই টুলটা মাত্র আলফা স্টেইজে রয়েছে। যারা জানেন না, তাদের জন্যেও এটা একটা শিক্ষা! কেমন করে? একটু একটু করে অনুবাদ ম্যাচিউর হচ্ছে। প্রথম দিন যে বাক্য দিয়ে হাস্যরস তৈরি হয়েছিল, আজ তার অনেকগুলো সঠিক ভাবে কাজ করছে। এভাবে আমাদের চোখের সামনে একটা লাইভ ডেভলপমেন্ট দেখতে পাচ্ছি আমরা।
টুইটার
গুগলকে খুব দ্রুত বাংলায় শিক্ষিত করতে চাইলে আমার পর্যবেক্ষণমতে সবচেয়ে কার্যকর উপায় হল গুগলের সাহায্য নিয়ে উইকি অনুবাদ করা। উইকিপিডিয়ার নিবন্ধ অনুবাদের জন্য গুগলের একটি আলাদা টুলকিট আছে যার সম্পর্কে বেলায়েত ভাই একটি [url=http://bellayet.wordpress.com/2011/03/31/গুগুল-ট্রান্সলেশন-টুলকিট/]চমৎকার নিবন্ধ লিখেছেন [/url]।
নিচের নিবন্ধটি সম্পুর্ণ এই টুলকিট ব্যাবহার করে অনুবাদ করা।
http://bn.wikipedia.org/wiki/পেপ্যাল
খুব দরকারী তথ্যসমৃদ্ধ পোস্ট!!! শেয়ার্ড!!!
খুব দরকারী তথ্যসমৃদ্ধ পোস্ট!!! শেয়ার্ড!!!
অসাধারন একটা কাজ হয়েছে। মোজাম্বিকে থাকার কারনে প্রতিদিন পর্তুগিজ ভাষা শুনতে হচ্ছে, প্রতিনিয়ত পর্তুগিজ ভাষায় ডকুমেন্ট হাজির হচ্ছে সামনে, যেটা গুগলে ইংরাজী অনুবাদ করে ঠেকা কাজ চালাচ্ছি। অফিসের জন্যে অফিসিয়াল ট্রানস্লেটর মারফত কিছু অনুবাদ করিয়েছি, উদাহরণ হিসেবে একটা বলি - ৭ প্রিষ্ঠার একটা টেকনিক্যাল ডকুমেন্ট ইংরাজীতে অনুবাদ করে সার্টিফাই করতে ৪৯০ ডলার ফী দিতে হয়েছে!!! আহহহহ কবে যে গুগল এর বাংলা অনুবাদটা আরো সঠিক হবে, এই আশায় আছি।
ভালো-------------খুব ভালো
গত কয়েকদিনে এটা নিয়ে ফেসবুকে বেশ হাসাহাসির পর অবশেষে আপনার লেখা পড়ে চোখটা বোধ হয় কিছুটা খুলেই গেল। দেখি, এখানে কিছুটা কন্ট্রিবিউট করতে পারি কিনা।
নিটোল
দরকারী... ধন্যবাদ রেজওয়ান ভাই
______________________________________
পথই আমার পথের আড়াল
চমৎকার লেখা। গতকাল ফেইসবুকে নানান ট্রান্সলেশান দেখে খারাপই লাগছিলা। এখন ভালো লাগছে জেনে যে আমরাই পারি এই অনুবাদকে সমৃদ্ধ করতে।
সঠিক সময়ে আপনার দরকারী পোস্ট!
মজা আমিও করেছি, বন্ধুরাও। কিন্তু উপরে নিয়াজ মোর্শেদ ভাইয়ের মন্তব্যের সাথে খুবই সহমত, ঐটাই লিখতে চাচ্ছিলাম আমিও। জিনিসটা আছেই আলফা স্টেজে, আর আমরা সবাই মিলে সঠিক অনুবাদে সাহায্য করলে একটা দারুণ কাজের জিনিস নিজেদের সামনে ডেভেলপ হতে দেখবো, সেটার আনন্দটা সম্পূর্ণ আলাদা।
অনেক ধন্যবাদ লেখার জন্যে। শেয়ার করছি।
___________________
ঘুমের মাঝে স্বপ্ন দেখি না,
স্বপ্নরাই সব জাগিয়ে রাখে।
নতুন মন্তব্য করুন