গত ২৬শে মার্চ ২০১৫ একটা বড় সড় উদ্যোগ আয়োজিত হলো বাংলা নিয়ে। নাম ’বাংলার জন্য চার লাখ’। উদ্দেশ্য ছিলো এদিনে দেশ ও বিদেশের আপামর জনসাধারন গুগলের ইংরেজী-বাংলা ট্রান্সলেটরের জন্য অন্তত চার লাখ শব্দ বা বাক্যাংশ অনুবাদ করবে। এভাবে ক্রাউড সোর্স করে প্রাপ্ত করপাসকে বিশ্লেষণ করে এই যান্ত্রিক অনুবাদকটি আরো কার্যকরভাবে বাংলা রচনাকে অনুবাদ ও বিশ্লেষণ করতে পারবে। এই আয়োজন চূড়ান্তভাবে সফল। চার এর জায়গায় প্রায় সাত লক্ষ শব্দ, বাক্যাংশ যুক্ত করা হয়েছে। আমাদের সবার মধ্যে বাংলার জন্য কাজ করতে চাওয়ার যে অন্তর্গত প্রেরণা এই সাফল্য তার একটা প্রমাণ।
হঠাৎ করে গুগল এ ধরনের অনুবাদযজ্ঞের ঘোষণা দিলে এমন সাড়া পাওয়া যেত না। এ সাফল্যের পিছনে যুগপৎ কাজ করেছে কয়েকটি ফ্যাক্টর। আমাদের অতিপরিচিত এবং সবার প্রিয়ভাজন আইটি বিশেষজ্ঞরা তাদের লক্ষ্যাধিক ফলোয়ারদের কাছে এ ব্যাপারে ব্যাপক প্রচারণা চালিয়েছেন। সরকারের ICT মন্ত্রণালয় এই অনুষ্ঠানকে প্রত্যক্ষ পৃষ্ঠপোষকতা দিয়েছেন এবং সর্বোপরি কাজটিকে ২৬শে মার্চ আমাদের মহান স্বাধীনতা দিবসের একটি প্রোগ্রাম হিসাবে গ্রহণ করা হয়েছে, বোঝানো হয়েছে এটা ‘বাংলার জন্য’ কিছু করার এক অনন্য সুযোগ। এখানেই শেষ নয়। পরিকল্পনা করা হচ্ছে আগামী পয়লা বৈশাখেও এ ধরণের আরো একটি আয়োজনের।
আপাত দৃষ্টিতে এ আয়োজনে কারো কোনো ক্ষতি হচ্ছে না। সবারই লাভ। কারো কম, কারো বেশী। কিন্তু আসলেই কি তাই? আয়োজনটি সম্পর্কে জানতে পারার পর থেকেই কিছু প্রশ্ন, কিছু শঙ্কা ঘুরছে আমার মনে। ভেবেছিলাম আরো অনেকেই হয়তো এই প্রশ্নগুলো করবেন। কিন্তু তেমন কিছুই চোখে না পড়ায় নিজের চিন্তাভাবনা প্রকাশে নিজেই কীবোর্ড তুলে নিলাম। এ প্রসঙ্গে ফেসবুক, ব্লগ এসব নানা সূত্রে কথা হল অনেক বিশেষজ্ঞের সাথে। সে সব আলোচনা থেকে নিজের ভাবনাগুলো আরেকটু গুছিয়ে নেওয়ার সুযোগ পেয়েছি। সেই ভাবনাগুলো আর সংশ্লিষ্ঠ কিছু প্রস্তাবনা তুলে ধরতেই এই লেখা।
এ উদ্যোগের প্রচার যারা করেছেন তারা অনেকে এটিকে উপস্থাপন করেছেন অনেকটা এভাবে- অন্য কোনো ভাষা থেকে বাংলায় মেশিন ট্রান্সলেশনের ভালো প্রযুক্তি নেই। এমনকি গুগলের ট্রান্সলেটও এখনো খুব পাকা নয়। আমরা সবাই মিলে যদি গুগল ট্রান্সলেটরকে শব্দ বাক্যাংশ ইত্যাদি দিয়ে সহায়তা করি এতে গুগলের কিছু উপকার হবে, আর আমাদের উপকার হবে আরো বেশী। কারণ পৃথিবীর যেকোনো ভাষার কন্টেন্ট আমরা গুগল ট্রান্সলেটর দিয়ে অনুবাদ করিয়ে নিতে পারব। অন্যরাও আমাদের কথা বুঝবে আরো সহজে। আর গুগলের এই সার্ভিস তো ‘ফ্রি’!
গুগলকে সাহায্য করার উপায় খোলা থাকে সারা বছর। আপনি গুগল ট্রান্সলেট ব্যবহার করে কিছু অনুবাদ করলেই দেখবেন ফিডব্যাক দেবার উপায় আছে। পছন্দ না হলে সঠিক অনুবাদটি যুক্ত করার অপশনও আছে। এভাবে ফিডব্যাক নিয়ে গুগল অনেক দূর এগিয়ে যাক তাতে আমাদের কারো আপত্তি নেই। কিন্তু যখন, একটা অনুষ্ঠানকে ‘বাংলার জন্য চারলাখ’ হিসাবে প্রচার করা হয় এবং মানুষের আবেগ অনুভুতিকে নাড়া দিতে মহান স্বাধীনতা দিবসকে বেছে নেওয়া হয় তখন ব্যাপারটাকে আরেকটু খতিয়ে দেখা প্রয়োজন।
প্রথমত বিনে পয়সায় মানেই ফ্রী না। গুগল বা ফেসবুক তাদের সার্ভিসগুলো আমাদেরকে ‘বিনে পয়সায়’ ব্যবহার করতে দেয় কারণ বিনিময়ে আমাদের হাড়ির খবর নাড়ীর খবর সব তার জানা হয়ে যায় বলেই। ফলে আরো সুনিপুন ভাবে আমাদেরকে সে তার বিজ্ঞাপনের এবং মনোবিশ্লেষণের শিকার বানাতে পারে। ফ্রি সফটওয়ার আন্দোলনের অগ্রদূত রিচার্ড স্টলম্যানের ভাষায়, “এসব সার্ভিস ‘ফ্রি’ ব্যবহার করার মূল্য আমরা দেই আমাদের ‘ফ্রিডম’ বা ‘স্বাধীনতার’ বিনিময়ে”। স্বাধীনতা দিবসের কার্যক্রম হিসাবে এ ধরনের তথাকথিত ‘ফ্রি' সার্ভিস দাতা গুগলকে সাহায্য করাটা তাই বেশ আইরনিক-ই।
ব্যাপারটা আরেকটু ব্যাখ্যা করতে উইকিপিডিয়ার সাথে তুলনা করি। এটিও বৃহৎ একটি আয়োজন। এর প্রতিটি পাতা চাইলে আপনি, আমি, যে কেউ, সম্পাদনা ও ডাউনলোড করতে পারি এবং আমাদের গবেষণার কাজে ব্যবহার করতে পারি। এমনকি যে wiki সফটওয়ার এর সাহায্যে সাইটটি চলে সেটিও চাইলে আমরা ডাউনলোড করে নিজের কম্পিউটারে চালাতে পারি। এমনকি সফটওয়ারটা আসলেই কী করছে তার সোর্স কোডের প্রতিটি লাইন খুঁটিয়ে দেখতে পারি। উইকিপিডিয়ার পাতাগুলোও মানুষের স্বতঃস্ফূর্থ এবং বিনা পারিশ্রমিকের অবদানে সমৃদ্ধ হয়। কিন্তু তার বিনিময়ে আমাদের স্বাধীনতায় হস্তক্ষেপ করা হয় না বা আমাদেরকে কোনো বিজ্ঞাপনের ও মনোবিশ্লেষণের সুনিপুন টার্গেটে পরিণত করা হয় না।
গুগলকে আমাদের ব্যক্তিগত যোগাযোগ সহ সবকিছুর এক্সেস আমরা দিয়েই রেখেছি। এখন সেসব বোঝার উপায়ও আগবাড়িয়ে তাদের শিখিয়ে দিচ্ছি। যেহেতু সরকারের একজন প্রতিমন্ত্রী এই অনুষ্ঠানের প্রচারণায় ছিলেন সেহেতু এখানে উল্লেখ করার প্রয়োজন বোধ করছি যে, বিদেশি রাষ্ট্রগুলো কোনো দেশের রাজনীতির হাওয়া কোনদিকে যাচ্ছে। কোথায় সামরিক অভ্যুত্থান করানো দরকার। কোথায় বিশৃংখলায় মদদ দেওয়া দরকার এসব লক্ষণ এসব স্যোশাল মিডিয়া টাইপ তথ্য বিশ্লেষণ করে খুব অ্যাকুরেট ভাবে নির্ধারণ করতে পারে। কম্পিউটার বিজ্ঞানের বড় বড় শাখাই আছে এসব বিশ্লেষণের উদ্দেশ্যে। আমরা আজ গুগলকে বাড়তি সাহায্য না করলে এটা থেমে থাকত না। কিন্তু নিশ্চিতভাবেই তাদের ১০ বছরের কাজ এক উৎসব করে এক দিনে এগিয়ে দিচ্ছি। এডোয়ার্ড স্নোডেন কর্তৃক ফাঁস করা তথ্য থেকে জানি যে সব বড় স্যোশাল মিডিয়ার উপাত্তই আসলে একই জায়গায় গিয়ে হাজির হয়। যাই হোক, এটা একটা প্রাসঙ্গিক কথা হলেও এই অনুষ্ঠানের বিপরীতে মূল বক্তব্য নয়। স্রেফ গুগলকে খুব গুডবয় না ভাবার ব্যাপারে এটা এক সতর্কতা। গুগল তাদের এত চমৎকার সব সার্ভিস আমাদের ‘জনকল্যাণ' করার জন্য দেয় না। তারা এ থেকে বহুগুণে লাভ করে। আমরা তাদের থেকে সার্ভিস নিয়ে ধন্য হচ্ছি না। তারা আমাদেরকে সার্ভিস দিতে পেরে যুগপৎ ধন্য এবং বহুকোটি ডলারে লাভবান হচ্ছে। তাই এভাবে সরকারী পৃষ্টপোষকতা দেবার বিনিময়ে গুগল থেকে আরো অনেক ধরনের আর্থিক এবং অবকাঠামোগত সহায়তার অঙ্গীকার নিয়ে নেওয়া যেত।
গুগল একটা জায়ান্ট কোম্পানি। তাকে কোনো বাজারে ফ্রি এক্সেস দিলে সেখানে আর কারো গড়ে ওঠা মুশকিল। চীনের বাইদু (baidu.com) গুগলের সাথে পাল্লাপাল্লি দেবার মত বড় কোম্পানি হতে পেরেছে কারণ তারা গুগলকে ফ্রী পাস দিয়ে দেয়নি বলেই। আমাদের দেশেও এমন উদ্যোগ হয়েছে। পিপিলিকা ডট কম (pipilika.com) নামক বাংলা সার্চ ইঞ্জিন তৈরি করেছেন শাহজালাল বিজ্ঞান ও প্রযুক্তি বিশ্ববিদ্যালয়ের গবেষক দল। এ ছাড়া বিশ্ববিদ্যালয় পর্যায়ে বাংলা নিয়ে গবেষণা করছেন আরো অনেকেই। আমাদের দেশে অনলাইন কেনাকাটা সহ অনলাইন ট্রাঞ্জেকশনের সুবিধা ক্রমেই বাড়ছে। এরকম পরিবেশে দেশী একটা সার্চ ইঞ্জিনের গড়ে ওঠার সুযোগ সৃষ্টি করতে পারতো সরকার। পৃথিবীতে বাংলাভাষী জনগোষ্ঠি সংখ্যার দিক দিয়ে চতুর্থ। এমন বিপুল একটা মার্কেটে গুগলকে কেন ফ্রি পাস দিচ্ছি? পিপিলিকা বা অন্য কাউকে বাইদুর মত বড় হয়ে ওঠার পরিবেশ দেবার দায়িত্ব আমাদেরই। স্বদেশী উদ্যোক্তা সৃষ্টির জন্য শুধু তরুণ-তরুণীদের উৎসাহ দিলেই হবে না,যথাযথ পরিবেশও সৃষ্টি করতে হবে। আমি হলফ করে বলতে পারি, বাংলা সার্চ ইঞ্জিনকে পৃষ্টপোষকতা দিলে এই ডোমেইনে গুগলের সাথে টেক্কা দেবার মত প্রতিষ্ঠান ১০ বছরের মধ্যে গড়ে উঠবে। গুগলও শুরুতে দুজন বিশ্ববিদ্যালয় পড়ুয়া ছাত্রের প্রোজেক্ট ছিলো। সেটাকে তাদের সরকার এবং বড় বড় প্রতিষ্ঠান প্রাথমিক সহযোগিতা দিয়েই আজ এ অবস্থায় এনেছে। যুক্তরাষ্ট্রের যত শক্তি, সবই তার এ ধরনের বড় বড় ব্যবসা প্রতিষ্ঠানের কল্যাণে। আমাদেরকে একটা শক্তিশালী রাষ্ট্র হিসাবে গড়ে উঠতে হলে আমদেরও এমন বৃহৎ ব্যবসা/গবেষণা প্রতিষ্ঠান লাগবে। তার জন্যে গুগলকে গুরু মেনে বসে থাকলেই চলবে না।
তবে সবচেয়ে বেশি মর্মাহত হয়েছি এই আয়োজনের থেকে প্রাপ্ত করপাস (ভাষা বিষয়ক উপাত্ত) উন্মুক্ত নয় দেখে। আমরা আমাদের স্বাধীনতা দিবসকে ব্যবহার করতে দিলাম। তার বিনিময়ে আমাদেরই ইনপুট দেওয়া তথ্য অবশ্যই উন্মুক্ত রাখা উচিত ছিল। যেন বাংলা নিয়ে গবেষণারত যে কেউ তার নাগাল পায়। যারা কখনো কম্পিউটারের মাধ্যমে মানুষের ভাষা বিশ্লেষণের গবেষণা করেছেন তারা সবাই একমত হবেন যে এ গবেষণায় একটা বড় আকারের করপাস পাওয়াই সবচেয়ে দুরূহ ধাপ। বাকি সব বিশ্লেষণের উপায় নিয়ে হাতের নাগালে হাজার হাজার গবেষণাপত্র আছে। আমাদের দেশের এ বিষয়ক গবেষক দলরাও এই ধাপে এসেই করপাসের অভাবে হোঁচট খেয়েছে বার বার। করপাস উন্মুক্ত করা হয়নি বলে ‘বাংলার জন্য চার লাখ’ অনুষ্ঠানটি আসলে হয়ে গেছে ‘গুগলের জন্য চার লাখ’। গুগল ট্রান্সলেটর আমরা কতটা ব্যবহার করব জানি না। গুগল আমাদের ভাষাটা আমাদের উপর উপর্যুপরি ব্যবহার করবে। আমারদের প্রতিটি কথা, প্রতিটি লেখা, প্রতিটি সংবাদ পড়ে বোঝার অস্ত্র আমরা তুলে দিয়েছি/দিচ্ছি গুগলের হাতে। গুডবয় ইমেজ নিয়ে থাকলেও গুগল শেষ পর্যন্ত একটা সুবৃহৎ করপোরেট প্রতিষ্ঠান। তাদেরকে ‘ভলেন্টিয়ারলি' সাহায্য করার সিদ্ধান্ত আমরা নিতেই পারি। কিন্তু এটা করতে গিয়ে আমরা আসলে কী দিচ্ছি আর বিনিময়ে আসলে কী পাচ্ছি তা সবার কাছে সহজ ভাষায় উল্লেখ করা প্রয়োজন।
এই উদ্যোগ আয়োজনে যারা জড়িত তারা যদি প্রকৃতই বাংলার জন্য, বাংলা ভাষার জন্য কিছু করতে চান, তাহলে একটা কাজ করতে পারেন। আর তা হলো, পরবর্তীতে বড় কোনো প্রতিষ্ঠান যারা সরকারি প্রত্যক্ষ পৃষ্টপোষকতায় আমাদের ২১শে ফেব্রুয়ারী, আমাদের ২৬শে মার্চ, আমাদের ১লা বৈশাখ, আমাদের ১৬ই ডিসেম্বরের অনুষ্ঠানে আমাদের থেকেই তাদের অতিপ্রয়োজনীয় (এবং অতিমূল্যবান) উপাত্ত সংগ্রহ করবেন, তাদেরকে সেই করপাস উন্মুক্ত করার শর্ত দিয়ে। এমন উপাত্ত আমাদের ভাষা নিয়ে গবেষণার জন্য খুবই প্রয়োজন। শুধুমাত্র সবার জন্য এই গবেষণার দুয়ার উন্মুক্ত করতে পারলেই বলা যাবে ‘বাংলার জন্য কিছু করা’ হলো। সংশ্লিষ্ট সবাই আশাকরি এটা ভেবে দেখবেন।
বিভিন্ন ফোরামে এ নিয়ে আলোচনা করতে গিয়ে কিছু অপযুক্তির সম্মুখীন হয়েছি। লেখাটি পাঠের পর সেসব কথা অবধারিত ভাবে আবারো উচ্চারিত হবে। তাই, যুক্তি খন্ডনের পুনরাবর্তন এড়াতে এখানে সেগুলো একে একে খন্ডন করে যুক্ত করছি।
১) ঘরে নাই চুলা, তর্ক চলছে মাছের পেটিটা কে খাবে সেটা নিয়ে!
উত্তর- এটা খুবই গুরত্বপূর্ণ একটা মন্তব্য। ঠিক এইরকম চিন্তাধারা থেকেই যা কিছু বৃহৎ যা কিছু ঘরের বাইরের সব কিছুর থেকেই আমরা মুখ ফিরিয়ে রেখেছি। ঘরের চুলা না থাকলে সেই চুলা বানানোর ব্যবস্থা করতে হবে। মূল লেখাতে উল্লেখ করেছি আমাদের স্বদেশী পিপীলিকা একটা পূর্ণাংগ সার্চ ইঞ্জিন। আর এটি SUST এর গবেষকদল বানিয়েছেন গুগলের মত কোনো নিগুড় ব্যবসায়িক স্বার্থে নয় বরং বাংলার জন্য কিছু করার উদ্দেশ্যেই। সরকারি পৃষ্টপোষকতা এবং আমাদের আবেগের ও প্রাণের দিবসগুলো ব্যবহার করে মানুষের সহযোগিতা আদায়ের অধিকার যদি কারো থাকে তা আমাদের এই স্বদেশী উদ্যোগগুলোর। বাংলা নিয়ে এধরনের আরো অনেক কাজ হচ্ছে বিভিন্ন বিশ্ববিদ্যালয় এবং সফটওয়ার প্রতিষ্ঠানে। কেবল মাত্র এসব অনুষ্ঠানে সংগ্রহীত করপাস উন্মুক্ত করার শর্ত থাকলে বাংলা ভাষা প্রকৃতপক্ষে উপকৃত হত। এখনো গুগলের কাছে এই উন্মুক্তকরনের দাবি তোলা যায় বা ভবিষৎ আয়োজনের আগে এ ধরনের শর্ত আরোপ করা যায়। আর গুগলকেই বা কি দরকার? SUST সহ BUETএর অনেক গবেষক দল, পুরো বাংলাদেশের পরীক্ষার রেজাল্ট, ভার্সিটি ভর্তির ফর্ম বিতরণের মত বড় আকারের অনলাইন কার্যক্রম সফল ভাবে পরিচালনা করেছেন। তাদের এ ধরনের কারিগরি দক্ষতা আছে। সরকারী পৃষ্ঠপোষকতা থাকলে বাংলার জন্য এমন একটা করপাস আমরা নিজেরাই করে নিতে পারি। কারণ, পৃথিবীর প্রতিটা বড় জাতি নিজেদের গবেষণা নিজেরাই করে। বড় হতে সে পথে হাঁটতে হবে আমাদেরও।
২) গুগল তো ফ্রী দিচ্ছে ট্রান্সলেট করতে। আমরা তো বিনে পয়সায় ব্যবহার করতে পারব সব। তাহলে এ নিয়ে এত সমালোচনা কেন?
উত্তর- আবারো উল্লেখ করি। বিনেপয়সায় মানেই ফ্রী না। গুগল কোনো দানছত্র খুলে বসেনি। স্বাধীনতা দিবসকে কাজে লাগিয়ে আপনার আবেগকে পুঁজি করার বিনিময়ে তারা আসলে কী নিয়ে নিচ্ছে তা নিয়ে প্রশ্ন করুণ। বাংলার জন্য আপনার ভালোবাসা থাকবেই। আপনি বাঙালী। কিন্তু গুগল বাঙালী না। তার উদ্যোগ করপোরেট স্বার্থোদ্ধারের জন্যই। আর উপরের লেখাতেই নিজের স্বাধীনতা বড় করপোরেটের হাতে তুলে দেবার বিপদ সম্পর্কে একটু বলেছি। এ প্রসঙ্গটি এত বড় যে ভবিষ্যত কোনো লেখায় শুধু এই ধরনের “ফ্রি সার্ভিসের দাম নিজের স্বাধীনতা দিয়ে চোকানোর” ব্যাপারটি আলোচনা করব। অনলাইনেও এ নিয়ে প্রচুর লেখালিখি আছে।
সংযুক্তি: পাঠক মন্তব্য সূত্রে জানতে পারলাম Google Translate API এমনকি বিনে পয়সায় ব্যবহারও করা যায় না। অর্থের বিনিময়ে এটাকে ব্যবহার করতে হয়। তাই যারা গুগল ট্রান্সলেটের সাহায্যে সারাদুনিয়ার অনেক কন্টেন্ট বাংলায় অনুবাদ করে বাংলাকে সমৃদ্ধ করে ফেলার স্বপ্ন দেখছিলেন সেখানেও ফাকি!
৩) বলছেন গুগল, বৃহৎ করপোরেট, এসব এত খারাপ, তাহলে কেন সকাল বিকেল ফেসবুকে পড়ে থাকেন? কেন জিমেইল আর গুগল সার্চ ছাড়া আপনার এক মুহুর্ত চলে না?
উত্তর- কোনো প্রতিষ্ঠানের সার্ভিস ব্যবহার করি বলেই কখনো তার কোনো কাজের সমালোচনা করা যাবে না এমন বুদ্ধি যার তার জন্য এই লেখা নয়।
৪) সরকারই বা কত টাকার পৃষ্ঠপোষকতা দিয়েছে যে এর বিরুদ্ধে এমন হামলে পড়তে হবে?
উত্তর- পৃষ্ঠপোষকতা হিসাবে সরকার যেটা দিয়েছে তার মূল্য আসলে টাকা দিয়ে বিচার করা যায় না। তবুও, আমাদের মহান স্বাধীনতা দিবসকে একটা বিদেশি কোম্পানির (হ্যাঁ গুগল অনেক ভালো কিন্তু এটা স্রেফ একটা বিদেশি কোম্পানি) নিজস্ব সার্থে ব্যবহার করতে দেওয়া এবং সরকারী একজন প্রতিমন্ত্রির সেই আয়োজনের বিজ্ঞাপনে অংশনেওয়ার অর্থমূল্য গুগলের এনালিস্টরা হয়তো নির্ধারণ করতে পারবে। এ আয়োজনের থেকে সংগ্রহীত ডাটা যেহেতু আমাদেরই দেওয়া সেটা আমাদের সবার জন্য উন্মুক্ত করে দেওয়া হলে এতটা আক্ষেপ থাকতো না। আশাকরি ভবিষ্যত উদ্যোগগুলোতে উন্মুক্ত করা হবে।
৫) আমাদের কোনো প্রফেসর, গবেষক, বা কোনো কোম্পানি পারলে এসব করুক?
উত্তর- করবে কীভাবে? এতবড় গাছে ছায়া আগবাড়িয়ে টেনে আনলে সেই ছায়ায় কোনো চারা গজাবে না। তাও, আমাদের স্বদেশী পিপীলিকা সহ বাংলা নিয়ে অনেক সফল কাজ অনেকেই করেছেন। সবাই মিলে একটা উন্মুক্ত করপাস করাটা তাই সময়ের দাবি। আমাদের সৃষ্ট করপাসের উপর গুগলকে একচ্ছত্র অধিকার দিয়ে আমাদের কোনো দীর্ঘ মেয়াদী উপকার হচ্ছে না। সরকার গুগলকে পৃষ্ঠপোষকতা না দিয়ে বরং স্বদেশী গবেষণাকে পৃষ্ঠপোষকতা দিলেই (করপাস উন্মুক্তকরনের মাধ্যমে, বা আর্থিক প্রণোদনা দিয়ে) সেটাকে ‘বাংলার জন্য’ কিছু করা হিসাবে নাম দেওয়া যায়। তার আগ পর্যন্ত এই আয়োজন স্রেফ ‘গুগলের জন্য চার লাখ’। কুড়ালকে কুড়াল বলাই শ্রেয়। অন্তত গুগগলকে শর্ত দেওয়া যেত বাংলা নিয়ে স্বদেশী গবেষণায় ফান্ড দেবার জন্য।
৬) বাংলায় অনলাইন ব্যবহারকারী নেই। এ নিয়ে গুগলের কাজ করে আসলে লাভ নেই। তবু ওরা যে এতটুকু করেছে তাতেই তো আমরা ধন্য!
উত্তর- আপনি কি ভাবছেন বাংলাদেশ চিরকাল এমনই থাকবে? আমাদের প্রায় প্রতিটি মানুষের নাগালের মধ্যে আমরা তথ্য প্রযুক্তি নিয়ে যেতে পেরেছি। আমাদের অর্থনৈতিক উন্নতি হচ্ছে প্রতিদিনই। কয়েক বছরের মধ্যেই সবার অংশগ্রহনের মাধ্যমে আমরা একটা প্রযুক্তিনির্ভর রাষ্ট্রে পরিণত হবো। সরকারের ২০২০ ভিশনও তাই বলে। এমন অবস্থায় গুগল সহ সকল বৃহৎ প্রযুক্তি প্রতিষ্ঠান আমাদের এই মার্কেটে এগিয়ে থাকতে চাইবেই। আজকের আপাত অলাভজনক প্রোজেক্ট ভবিষ্যতের বিলিয়ন ডলারের মার্কেটে ঢোকার একটা দরজা মাত্র। সেই দরজা কারো জন্য খুলে দিতে চাইলে অন্তত বিনিময়ে তারা যেন সঠিক মূল্য পরিশোধ করে সেটা নিশ্চিত আমাদেরই করতে হবে। আগেই বলেছি, করপাস উন্মুক্ত করণ এবং দেশীয় বিভিন্ন বিশ্ববিদ্যালয়গুলোকে বাংলা নিয়ে গবেষণার ফান্ডিংএর অঙ্গিকার এই দুই উপায়ে গুগল সে দাম পরিশোধ করতে পারে। বিনে পয়সায় দুপাতা যান্ত্রিক অনুবাদ করতে দিয়ে আমাদের ভাষার দাম শোধ হবার নয়।
৭) আচ্ছা, গুগলের জন্য না হয় ৪ লাখ করেছি। ভবিষ্যতে দেশি কেউ আসলে তার জন্য ১৪ লাখ করবো, হয়েছে?
উত্তর- এসব বলে অপ্রিতিকর প্রশ্নবান আপাত বন্ধ করা যায়। কিন্তু একটা ভিনদেশী সুবৃহৎ কোম্পানিকে আমাদের আবেগকে ম্যানিপুলেট করে নিজ সার্থে আমাদের স্বাধীনতা দিবসকে ব্যবহার করতে দেওয়া জাস্টিফাই করা যায় না। স্বদেশী আয়োজনের জন্য আমরা ৪ লাখ কেন দরকার হয় ৪ কোটি শব্দ / বাক্যাংশ যুক্ত করব। কিন্তু এখন যে হাতের চার লাখ সেটা নিয়ে যথেষ্ট আলোচনা সমালোচনা এবং বিশ্লেষণ না হলে আরো অনেক কিছুই এরা করে নেবে আমাদের অজান্তে। আবারো বলি গুগল দানছত্র খুলে বসেনি। এটা উইকিপিডিয়া নয়। ইন ফ্যাক্ট যদি এই আয়োজনকে কাজে লাগিয়ে উইকিপিডিয়া অনুবাদযজ্ঞ করা হত তাহলেও কাজটা দারুণ হতো।
প্রস্তাবনাটা এমন। ইংরেজী উইকিপিডিয়ার বিভিন্ন বাক্য / বাক্যাংশ বিচ্ছিন্ন ভাবে মানুষের সামনে উপস্থাপন করা হবে। গুগলের এই ইণ্টারফেসটার মত করেই। তারা সেটা অনুবাদ করবে নিজেদের মত করে। স্ট্যাটিস্টিক্যাল ভ্যালিডেশন এর পরে যান্ত্রিকভাবেই অনুবাদ করা বাংলা আর্টিকেল সয়ংক্রিয়ভাবে পুনর্নির্মান করা হবে এবং সেটা যুক্ত হবে বাংলা উইকিপিডিয়ায়। এ ছাড়া এই কার্যক্রমের সময় সংগ্রহীত উপাত্ত উন্মুক্ত করে রাখা হবে ভবিষ্যতে বাংলা নিয়ে গবেষণা ইচ্ছুক যে কারো নাগালের মধ্যেই।…
সংযুক্তি:- বাংলা-ইংরেজী যান্ত্রিকঅনুবাদক নিয়ে ওপেন সোর্স কাজ আগেও হয়েছে, এবং বেশ কিছু প্রোজেক্ট এখনো চলছে, যেমন, apertium যা সম্পূর্ণ ওপেন সোর্স সোর্স লিঙ্ক। একটি উন্মুক্ত করপাস পেলে দেশী গবেষকদের করা এই প্রোজেক্টগুলো নিঃসন্দেহে উপকৃত হতো।
পরিশিষ্ট-
বাংলা আমাদের মায়ের ভাষা। এই ভাষার জন্য আমরা প্রাণ দিয়েছি। আমাদের স্বাধীনতার বীজ বপন হয়েছে এই ভাষার প্রতি ভালোবাসা থেকেই। পৃথিবীর সকল জাতিই নিজের মাতৃভাষার প্রতি টান অনুভব করে। কিন্তু সেই টান আমাদের মধ্যে আরো গভীরে প্রোথিত। আমাদের দেশটার নামই যে বাংলাদেশ! আর তাই তো বাংলার জন্য কাজ করার কথা বললে লাখো ভলেন্টিয়ার ঝাঁপিয়ে পড়েন প্রাণের সবটুকু আবেগ নিয়ে। আসুন এই আবেগটাকে কোনো কোম্পানির পুঁজি করতে দেবার বদলে সত্যি সত্যি দেশের কাজে লাগাই। বাংলা নিয়ে বাংলা ভাষা নিয়ে বর্তমান এবং অনাগত সব স্বদেশী গবেষণার পথ খুলে দিতে নিজেদের একটি উন্মুক্ত করপাস গড়ে তুলি। এভাবে গঠিত উন্মুক্ত করপাস থেকে বিদেশি কোম্পানিরাও উপকৃত হবে কিন্তু তার উপর একচ্ছত্র অধিকার দাবি করতে পারবে না। স্বাধীনতার মাসে নিজের ভাষার এই স্বাধীনতাটুকু রক্ষা করতে আমরা সোচ্চার হই।
মন্তব্য
মেরেছে
শ দুয়েক যোগ আর শখানেক চেক করেছিলাম। বাদ দিলাম আপাতত
লেখাই
একটি শব্দও যোগ করিনি। আমার কাছে আমাদের হাঁড়ির খবর জেনে নেয়ার কারণটাই বেশি গুরুত্বপূর্ণ মনে হয়েছে।
এরকম করে কোন কিছুর গভীরে গিয়ে চিন্তা করার মানুষ আমাদের খুব কম। এটা আমাদের একটি বড় দুর্বলতা। লেখাটির জন্য অসংখ্য ধন্যবাদ।
১। সরকারীভাবে গুগলের সাথে কাজ করার আহ্বান দেখে আমার মনে হয়েছে এইটা একটা নেগোশিয়েশনের অংশ হতে পারে। প্রতিটি দেশের সরকারকেই নিয়মিত গুগল ফেসবুকের কাছে তথ্য চাইতে হয়, বিশেষত গোয়েন্দা বিভাগের জন্য। গুগল ফেসবুক সহজে বাংলাদেশ সরকারের কাছে তথ্য দিতে আগ্রহী হওয়ার কথা নয়, বাংলাদেশের নেগোশিয়েসন পাওয়ার স্বল্প। হয়তো পেছনে চুক্তি হয়েছে তথ্যের বিনিময়ে গুগল ট্রান্সলেট প্রজেক্টে সরকারী এন্ডোর্সমেন্টের।
২। ট্রান্সলেট প্রজেক্ট একটি বিপুল ইকোসিস্টেমের অংশ। এইটা সমৃদ্ধ হলে জিমেইল, এন্ড্রোয়েড ওএস, ইউট্যুব, সার্চ এঞ্জিন, গুগল বুকস ইত্যাদিতে বাংলার অবস্থান ধাঁই করে উঠে যাবে। গুগল ট্রান্সলেটের এই বৃহত্তর ইম্প্যাক্ট ভুললে চলবে না।
৩। গুগল ট্রান্সলেটকে আমরা সমৃদ্ধ না করে স্থানীয় পিপীলিকা টিম বা এরকম উদ্যোগকে পৃষ্ঠপোষকতা করতে পারি, তার পেছনে যৌক্তিক কারণও রয়েছে যেমনটি আপনি বলেছেন। তবেঃ
এইখানে মাথা নাড়লাম। আমরা অনলাইনে বাংলার খুঁটি যত শক্ত করব (তা সে গুগল বা পিপীলিকা বা যেভাবেই হোক) গুগল তথা যুক্তরাষ্ট্র ততই দ্রুত আমাদের প্রতিটি লেখা সংবাদ বুঝে ফেলার উপায় বের করবে। গুগল ট্রান্সলেট প্রজেক্ট বয়কট করে এইটা আটকানো সম্ভব নয়। বাংলাদেশ গরীব দেশ কিন্তু জিওপলিটিকালি এই দেশে লোক কি ভাবছে কি লিখছে তা জানা যুক্তরাষ্ট্রের প্রয়োজন।
৪। উপাত্তের বান্দরামীর বিষয়ে সহমত। সরকার গুগলকে বাধ্য করতে পারে উন্মুক্ত না হলেও উপাত্ত অন্তত দেশের বিশ্ববিদ্যালয় পর্যায়ে গবেষণার জন্য যেন পাওয়া যায়। মার্কেট এক্সেসের কথাটা সম্পূর্ণ সত্য, গুগল এই কাজ করছে আমাদের কয়েক বিলিওন ভবিষ্যত ব্যবহারকারীর মার্কেটের কথা মাথায় রেখে, তার যোগ্য দাম নেওয়া চাই।
৫। ভারত একসময় নিজেদের গাড়ি ছাড়া কিছু চলতে দিত না তাদের রাস্তায়। পরে যখন জাপানী কোম্পানীকে ঢুকতে দিল, তারা বাধ্য ছিল একটি ভারতীয় অটো কোম্পানীর সাথে মিলে কাজ করতে, যেন দেশীয় কোম্পানী টিকে থাকতে পারে কম্পিটিশনে। ক্যানাডায় কিছু শহরে ওয়ালমার্ট স্থানীয় মিউনিসিপ্যালিটিকে পয়সা দেয়, যে টাকার অংশ ভর্তুকি হিসেবে সেই ওয়ালমার্টের আশপাশের ছোট দোকানপাট পায় প্রতিবছর। অর্থাৎ মার্কেট এক্সেস দেব, কিন্তু যদি লোকাল মার্কেট ডিসরাপ্ট কর তাহলে পয়সা গুণতে হবে। আমরা এই পদক্ষেপ নেবার কথা ভেবে দেখতে পারি, গুগল স্থানীয় কোম্পানী/বিশ্ববিদ্যালয়ের সাথে যৌথভাবে কাজ করতে হবে ডেটা পেতে হলে।
..................................................................
#Banshibir.
আসলে প্রসঙ্গটি গুগলট্রান্সলেটকে বয়কট করার উদ্দেশ্যে বলিনি। সবাই যে গুগলকে 'ফেরেশতার আসনে' বসিয়ে রেখেছে সেই প্রসঙ্গে বলেছি। প্রথমে এই সমস্যার সম্ভাব্য খারাপ দিকগুলো আমাদের স্বীকার করতে হবে। তারপর তা নিয়ে কী করা যায় সেই ভাবনা।
আর লেখার মূল দাবী হচ্ছে আমদের দেওয়া ইনপুট আমাদের জন্য এক্সেসিবল নয় কেন? স্বাধীনতাদিবস উপলক্ষে গুগল যে সুযোগ পেল সেই সুযোগ এদেশের সকলের প্রাপ্য। চাইলেই করপাস উন্মুক্ত করণের শর্ত আরোপ করা যেত। সেই সঙ্গে বাংলা নিয়ে গবেষণার ফান্ডিং। খুব দামি একটা জিনিষ একেবারে বিনে পয়সায় দিয়ে দিলাম আমরা।
আশা করি পরবর্তী ক্রাউড সোর্সিং কার্যক্রম আয়োজনের সময় সংশ্লিষ্ঠরা এসব ব্যাপার মাথায় রাখবেন।
ইচ্ছার আগুনে জ্বলছি...
নেগসিয়েশনের বাংলাদেশের ক্ষমতা সীমিত এটা সত্য। তবে ন্যুনতমপক্ষে যে এন্ট্রিগুলো ঢোকানো হচ্ছে সেটার একটা কপি বাংলাদেশের বিশ্ববিদ্যালয়গুলো বা গবেষকেরা পেতে পারতো। এটা একটা উইন উইন সিচুয়েশন তৈরি করতো।
নীড়পাতা.কম ব্লগকুঠি
পোস্ট এবং পীরবাবার মন্তব্যে অনেক কিছু জানা গেল।
সাত লাখের খবরটা পড়েছিলাম এবং এতে অংশ না নেয়ায় এট্টু ক্ষোভ জমেছিল।
আশা করবো ভবিষ্যতে এসব কাজে আবেগ না, জাতীয় স্বার্থকে সবার আগে বিবেচনায় আনা হবে।
পোস্টের জন্য ধন্যবাদ ভাইয়া।
চিরার্ড নয় রিচার্ড স্টলম্যান হবে। লেখা ভালো লেগেছে!
ধন্যবাদ! এই ধ্বনিবিপর্যয় ক্যামনে ঘটে গেল খেয়ালই করিনি! কয়েকবার রিভিশনও দিয়েছিলাম...
ইচ্ছার আগুনে জ্বলছি...
দুনিয়াদারি কীভাবে চলতেছে সে বিষয়ে আমাদের এবং সরকারের নীতি নির্ধারকদের খুব স্পষ্ট ধারনা আছে বলে মনে হয়না!
লেখায় সহমত।
______________________
নিজের ভেতর কোথায় সে তীব্র মানুষ!
অক্ষর যাপন
এত সময় নিয়ে গুছিয়ে লেখার জন্য ধন্যবাদ।
লেখাটি পত্রিকার সম্পাদকীয় বিভাগে প্রকাশের জন্য পাঠাতে অনুরোধ করছি। এতে করে বেশি মানুষ জানতে পারবে।
সম্প্রতি এ নিয়ে রাগিব হাসানের পোস্টে এই কথাটাই বলতে গিয়েছিলাম। আপনি যেসব পয়েন্ট তুলে ধরেছেন সেগুলোই তিনি বলেছেন আসলে। নিজেকে গবেষক দাবী করা উনার পয়েন্টগুলো পড়ে যারপরনাই হতাশ হয়েছি।
আমি শুনেছিলাম যে কর্পাসটা উন্মুক্ত থাকবে। আপনার লেখা পড়ে বুঝলাম যে, আমি ভুল জানতাম। করপাস উন্মুক্ত না রাখলে পুরো ব্যাপারটায় বাংলাদেশের রাষ্ট্র হিসেবে এতো প্রোঅ্যাকটিভ স্ট্যান্সের কারণটা বুঝলাম না। আগামীকাল যদি মাইক্রোসফট, পরশু ইয়াহু, আর তার পরেরদিন ফেসবুক যদি হুবহু একই উদ্দেশ্যে সরকারের সাহায্য চায়, সরকার কি করবে? সাহায্য না করলে কীসের বেসিসে সে সিদ্ধান্ত নিবে? কারণ ব্যবহারকারীর সংখ্যার দিক দিয়ে এরা কেউই ফেলনা না। শুধুমাত্র একটি নির্দিষ্ট, পুরোদস্তুর কর্পোরেট কোম্পানিকে সাহায্য করার ভিত্তিটা আসলে কী?
আরেকটা ব্যাপার, আপনি উল্লেখ করেননি, হয়তো সম্ভাব্যতা কম দেখেই- তবু আমি একদম উড়িয়ে দিতে পারছি না। গুগল কিন্তু নানা সময়েই অনেক প্রোডাক্ট বন্ধ করে দিয়েছে। তাদের কিন্তু প্রোডাক্ট কন্টিনিউ করার ক্ষেত্রে কোনো দায়বদ্ধতা নেই। গুগল ওয়েভ, গুগল টক, গুগল টুলবার সহ অনেক প্রোজেক্টের কথা এই মুহূর্তেই মনে পড়ছে, যেগুলি বন্ধ হয়ে গেছে। সম্ভাব্যতা কম হতে পারে, কিন্তু গুগল ট্রান্সলেশন যে বন্ধ হবে না তার নিশ্চয়তা কী?
আমার অবস্থানটাও আপনার মতো। গুগলের ট্রান্সলেশন এফিশিয়েন্ট হলে, সেইটা আমার জন্যেও সুবিধাজনক হবে। কিন্তু এইটা কোনো একতরফা লাভ, কিংবা গুগলের চ্যারিটি না। আমরাই বরং প্রায় পানির দরে নিজেদের স্বার্থটুকু ছেড়ে দিলাম।
অলমিতি বিস্তারেণ
সবচেয়ে বড় কথা। এই করপাস, 'শুধু ট্রানশ্লেসন' এর জন্য ব্যবহার হবে না। বরং, বাংলার সকল ডকুমেন্ট বিশ্লেষণ এর জন্যেও ব্যবহৃত হবে। ফলে ট্রান্সলেশন সার্ভিস বন্ধ হয়ে গেলেও, এই কর্পাসের উপযোগিতা থাকবে গুগলের কাছে। এবং সময়ের সাথে সাথে উপযোগীতা বাড়তেই থাকবে...
কী দারুণ একটা ব্যাপার হতো কর্পাসটি উন্মুক্ত হলে!
ইচ্ছার আগুনে জ্বলছি...
আমি এটাই বলতে চাচ্ছিলাম। গুগল এই কর্পাসের সত্বাধিকারী, তাই সে যে শুধুমাত্র ট্রান্সলেশন প্রোজেক্টেই কাজে লাগাবে তা না। অথচ, ট্রান্সলেশন প্রোজেক্ট বন্ধ হয়ে গেলে কখনো, আমাদের সরাসরি উপযোগিতা পাওয়ার ক্ষেত্র অনেকটাই সংকুচিত হবে।
গ্র্যাজুয়েট জীবনের শুরুতে একটা কোর্স নিয়েছিলাম, স্পীচ অ্যান্ড স্পীকার রিকগনিশন। সেমিস্টার প্রোজেক্টের কাজ করতে যেয়ে বিশাল বড় ট্রেইনিং ডাটাসেটের গুরুত্ব বুঝেছিলাম। ইংরেজি ভাষাতে গবেষণার জন্য অসংখ্য উন্মুক্ত কর্পাস আছে। আমি কাজ করেছিলাম TIMIT কর্পাস নিয়ে। এরকম আরো কত অসংখ্য কর্পাস যে আছে! সেসময় বাংলার জন্য কিছু বানানো যায় কিনা, সে খোঁজ করতে যেয়ে আবিষ্কার করলাম, বাংলাতে কাছাকাছি স্কেলের কোনো কর্পাসই নেই, উন্মুক্ত তো আরো দূরের ব্যাপার। এই কর্পাসটা উন্মুক্ত থাকলে ল্যাঙ্গুয়েজ প্রোসেসিং, রিকগিনেশন সংক্রান্ত গবেষণা অনেকটাই এগিয়ে যেতো।
অলমিতি বিস্তারেণ
দামী লেখা।
--------------------------------------------------------
এক লহমা / আস্ত জীবন, / এক আঁচলে / ঢাকল ভুবন।
এক ফোঁটা জল / উথাল-পাতাল, / একটি চুমায় / অনন্ত কাল।।
এক লহমার... টুকিটাকি
সুন্দর আর্টিকেলের জন্য ধন্যবাদ, এসব নিয়ে আগেই লিখালিখির ইচ্ছা ছিল কিন্তু আগে লিখি নাই মানুষ অন্যভাবে নিতো তাই, কিন্তু সরকারি উদ্যাগে এসব হচ্ছেটা কি ? নিজের জিনিষ অন্যর হাতে তুলে দিচ্ছি কোন দ্বিধা ছাড়াই, আমাদের সরকার বাহাদুর কি পারতো না নিজ উদ্যাগে কিছু করতে ? গুগল ম্যাপের ব্যাপারেও আমার চুলকানি আছে , আমরা আমাদের দেশের সকল তথ্য আমেরিকানদের হাতে গুগল ম্যাপে তুলে দিচ্ছি । যে কেউ বাংলাদেশের উপরে সহজে আক্রমনের ছক আকতে পারবে , জাতীয় নিরাপত্তার স্বার্থে তাৎক্ষনিক ভাবে এসব বন্ধ করার ক্ষমতা সরকারের থাকবে না , কারন এক্সেস রয়েছে ভিন দেশীদের হাতে ।
নির্ভয়ে লিখে ফেলেন।
দারুন সময় উপযোগী একটি লেখা, অনেক কিছু জানা হলো। নতুন করে ভেবে দেখার সুযোগ দিলো, পাঁচতারা।
-------------------------------------------
আমার কোন অতীত নেই, আমার কোন ভবিষ্যত নেই, আমি জন্ম হতেই বর্তমান।
আমি অতীত হবো মৃত্যুতে, আমি ভবিষ্যত হবো আমার রক্তকোষের দ্বি-বিভাজনে।
আপনাগো মতন পিছটানা মাইনষ্যের জন্য আজ কাগুর এই দশা
____________________________________
যাহারা তোমার বিষাইছে বায়ু, নিভাইছে তব আলো,
তুমি কি তাদের ক্ষমা করিয়াছ, তুমি কি বেসেছ ভালো?
ঠিক এই বেপারটি চিন্তা করে আমি কোনো আগ্রহ খুঁজে পাইনি। কিন্তু এরকম সুন্দর করে বেপারটা লিখতে পারিনি বা বলতেও পারিনি। আমার লিখা টা পড়ে মনে হয়েছে আমার কথাই আপনি লিখেছেন। খুবই সুন্দর করে লিখার জন্য ধন্যবাদ।
ভাই, আমরা কয়েকজন অনেকদিন ধরে বাংলা উইকিপিডিয়া নিয়ে কাজ করছি, নিজেদের সামর্থ্য মতো প্রচারণা চালাচ্ছি। এমনকি উইকিমিডিয়া বাংলদেশ নামে একটা চ্যাপ্টার ও আমরা গঠন করেছি যা দক্ষিণ এশিয়ার দুইটা উইকিমিডিয়া চ্যাপ্টারের একটা। তবে এখনো নিয়মিত অবদানকারীর সংখ্যা পনের জনের বেশি করা যায়নি। আসলে কর্পোরেটের কাড়ি কাড়ি টাকায় প্রচার যেমন জবরদস্ত হয়, তেমনি সাধারণ মানুষদেরও অংশগ্রহণ হয় বেশি। আমাদের টাকা নাই, তাই হতাশ চোখে এসব দেখা ছাড়া আমাদের গতি নাই। তারপরও আমরা একটু একটু করে আমাদের বাংলা উইকিপিডিয়াকে এগিয়ে নিচ্ছি, স্বপ্ন দেখি আমাদের উইকিপিডিয়া একসময় অনেক সমৃদ্ধ হবে। তবু আমি বাংলার জন্য চার লাখ ক্যাম্পেইনে কিছু লাইন যোগ করেছিলাম এই আশায় যে গুগলের মেশিন ট্রান্সলেশন কিছুটা ভাল হলে এটা দিয়ে বাংলা উইকিপিডিয়ায় নিবন্ধ তৈরি করা সহজ হবে এবং নতুনদের আমরা এটা সহজে শেখাতে পারবো।
যারা এখানে লেখাটি পড়ছেন তাদের অনুরোধ করবো প্রতিদিন অন্তত কিছুটা সময় বাংলা উইকিপিডিয়াতে নতুন নিবন্ধ তৈরিতে বা উন্নয়নে ব্যয় করতে!
ধন্যবাদ আপনার সুচিন্তিত লেখার জন্য।
আমি সব সময় বলি একটা জাতি আসলে কত জাতে উঠেছে সেটা বোঝা যায় তাদের ভাষার উইকিপিডিয়াটা কতটা সমৃদ্ধ সেটা দেখে। কারণ ব্লগে লিখে যে 'আমি লিখেছি' টাইপ ইগো বুস্ট পাওয়া যায় উইকিপিডিয়াতে সেটা পাওয়ায় যায় না। উইকিপিডিয়া লিখে টাকা পয়াওয়া যায় না। আবার ওখানে খেলাম ঘুমালাম টাইপ মনের কথা লিখেও হালকা হওয়া যায় না। রীতিমত খাটাখাটুনি করে এককেকটা নিবন্ধ রেফারেন্স সহ প্রস্তুত করতে হয়। এমন একটা কষ্টসাধ্য বুদ্ধিবৃত্তিক কর্মকান্ড যে জাতিতে অনেক মানুষ সেচ্ছায় বিনা পারিশ্রমিকে করতে পারে তারাই জাতে উঠেছে। আপনাদেরকে অভিনন্দন উইকিপিডিয়ার কাজ চালিয়ে যাবার জন্য।
নেচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর অনেক গবেষককেই দেখেছি উইকিপিডিয়ার টেক্সট কে করপাস হিসাবে ব্যবহার করতে। কয়েক গিগা ডাউনলোড করে নিয়ে তারা সব এনালাইসিস চালায়। এই লেখার শেষ দিকে উইকিপিডিয়া নিয়েও আমি তাই একটা সম্ভাব্য প্রস্তাবনা রেখেছি। ইংরেজী উইকিপিয়ডিয়ার একাংশের টেক্সটকে গুগল ট্রালস্লেট এর মত করে বিটস/ পিসেস এ উপস্থাপন করে ক্রাউড সোর্সিং এর মাধ্যমেই সেগুলো অনুবাদ করে নেওয়া যেত। একই সঙ্গে উন্মুক্ত লাইসেন্সের একটা কর্পাসও তৈরি হত। আগামীতে এ ধরনের অনুবাদযজ্ঞ হলে আশাকরি এমনটা করা হবে।
ইচ্ছার আগুনে জ্বলছি...
অনেক গুরুত্বপূর্ণ একটা বিষয়ে খুব গোছানো একটা লেখা। এতটা গভীরে ভেবে দেখিনি। মূল্যবান লেখাটার জন্য ধন্যবাদ। এই ব্যাপারে আরও সচেতনতা বাড়ুক সরকারি মহলে, এবং সাধারণ মানুষের মধ্যেও।
লেখাটা পড়ে এবং মন্তব্যগুলো অনুসরণ করে অনক কিছুই ানা গেল।
ধন্যবাদ, আপনাকে।
গুরুত্বপূর্ণ লেখা। নজরদারির বিষয়টা মাথায় আসছিল গুগল ম্যাপের খচখচানি থেকেই, তাও এতোটা গভীরভাবে না।
ধন্যবাদ।
স্বয়ম
ভালো একটি লেখা। আমরা বিদেশি কোম্পানি কিছু ফ্রি দিলে বা কেউ ফ্রি খেতে দিলে খুব খুশি হয়ে যাই।
একটা কথা সংযোজন করতে চাই। গুগল এর Translation API কিন্তু ওরা ২০১১ সালে বন্ধ করে দিয়েছে। অনেক দাবীর মুখে ওরা Translation API একটি বাণিজ্যিক সার্ভিস হিসেবে চালু করেছে।
বাংলা ভাষায় যেভাবে ব্লগ ও সংবাদ চালু হচ্ছে, তাতে অচিরেই ওদের দ্রুত translate করার মাধ্যমটি চালু করতে হতো। আমরা বিনে পয়সায় খেটে করে না দিলে ওরা পয়সা দিয়ে টেকনিশিয়ান রেখেই করাতো কাজটা।
- নীল কাকাতুয়া
হা হা হা!
তার মানে দেখা যাচ্ছে এই সার্ভিসটি বিনে পয়সার ও না!!
অনেক ধন্যবাদ আপনাকে এই সংযুক্তির জন্য।
ইচ্ছার আগুনে জ্বলছি...
এরকম লেখা ব্লগ ছাড়া অ্যা কোথাও পাওয়া যায়? একদম না।
আমিতো এই টেকনিক্যাল ব্যাপারগুলো জানতামনা।
কিন্তু এরকম কাজে একজন পূর্ণমন্ত্রীর সময় ও শ্রম দেয়া দেখে বিরক্ত হয়েছিলাম।
উনার নিশ্চই করার মত আরো জরুরী কাজ আছে।
লেখাটা খুব ভাল লাগলো।
-----------------------------------
আমার মাঝে এক মানবীর ধবল বসবাস
আমার সাথেই সেই মানবীর তুমুল সহবাস
গুগল বিনে পয়সায় কিছু দেয় না। কোন আত্মসম্মানসম্পন্ন জাতি সেরকম আশাও করবে না। কিছু পেলে কিছু দিতে হবে, ক্যাশ বা কাইন্ড। সে কথা সব কর্পোরেশন সম্পর্কেই সত্যি, গুগল, মাইক্রোসফট, ফেসবুক, বা কোন বাঙালি কোম্পানি।
যদি মনে করেন বিদেশি কোম্পানিকে ডাটা দিলে দেশের স্বার্থ বিঘ্নিত হবে, তাহলে দেশি কোম্পানি তৈরি করতে হয়। সেদিকে মন দিলে আমাদের জাতি হিসাবে ভাল হবে বলে মনে হয়।
আমার মত হল ম্যাপ বা ঐ ধরনের তথ্যের জন্য মার্কিন সরকার গুগল বা ফেসবুকের ওপর নির্ভরশীল নয়। তাদের উপগ্রহ থেকেই এসব তথ্য তারা যোগাড় করে নিতে পারে।
ই-মেইল ডাটা রক্ষা করতে হলে এনক্রিপসনের সাহায্য নিতে হবে। দেশী কোম্পানী হলেও, বিএনপি ক্ষমতায় এলে (জামাত আমাদের ই-মেইল হাতে পেলে) ব্যাথা আছে।
আরো কথা হল, কর্পোরেট দুনিয়ায় নিজেদের মধ্যে খাওয়া-খাওয়ি চল্তেই থাকে। গুগল ডাটা না পেলে লাভ আমাদের না হয়ে কোন প্রতিদ্বন্দ্বী কোম্পানিরও হতে পারে।
নতুন মন্তব্য করুন