কোন ভাষায় বর্ণমালার সবগুলো বর্ণ সমান হারে ব্যবহার হয়না। যারা একটু খোঁজ-খবর রাখে তার চট করে বলে দিতে পারবে ইংরেজি ভাষায় সর্বাধিক ব্যবহৃত বর্ণ হল E, তার পর পুনরাবৃত্তির ক্রম ধরে একে একে আসে T, A, O, I ইত্যাদি। যারা বিস্তারিত জানতে আগ্রহী তারা Letter Frequency নিয়ে অন্তর্জালে সন্ধান করতে পারেন।
বাংলায় সর্বাদিক পুনরাবৃত্ত কোন বর্ণ বা ধ্বনি ? এই প্রশ্নের উত্তর খুঁজতে গিয়ে একটু খাবি খাওয়া লাগল। মুনীর চৌধুরী'র একটি গবেষণার ফলাফল উইকিপিডিয়াতে আংশিক তুলে ধরা হয়েছে, কিন্তু পূর্ণ সংস্করণ খুঁজে পাওয়া গেলনা। গত দুই দশকে বাংলা কী-বোর্ড নিয়ে যারা গবেষণা করেছেন তারা কেউ কেউ নিজ ঊদ্যোগে নতুন করে আবার বাংলা Letter Frequency হিসেব করেছেন। কিন্তু তাদের গবেষণার কেন্দ্রীয় বিষয় না হওয়ায় তারা এই ফলাফল গুলো প্রকাশ করেননি অথবা আংশিকভাবে প্রকাশ করেছেন। শেষমেশ পরিস্থিতি দাঁড়াচ্ছে এই যে, বাংলা Letter Frequency আমি জানতে পারছিনা।
বাংলায় অবশ্য ইংরেজির মত Letter Frequency সরাসরি হিসাব করতে গেলে কিছু ঝামেলা এসে পড়ে। প্রথমত, বাংলায় কার এবং ফলাগুলো কিভাবে গণনা করা হবে ? এরা কিপ্রত্যেকে একটা বর্ণ নাকি এদেরকে গণনা থেকে বাদ দিতে হবে ? আরেকটা প্রশ্ন আসে যুক্তাক্ষর গুলো নিয়ে। একটা যুক্তাক্ষর, যেমন ধরা যাক 'ক্ত', এটাকে কি 'ক্ত' হিসেবে গননা করা হবে, নাকি 'ক' এবং 'ত' হিসেবে ? প্রায় একই রকম প্রশ্ন ওঠে রেফ এবং বিভিন্ন ফলা (র-ফল, য-ফলা ইত্যাদি) নিয়েও। আমি আপাততঃ ধরে নিচ্ছি কার গুলোকে একটা বর্ন হিসেবে গণনা করা হবে, রেফ, যুক্তাক্ষর ও ফলা গুলোকে ভেঙ্গে প্রত্যেকটা বর্ণ আলাদা করে গণনা করা হবে এবং হসন্তকে গণনা করা হবে না। এভাবে আমরা যেই বর্ন গুলো গণনা করব তারা সবাই হবে এক একটা ধ্বনির প্রতিনিধিত্বকারী বর্ন। অতএব যেই পরিসংখ্যান পাব তাতে কোন ধ্বনি বাংলায় কী হারে পুনরাবৃত্ত হয় তা জানা যাবে। আমি ভাষাবিদ নই, কাজেই আমার বোঝার ভুল থাকার সম্ভাবনা আছে। ভাষাবিদ অথবা এই বিষয়ে জানা আছে এমন কেউ নিজের মতামত জানালে উপকৃত হব।
উপরের প্যারার গণনারীতি অনুসরণ করে সচলের বাইশ হাজারের বেশি গল্প, কবিতা, প্রবন্ধ ইত্যাদি ঘেঁটে একটা পরিসংখ্যান দাঁড় করিয়েছি। ফলাফল দেখতে পাবেন নীচের চার্টে। আমার হিসাব মতে বাংলার সর্বাধিক পুনরাবৃত্ত ধ্বনি হল 'আ'। তার পরেই আসে 'এ', 'র' ইত্যাদি। সবচেয়ে কম ব্যবহার করা হয় 'ঢ়', আষাঢ়ে গল্প মনে হয় আমাদের কোন কালেই খুব একটা প্রিয় ছিলনা।
তথ্যসূত্র:
উইকিপিডিয়ার লিংক: http://en.wikipedia.org/wiki/Bengali_alphabet#cite_note-4
বাংলা কীবোর্ড লে-আউট নিয়ে গবেষণা প্রবন্ধ: http://arxiv.org/ftp/arxiv/papers/1009/1009.4586.pdf
বড়সড় চার্ট, আমার ব্যক্তিগত ব্লগে: http://www.muqube.com/portfolio/bangla-phoneme-frequency/
ফলাফল ডাউনলোড করতে পারবেন এখান থেকে : http://www.muqube.com/wp-content/uploads/2014/09/bangla_phoneme.csv
মন্তব্য
ভিন্নস্বাদের গবেষণা নিয়ে লেখা ভালো লাগলো।
তবে, অনেকগুলো র্ন --> র্ণ করে দিন। ভাষা নিয়ে লেখায় এটা চোখে লাগছে।
শুভেচ্ছা
ধন্যবাদ, বানান ঠিক করে দিলাম।
অনেক দূরে যাব
যেখানে আকাশ লাল, মাটিটা ধূসর নীল ...
কীবোর্ড লেআউট নিয়ে যারা কাজ করেন, এ পরিসংখ্যান তাদের কাজে লাগবে।
এই লেখাটির সাথে সাথে আপনার পুরোনো কিছু লেখা দেখতে গিয়ে আবিস্কার করলাম অনেকদিন পর আপনি আবার লিখলেন। সেই দু-হাজার দশের ডিসেম্বরের পর এই প্রথম। ফ্রয়েডীয় তত্ত্ব অনুযায়ী সবকিছুর মত লেখালেখির অনুপ্রেরনাও হয়তো তেনাদের থেকেই আসে, কিন্তু না লেখালেখির আলস্য কিংবা বিধিনিষেধেরও কি একই উৎস?
অনুপ্রেরণা আসে কোথা থেকে তা নিয়ে ফ্রয়েড তত্ত্ব দিয়েছে, কিন্ত অনুপ্রেরণা উধাও হয় কোথায় সেই বিষয়ে তত্ত্ব দেয়নি ? এই সব অর্ধতত্ত্ব নবীর দুয়ারে ঘুরে কি জগতের গুড় রহস্যের সুরাহা হবে ?
অনেক দূরে যাব
যেখানে আকাশ লাল, মাটিটা ধূসর নীল ...
না, হচ্ছে না তো। আর সে জন্যই তো ভন্ড নবীর আস্তানায় অযথা ঘোরাঘুরি না করে সরাসরি সহি জ্ঞান লাভের আকাঙ্খা। কিসের তরে এই দীর্ঘ মৌনতা? আর সেটা ভঙ্গ যদি হল, সুধারসের প্লাবনধারা অক্ষুন্ন থাকবে তো?
এই প্রশ্নের উত্তর আমার জানা নেই রে ভাই।
অনেক দূরে যাব
যেখানে আকাশ লাল, মাটিটা ধূসর নীল ...
-----------------------------------------------------------------------------------------------------------------
যদি তোর ডাক শুনে কেউ না আসে তবে একলা চল রে
এত দিন পরে হাজির হইলা মিয়া? ভাবসিলাম তো মইরাই গেছ
০২
আমার সাধারণ হিসাবে স্বরে = আ-ই-এ আর ব্যাঞ্জনে =র-ম-শ/স
মরি নাই, বাঙ্গালির ফুট-ফাট করে মরার দিন শেষ।
০২
স্বরে আপনার সাধারণ হিসাবের সাথে আমার গণনা মিলে যায়। কিন্তু ব্যঞ্জনে আমার র, ন, ক ইত্যাদি আসছে। আরেকটা মজার জিনিস লক্ষ করুন: প্রায় পঞ্চাশ বছর আগে মুনীর চৌধুরীর করা গবেষণার ফলাফল আমার প্রথম দশটার সাথে অনেকাংশে মিলে যাচ্ছে। প্রথম দশে নতুন ব্যঞ্জন 'ন' এসে ঢুকেছে, যেটা পঞ্চাশ বছর আগে দশের বাইরে ছিল। প্রত্যেক বছরের বাংলা লেখার নমুনা যদি ডিজিটাল মাধ্যমে সংরক্ষণ করা হত, তাহলে হয়ত পঞ্চাশ বছরে বাংলার বিবর্তণের একটা ছবি আঁকা যেত। এরকম আর্কাইভের সন্ধান জানা আছে নাকি ?
অনেক দূরে যাব
যেখানে আকাশ লাল, মাটিটা ধূসর নীল ...
____________________________________
যাহারা তোমার বিষাইছে বায়ু, নিভাইছে তব আলো,
তুমি কি তাদের ক্ষমা করিয়াছ, তুমি কি বেসেছ ভালো?
এরকম কোন হিসাব নিকাশ আগে চোখে পড়ে নি। দেখে ভাল লাগল। স্বরবর্ণের কেউই যে ফার্স্ট হবে, সেইটা আন্দাজ করতাম। টপ ফাইভে তিনখানা স্বরবর্ণ - সেইটাও কমন সেন্সকে সমর্থন করে। চক্ষুকর্ণের বিবাদ ভঞ্জন হল। ধন্যবাদ।
এমন পরিশ্রমসাধ্য কাজের জন্য আপনাকে সাধুবাদ
স্বরবর্ণই যে এগিয়ে থাকবে এটা জান্তাম এত পরিশ্রম করেছেন ভাইয়া বলতে তাই লজ্জাই পাচ্ছি একটু।
তবুও আরেকটু কষ্ট সহ্য করে যদি পোস্টের টাইপোগুলো শুধরে দিতেন।
বর্ন>বর্ণ, পূর্ন>পূর্ণ, গননা>গণনা, প্রতিনিধিত্ত্বকারী>প্রতিনিধিত্বকারী, অনুসরন>অনুসরণ
আমার বানান ভুল ধরিয়ে দেওয়ার জন্য অসংখ্য ধন্যবাদ আপনাকে। আরও ভুল চোখে পড়লে জানাবেন।
অনেক দূরে যাব
যেখানে আকাশ লাল, মাটিটা ধূসর নীল ...
--------------------------------------------------------
এক লহমা / আস্ত জীবন, / এক আঁচলে / ঢাকল ভুবন।
এক ফোঁটা জল / উথাল-পাতাল, / একটি চুমায় / অনন্ত কাল।।
এক লহমার... টুকিটাকি
চমৎকার গবেষণা! আপনাকে অসংখ্য ধন্যবাদ।
____________________________
নতুন মন্তব্য করুন