"গুগল সার্চ ইঞ্জিন কীভাবে কাজ করে?" এই প্রশ্নটির উত্তর খুঁজে বেরান অনেকেই। তবে প্রশ্নটি আসলে এমন হওয়া উচিত "গুগল এলগরিদম কীভাবে কাজ করে?" কারণ এর সার্চ ইঞ্জিনের যাবতীয় কার্যকম গুগল এলগরিদম এর মাধ্যমে সম্পন্ন হয়ে থাকে। এই এলগরিদমই ঠিক করে দেয় কোন ওয়েবপেজটি কিংবা কোন আর্টিকেল বা কন্টেন্টটি সার্চ রেজাল্টে পদর্শিত হবে।
এই এলগরিদম কীভাবে কাজ করে, এটি জানতে চেষ্টা বা আগ্রহের অন্ত নেই ওয়েবসাইট ওনার কিংবা ডিজিটাল মার্কেটিং এক্সপার্টদের। কারণ একবার এর গতিবিধি যদি বুধে উঠা যায়, তবে আপনার ওয়েবসাইটটিকে গুগলে র্যাংক করা এবং আপনার ওয়েব সাইট এবং কন্টেন্টস টার্গেটেড অডিয়েন্স অব্দি পোঁছে দেয়া সহজ হয়ে যাবে। কিন্ত এই এলগরিদম বোঝা মামা বাড়ির আবদার নয়। তবুও চেষ্টা করব এটিকে একটা এক্সপ্লেইনেশনে আনতে।
লেটস ডু ইট..
জেনে নিব গুগল এলগরিদম এর বউ-বাচ্চা সম্বন্ধ্যে
গুগল এলগরিদম এর এই পথচলা মোটেই সহজ ছিল না। শুরু (১৯৯০) থেকে সার্চ ইঞ্জিনটিকে আজকের এই অবস্থানে আনতে গুগল এলগরিদমকে অনেক পথ পাড়ি দিতে হয়েছে।
এলগরিদম, এর প্রথম যে আপডেটটি নিয়ে হাজির হয় সেটি ছিল PageRank, যা একটি ওয়েব পেজের লিংকস-এর সংখ্যা এবং কোয়ালিটির উপর ভিত্তি করে এটা জাস্টিফাই করে যে প্রদত্ত গুগল সার্চ-এর সাথে পেজটি কতটা প্রাশঙ্গিক। সাধারণত যে ওয়েব পেজগুলোর ভালো মানের ব্যাংকলিংক থাকে সেই পেজগুলো গুগল পেজর্যাংকিং ফ্যাক্টরে বেশি প্রায়োরিটি পেয়ে থাকে। যাই হোক, বিগত বছরগুলোতে গুগল এর আলগরিদমে অনেক পরিবর্তম এসেছে, এসেছে মেজর কিছু আপডেটস। আসুন, জানি সেসম্বন্ধ্যে,
- Penguin - এটি প্রথম পরিচিতি হয় ২০১২ সালে; গুগলে আলগরিদমের একটি কোডনেইম এটি। জেনারেলি গুগল স্প্যামিং করাকে ডিমোট করে এবং ওয়েব স্প্যামিং কমিয়ে আনার জন্য পেঙ্গুইন তারই একটি প্রয়াস। এটি সেভারেল ব্যাকলিংকস এর মধ্য থেকে যে স্প্যামি ব্যাকলিংক গুলো থাকে সেগুলোকে খুঁজে বের করে এবং সার্চ রেজাল্ট থেকে সেসব স্প্যামি ব্যাকলিংকগুলোকে অপসারণ করে।
- Panda - গুগল পান্ডা আপডেটটি প্রথম আসে ২০১১ সালে। এটি এমন একটি কোড যা কিনা সার্চ রেজাল্টস থেকে লো-কোয়ালিটি কন্টেন্টগুলিকে অপসারণ করে থাকে; ঐসকল কন্টেন্ট যা কারও তেমন কাজেই আসবে না।আমরা অনেকসময় সার্চ ইঞ্জিনে র্যাংক করতে যত্রতত্র কিছু আর্টিকেল লিখে পোস্ট করে দেই, অথচ সেসব কন্টেন্টই গুগল সার্চে আমাদের এন্টায়ার ওয়েবসাইটের জনপ্রিয়তা কমিয়ে সেয়। এর পিছনে পান্ডা দায়ি।😒
- HummingBird - এই আপডেটটি গুগল এলগরিদমে NPL বা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং এর ইম্প্রোমভমেন্ট করে যাচ্ছে।
- MobileGeddon - রিসেন্ট কিছু বছর ধরে পিসির থেকেও মোবাইলে ইন্টারনেট ইউজার অনেক বেশি বেড়ে গেছে। মোবাইলগেডন এর মাধ্যেম গুগল ফাইন্ডআউট করে ওয়েবসাইটগুলি মোবাইলফ্রেন্ডলি কিনা। তথাপি মোবাইল ফ্রেন্ডলি হলে ওয়েবসাইটগুলি সার্চ রেজাল্টে বেশি প্রায়োরিটি পেয়ে থাকে।
- RankBrain - এটি গুগল এলগরিদমে মেশিন লার্নিং প্রযুক্তি জুড়ে দেয়, যার মাধ্যমে অনুসন্ধানকারীর কাছে কাঙ্খিত ফলাফল পৌঁছে দেয়া হয়ে ওঠে আরও সহজসাধ্য।
- BERT - NPL বা ন্যাচারাল লার্নিং প্রসেসিং কে ত্বরান্বিত করে অঅনুসন্ধানকারীর সার্চ কোয়ারিগুলো অনুধাবন করে এটা বুঝার প্রয়াস, আসলে ইউজার কি চাচ্ছে!
কিভাবে গুগল এলগরিদম কাজ করে?
সার্চ রেজাল্টে কোন কোন ওয়েব পেজ বা কন্টেন্ট দেখাতে হবে, এটি নিশ্চিত করতে গুগল এলগরিদম ৩টি স্টেপ দিয়ে যায়:
- Crawling: আমরা যেমন ওয়েব ব্রাউজার ব্যবহার করে বিভিন্ন ওয়েবসাইট ব্রাউজ করে থাকি, গুগল তেমন ওয়েব ক্রাউলার; যা কিনা স্পাইডার বা বট নামেও পরিচিত - ইহা ব্যবহার করে ইন্টারনেট ক্রাউল করে নতুন নতুন ওয়েবপেজ এবং ওয়েব কন্টেন্টগুলি ডিস্কভার করে থাকে। ঠিক যেমনি আপনি ওয়েব ব্রাউজ করতে করতে আমার এই আর্টিকেলটি ডিস্কভার করলেন।
- Indexing: প্রথম স্টেপ তো গেলো। আমরা নর্মালি কোনও নতুন ওয়েবসাইট ভালো লাগলে সেটি মনে রেখে দেই কিংবা বুকমার্ক করে রাখি। নয়কি? গুগলও অনেকটা সেম ওয়েতে ক্রাউল করে খুঁজে পাওয়া ওয়েবপেজগুলির কন্টেন্ট, গঠণপ্রণালি এবং মেটাডাটা বা ডিস্ক্রপশন ইত্যাদির উপর ভিত্তি করে তাদের ইন্ডেক্স করে।
- Ranking: ইন্ডেক্সিং তো হলো, এবার ইন্ডেক্সড পেজগুলিকে সাজাতে হবে। এই সাজানোর প্রক্রিয়াকেই বলে র্যাংকিং।
গুগল কীভাবে ওয়েবপেজ র্যাংকিং করে?
গুগলের ওয়েব পেজ র্যাংক করার প্রকিয়ায় বেশকিছু ফ্যাক্টর কাজ করে যেমনকি:- কন্টেন্ট কোয়ালিটি: কন্টেন্ট Well Structured কিনা।
- সার্চ কোয়ারির সাথে ওয়েবপেজটি কতটা প্রাসঙ্গিক?
- ইউজার ইনরোলমেন্ট: কি পরিমাণ ভিজিটর আনাগোনা হয়েছে?
- ওয়েবপেজ লোডিং স্পিড
- মোবাইল ফ্রেন্ডলিনেস
- সিকিউরিটি: পেজটি সিকিউরড কিনা, SSL (https://) আছে কিনা
- এক্সেসিবিলিটি: পেজটি সহজে এক্সেস করা যায় কিনা এবং
- ব্যাকলিংক একটি মোস্ট ইম্পর্টেন্ট ফ্যাক্টর।
উপরোক্ত বিষয়াবলির উপর ভিত্তি করে গুগল পেইজর্যাংকিং করে থাকে।
এভাবে ক্রাউলিং, ইনডেক্সিং তারপর লাস্ট স্টেপ তথা র্যাংকিং সম্পন্ন হওয়ার পর সার্চ রেজাল্টগুলি অনুসন্ধানকারীকে প্রদর্শন করানোর জন্য উপলব্ধ হয়।
কীভাবে এত এডভান্স এই এলগরিদম
ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP)
গুগল সার্চ রেজাল্ট এত এডভান্স হওয়ার পিছনে এনএলপি এর কার্যকারিতা অনেক। আমরা অনেক সময় এমন কিছু ইঞ্জিনে সার্চ করি যেটা আমরা প্রপারলি এক্সপ্লেইন করতে পারিনা, তবু দেখবেন গুগল সেটি বুঝে নেয়, বুঝে প্রয়োজনীয় সার্চ রেজাল্ট ও প্রদর্শন করে দেয়। এনএলপি মুলত একটি কম্পিউটার প্রোগ্রাম।আমাদের সার্চ কোয়ারিগুলো আরও বোধগম্য করার জন্যই এর ব্যবহার।
মেশিন লার্নিং
মেশিন লার্নিং হচ্ছে একটি এআই। বেশিরভাগ এপ্লিকেশন সফটওয়্যারই এই এআই-এর ব্যবহার করে থাকে। আর গুগল এলগরিদম-এর সাথে মেশিন লার্নিং এর সম্পর্ক তো সেই ২০১৫ থেকে। এটি গুগল এলগরিদমে নিউরাল নেটওয়ার্ক এবং ডিপ লার্নিং এলগিদম জুরে দেয়।
মেশিন লার্নিং আমাদের সার্চ করার কৌশলগুলো থেকে প্রতিনিয়তই কিছু না কিছু শিখে নিচ্ছে । ফলে গুগলে আমাদের অনুসন্ধানগুলোর ফলাফল দিনের পর দিন আরও এডভান্স হচ্ছে। আপনারা হয়ত খেয়াল করে থাকবেন, আমরা যখন কোনও কিছু সার্চ করার জন্য লিখতে নেই, গুগল আমাদের সার্চ কোয়ারি কম্পলেট করার জন্য কিছু প্রেডিকশন জুড়ে দেয় এবং এটিও মেশিন লার্নিং এর কারণে সক্ষম হয়। আসলে গুগল আমাদের প্রতিটি অনুসন্ধান থেকেই কিছু ডাটা লুফে নিচ্ছে।
ভয়েস সার্চ
ভয়েস সার্চ সম্বন্ধ্যে কিছু বলার অপেক্ষা রাখেনা। গুগল ভয়েস সার্চ এপ্লিকেশন রিসেন্টলি কতটা ডেভেলপ করছে তা কারওই অজানা নয়। ভয়েস সার্চ এর মাধ্যমে আমরা গুগুলকে অনেক ইজিলি কিছু ইন্সট্রাকশন দিয়ে দিতে পারি। যেমন 'Call Ritu' বললে রিতু নামে সেভেড কোনও কন্টাক্টস থাকলে কল চলে যাবে। 'Play The Weeknd' এরকম বললে ফোনের মিউজিক লাইব্রেরিতে দি উইকেন্ড এর কোনও গান থাকলে প্লে হয়ে যাবে।
এই তো গেলো ইন্সট্রাকশন, এরপর আসি সার্চ এর ক্ষেত্রে। কোনও কিছু লিখে সার্চ করার থেকে ভয়েস সার্চ এর মাধ্যমে বলে সার্চ করলে সময় ও ব্রেইন দুটোই কম ইউজ করে গুগল থেকে এখনও কাঙ্ক্ষিত সার্চ রেজাল্ট টা বের করে নেয়া যায়। এই ভয়েস সার্চিং বিষয়টা ধরেই এত উন্নিত হয়নি। যেহেতু এখানেও গুগল এলগরিদম এআই এর ব্যবহার করে থাকে। ফলে যতই এটি নতুন নতুন ভয়েস রেকর্ড করছে, ততই এটি শিখছে। অনুসন্ধানকারী কি চাচ্ছে, তার সমাধান দিচ্ছে।
গুগল এলগরিদম ভবিষ্যৎ সম্বন্ধ্যে:
আমরা ইতোমধ্যেই জানতে পেরেছি, গুগল এলগরিদম কতটা উন্নত প্রযুক্তি ও এআই এর ব্যবহার করছে অনুসন্ধানকারীদের সবসময়ের জন্য গুগলের সাথে ইঙেজড রাখার জন্য। বর্তমানে গুগল "বার্ড" নিয়ে কাজ করছে, যা কিনা চ্যাটজিপিটির মতো ইউজারদের সাথে ক্লোজলি ইন্টেরেক্ট করে যেকোন প্রশ্নের সমাধান দিতে সক্ষম। এখন দেখার বিষয় একটাই, কীভাবে গুগল এলগরিদম সময়ের সাথে খাপ খাইয়ে গুগলের সেই নাম্বার ওয়ান টেক জায়েন্ট পজিশনটা ধরে রাখে, আর "বার্ড" কে কীভাবে একটি কমপ্লেট এআই তে রূপলাভ দেয়, যা কিনা কম্পিটিশন দিবে চ্যাটজিপিটির মতো কম্পিটেটিভ এআই দের।