আমাদের কথা খুঁজে নিন

   

ইন্টারনেটের সার্চ ইঞ্জিন দুনিয়া

ইন্টারনেটের কিছু বিশেষ সাইট থাকে, যা মানুষকে তত্ত্ব-তালাশ করতে সাহায্য করে। সেগুলোর পোশাকি নাম 'সার্চ ইঞ্জিন'। বিভিন্ন রকমের সার্চ ইঞ্জিন আছে, কিন্তু কাজের পদ্ধতি প্রায় একইরকম। তিনটি প্রাথমিক কাজ একই। প্রথমত, ইন্টারনেট থেকে প্রকৃত শব্দ ও শব্দমালা চয়ন করা।

দ্বিতীয়ত, সেই শব্দগুলো নিয়ে একটি ইনডেঙ্ বা তালিকা গঠন করা এবং তৃতীয়ত, মানুষের ব্যবহারের জন্য এই তালিকাগুলো উন্মুক্ত করা।

বেশ কয়েক বছর আগে যেসব সার্চ ইঞ্জিন ব্যবহৃত হতো তার ব্যাপ্তি ছিল হয়তো মাত্র কয়েক হাজার ওয়েব পেজে। কিন্তু আজ যে কোনো জনপ্রিয় সার্চ ইঞ্জিন সাইট ঘেঁটে ফেলে এক নিমিষে। উত্তরের সন্ধান করতে পারে আরও নিখুঁত। ১৯৯০ সালে সর্বপ্রথম তত্ত্ব-তালাশ করা হয় 'অৎপযরপ' (আর্চি) ওয়েব সাইটের মাধ্যমে।

এরপর আসে 'ভেরোনিকা' (ঠবৎড়হরপধ) ও 'জাগহেড' (ঔঁমযবধফ)। সাইটের নাম দেওয়া হয় শিশুদের অতি প্রিয় কমিক সিরিজের দিকে তাকিয়ে। কোনো কিছুর ব্যাপারে সন্ধান করার জন্য কিছু ইন্টারনেট প্রোগ্রাম ব্যবহার করা হতো সেগুলোই হচ্ছে আর্চি, গফার, ভেরোনিকা বা জাগহেড। এই প্রোগ্রামগুলো কিছু নির্দিষ্ট সার্ভারে ফাইলের আকারে তথ্য সঞ্চয় করত। সময়ের সঙ্গে পাল্লা দিয়ে প্রযুক্তির আরও উন্নতি ঘটেছে।

আজকের সব সার্চ ইঞ্জিন বিভিন্ন ওয়েব পেজের তথ্যের ওপর ভিত্তি করেই কাজ করে থাকে। প্রায় সব সার্চ ইঞ্জিন তথ্য-সন্ধানের জন্য কিছু বিশেষ সফটওয়ার রোবটের সাহায্য নেয়। এই বিশেষ রোবটগুলোর নাম স্পাইডার। এদের মূল কাজ ইন্টারনেটে জাল বিস্তার করে শব্দচয়ন করা আর তালিকা তৈরি করা। এই পদ্ধতির নাম 'ওয়েব ক্রলিং' শব্দচয়নের জন্য স্পাইডারগুলো ইন্টারনেটের বিভিন্ন পেজ ঘুরে বেড়ায়।

জনপ্রিয় পেজগুলোর ওপর ক্রমাগত লক্ষ্য রেখে চলে। অন্যদের থেকে গুগলের কৃতিত্ব এখানে অনেকটা বেশি। গুগল স্পাইডাররা যখন কোনো এইচ টি এম এল পেজে হানা দেয়, তখন তারা দুটি ব্যাপারে গুরুত্ব দেয়। এক, সেই পেজটির মধ্যে শব্দটির অবস্থান এবং কোথায় তার উৎপত্তি। গুগল 'এ', 'আনা' এবং 'দ্য' ব্যতীত কাজ করে।

অথচ আল্টাভিস্তা কিন্তু ইংরেজি আর্টিক্যালগুলোকে ধরেই কাজ করে।

আরেকটি গুরুত্বপূর্ণ কাজ হলো ইনডেঙ্ংি। এরপর এই তথ্যগুলোকে সঞ্চয় করা এবং ব্যবহারকারীর সুবিধার জন্য সুপরিকল্পিতভাবে তালিকা গঠন করাটাই সবচেয়ে কঠিন। কারণ তথ্য প্রচুর, চাহিদা অনেক, কিন্তু নির্দিষ্ট উত্তর একটাই এবং তথ্যের ভিড় ঠেলে আসল তথ্যটিকে ব্যবহারকারীর সামনে তুলে ধরা, তাও আবার যতটা সম্ভব কম সময়ের মধ্যে এটি তুলে দেওয়া বিরাট চ্যালেঞ্জ। বিভিন্ন নতুন নতুন গাণিতিক যুক্তির উদ্ভব হয়।

এ নিয়ে চিন্তাশীল মগজান্ত্রের গুঞ্জন শুনতে পাওয়া যায়। অবশেষে অনেক পদ্ধতির সঙ্গে সঙ্গে 'হ্যাসিং' পদ্ধতি আসে।

এরপর ব্যবহারকারী নিজের চাহিদা অনুযায়ী কি-ওয়ার্ড দিয়ে অনুসন্ধান করেন এবং এক সেকেন্ডের ভগ্নাংশের কম সময়ে বিভিন্ন 'সার্চ রেজাল্ট-এর তালিকা প্রকাশিত করে। এই কি-ওয়ার্ডের সূত্র ধরে সার্চ ইঞ্জিন কাজ করে।

 



অনলাইনে ছড়িয়ে ছিটিয়ে থাকা কথা গুলোকেই সহজে জানবার সুবিধার জন্য একত্রিত করে আমাদের কথা । এখানে সংগৃহিত কথা গুলোর সত্ব (copyright) সম্পূর্ণভাবে সোর্স সাইটের লেখকের এবং আমাদের কথাতে প্রতিটা কথাতেই সোর্স সাইটের রেফারেন্স লিংক উধৃত আছে ।

প্রাসঙ্গিক আরো কথা
Related contents feature is in beta version.