ফেসিয়াল রিকগনিশন হলো একটি উন্নত প্রযুক্তি যার মাধ্যমে কোনো স্থিরচিত্র বা ভিডিও থেকে কোনো মানুষের মুখ শনাক্ত করা যায়। ফেসিয়াল রিকগনিশনের জন্য ব্যবহৃত সিস্টেম বায়োমেট্রিকস ব্যবহার করে, যাতে তা কোনো ছবি বা ভিডিও থেকে মানুষের মুখের মানচিত্র ও বিভিন্ন বৈশিষ্ট্য খুঁজে বের করতে পারে। এরপর সিস্টেমটি তার রেকর্ডকৃত বিশাল সংখ্যক মুখের ডাটাবেজের সাথে মিলিয়ে দেখে যে কার মুখের সাথে ওই মুখটির মিল রয়েছে।

ব্যক্তিবিশেষের শারীরিক কোনো চিহ্ন থেকে বায়োমেট্রিকসের মাধ্যমে প্রধানত তিনভাবে তার পরিচয় খুঁজে বের করা যেতে পারে, যার মধ্যে ফেসিয়াল রিকগনিশন অন্যতম। তাছাড়া এটি সবচেয়ে দ্রুত বর্ধনশীল বায়োমেট্রিক প্রযুক্তিও বটে। আশা করা হচ্ছে, ২০২২ সাল নাগাদ এর মূল্যমান দাঁড়াবে ৭.৭ বিলিয়ন ডলারে। এর কারণ মূলত দুইটি। প্রথমত, বিভিন্ন ধরনের অর্থনৈতিক কাঠামোয় এর প্রয়োগ সম্ভব। দ্বিতীয়ত, এটি সেট করা অপেক্ষাকৃত সহজ ও কম ঝামেলাযুক্ত

পরিচয় শনাক্তকরণের জনপ্রিয়তম পদ্ধতি ফেসিয়াল রিকগনিশন; Image Source: Cnet

ফেসিয়াল রিকগনিশনের ইতিহাস

ফেসিয়াল রিকগনিশন প্রযুক্তিটি প্রথম জনপ্রিয়তা পায় ১৯৯০’র দশকের গোড়ার দিকে, যখন যুক্তরাষ্ট্রের প্রতিরক্ষা বিভাগ সন্ধানে ছিল এমন একটি প্রযুক্তির, যার মাধ্যমে তারা অবৈধভাবে সীমানা অতিক্রমকারী সন্ত্রাসীদের শনাক্ত করতে পারবে। প্রতিরক্ষা বাহিনী তখন নিয়োগ দেয় বিভিন্ন বিশ্ববিদ্যালয়ের নামকরা বিজ্ঞানী ও গবেষকদের, যারা ইতিপূর্বেও ফেসিয়াল রিকগনিশন খাতে কাজ করেছেন এবং কমবেশি সাফল্য পেয়েছেন। তাদেরকে এবার সরকারিভাবে বড় অংকের তহবিল জুটিয়ে দেয়া হয়, যাতে তারা দেশের স্বার্থে তাদের গবেষণাটিকে পরবর্তী পর্যায়ে নিয়ে যেতে পারে।

প্রথম প্রকাশ্যে ফেসিয়াল রিকগনিশন ব্যবহৃত হয় ২০০১ সালের সুপার বোলে; Image Source: Getty Images

ফেসিয়াল রিকগনিশন প্রযুক্তিটি পত্রিকার পাতায় সাহসী শিরোনাম হিসেবে আবির্ভূত হতে থাকে ২০০১ সালে, প্রথমবারের মতো কোনো প্রকাশ্য অনুষ্ঠানে, টেম্পাতে অনুষ্ঠিত সুপার বোল ৩৫-এ ব্যবহৃত হওয়ার অব্যবহিত পরেই। সেখানেও আইন-শৃঙ্খলা রক্ষাকারী বাহিনী এ প্রযুক্তিটি ব্যবহার করেছিল এটি নির্ণয় করার জন্য যে হাজার হাজার দর্শক-সমর্থকের ভিড়ে কোনো দুর্ধর্ষ অপরাধী ঘাপটি মেরে রয়েছে কি না। এর কিছুদিনের মধ্যেই প্রযুক্তিটির ব্যাপক ব্যবহার শুরু হয়ে যায়, এবং যুক্তরাষ্ট্রের অন্যান্য সংবেদনশীল জায়গাতেও অপরাধ ও অপরাধীদের চিহ্নিত করার উদ্দেশ্যে এ প্রযুক্তির সদ্ব্যবহার করা হতে থাকে।

যদিও ফেসিয়াল রিকগনিশন সবচেয়ে দ্রুত বর্ধনশীল বায়োমেট্রিক প্রযুক্তি, এটি একাধারে সবচেয়ে বিতর্কিত প্রযুক্তিও বটে। ৯/১১ ট্র্যাজেডির পর অনেক মানুষই সমর্থন করেছিল নতুন এই প্রযুক্তিটির ব্যবহার। কিন্তু যখন দেখা গেল প্রযুক্তিটি মানুষের দৈনন্দিন জীবনের গভীর থেকে গভীরে গিয়ে হানা দিচ্ছে এবং প্রাইভেসির দফারফা করে দিচ্ছে, তখন অনেকেই বুঝতে পারে যে এর অনেক নেতিবাচক দিকও রয়েছে। আরো বড় কথা হলো, কেউ যদি অন্য কারো মৌখিক বৈশিষ্ট্যসমূহ অনুকরণ করতে পারে, তাহলে তো অন্যের পরিচয় চুরি করে নিজের অপরাধ অন্যের উপর অনায়াসে চালিয়ে দিতে পারবে। ফলে অপরাধ কমানোর উদ্দেশ্যে সৃষ্ট প্রযুক্তিটি উলটো অপরাধপ্রবণতা আরো বাড়িয়ে দেবে।

আজকাল অনেক মোবাইল আনলকেও প্রয়োজন হয় ফেসিয়াল রিকগনিশন; Image Source: Flickr

কীভাবে কাজ করে ফেসিয়াল রিকগনিশন প্রযুক্তি

একটি ফেসিয়াল রিকগনিশন সেট আপে থাকে কয়েকটি উন্নতমানের ক্যামেরা, যেগুলো তার সামনে দাঁড়ানো বা হাঁটতে থাকা মানুষের ছবি তুলে রাখে। এছাড়া থাকে বাস্তবধর্মী বকা ব্যবহারিক সফটওয়্যার, যারা ওই ছবিগুলো নিয়ে কাজ করতে থাকে এবং চেষ্টা করে তার কাছে থাকে বিশাল ডাটাবেজে সংরক্ষিত কোনো ব্যক্তির সাথে ওই ছবির মুখাবয়বের মিল খুঁজে বের করা যায় কি না। চলুন, এবার আরেকটু গভীরে গিয়ে জানা যাক ফেসিয়াল রিকগনিশনের প্রাযুক্তিক সূক্ষ্মাতিসূক্ষ্ম ব্যাপারগুলো সম্পর্কে।

ফেসিয়াল আইডেন্টিফিকেশনের প্রাথমিক ধাপ

যেমনটি আগেই বলা হয়েছে, ফেসিয়াল রিকগনিশনের পদ্ধতিগুলোর মধ্যে তফাৎ রয়েছে খুবই অল্প, যা নির্ভর করে সেগুলোর প্রয়োগ ও উৎপাদকের উপর। তবে সাধারণত সকল সিস্টেমই কিছু নির্দিষ্ট ধাপ পার করে আসে। সেগুলো হলো:

ডিটেকশন: যখন কোনো ফেসিয়াল রিকগনশন সিস্টেমকে একটি ভিডিও সার্ভেইল্যান্স সিস্টেমের সাথে সংযুক্ত করা হয়, তখন রিকগনিশন সফটওয়্যারটি গোটা ক্যামেরার ভিউটিকে স্ক্যান করে দেখে। প্রতিটি মুখ সদৃশ ছবি শনাক্ত করা হয়, যেগুলোর উপর মাথা সদৃশ আকৃতিও বিদ্যমান থাকে। এরপর সে ওই ছবিগুলোকে সিস্টেমে পাঠিয়ে দেয় আরো প্রক্রিয়াজাতকরণের জন্য। সিস্টেম তখন হিসাব করে মাথার অবস্থান, কৌণিক আকৃতি, দৈর্ঘ্য-প্রস্থ ইত্যাদি। সাধারণত একটি মুখকে অন্তত ৩৫ ডিগ্রি কোণে ক্যামেরার দিকে ঘুরে থাকতে হয়, যদি ক্যামেরাটি নিখুঁতভাবে সেই মুখকে শনাক্ত করতে চায়।

ফেসিয়াল ডিটেকশন; Image Source: Sylenius/Wikimedia Commons

নরমালাইজেশন: কোনো মুখের তোলা ছবিটিকে এরপর স্কেল করা হয় এবং রোটেশনের মাধ্যমে একটি সাধারণ ছবির মতো ধরন ও আকৃতিতে নিয়ে আসা হয়। একে বলা হয় নরমালাইজেশন। নরমালাইজেশনের পর, সফটওয়্যারটি মুখের জ্যামিতিক বৈশিষ্ট্যসমূহ বিশ্লেষণ করে। এক্ষেত্রে প্রধান বিবেচ্য বিষয়সমূহ হয় দুই চোখের মধ্যকার দূরত্ব, ঠোঁটের পুরুত্ব, চোয়াল ও কপালের মধ্যকার দূরত্ব, এবং অন্যান্য আরো অনেক সূক্ষ্ম বিষয়। কিছু কিছু অত্যাধুক সিস্টেম তো রয়েছে যারা এমন শত শত কি ফ্যাক্টর নিয়ে কাজ করে। এই প্রক্রিয়াজাতকরণ শেষে যে ফলাফলে পৌঁছানো হয়, তাকে বলা হয় ফেসিয়াল সিগনেচার।

ফেস নরমালাইজেশন; Image Source: Pixabay

রিপ্রেজেন্টেশন: ফেসিয়াল সিগনেচারটি গড়ে তোলার পর, সিস্টেম এটিকে একটি ইউনিক কোডে কনভার্ট করে। এই কোডিংয়ের ফলে কম্পিউটারভিত্তিক তুলনামূলক যাচাইয়ের কাজটি সহজ হয়ে যায়। যাচাই বলতে বোঝায় নতুন প্রাপ্ত ফেসিয়াল ডাটাগুলোর সাথে ডাটাবেজে সংরক্ষিত ডাটাগুলোর তুলনা করে দেখা যে কোনোটির সাথে সাদৃশ্য খুঁজে পাওয়া যায় কি না।

ম্যাচিং: এটিই হলো গোটা প্রক্রিয়ার সর্বশেষ ধাপ। এবার নতুন প্রাপ্ত ডাটা ও পূর্বে সংগৃহীত ডাটাগুলোর মধ্যে তুলনামূলক বিশ্লেষণ করা হয়। যদি ডাটাবেজে থাকা কোনো ছবির সাথে নতুন ছবির ডাটার মিল খুঁজে পাওয়া যায়, তখন সফটওয়্যারটি ওই পূর্বতন ছবির যাবতীয় তথ্য বের করে আনে, এবং সেগুলোকে অপারেটরের সামনে হাজির করে।

LEAVE A REPLY

Please enter your comment!
Please enter your name here