বৃহৎ ভাষা মডেল (LLM) দক্ষতা এবং বিশ্বাসের মধ্যে দড়ির উপর চলতে থাকে। ব্যবহারকারীরা এটিকে কার্যকর মনে করে, কিন্তু এর নির্ভুলতা সম্পর্কে সন্দেহ করে।
কিছু ক্ষেত্রে এটি অতিরিক্তও হতে পারে। উদাহরণস্বরূপ, উচ্চ কম্পিউটেশনাল খরচের কারণে সমস্ত অভ্যন্তরীণ HR কাজের জন্য LLM সর্বোত্তম পছন্দ নাও হতে পারে।
এই সমস্ত দ্বন্দ্বের মধ্যে, একটি নতুন ধরনের মডেল জনপ্রিয় হচ্ছে: ছোট ভাষা মডেল (SLM)। এগুলি সরল মডেল যা একটি নির্দিষ্ট কাজ করার জন্য ছোট ডেটাসেটে প্রশিক্ষিত। এটি উচ্চ দক্ষতা, আরও বিশ্বাস এবং কম খরচের সব বাক্স টিক করে।
সাম্প্রতিক কিছু গবেষণা বলছে ছোট ভাষা মডেল এজেন্টিক AI-এর ভবিষ্যৎ। এই নিবন্ধে, আমি এমন ব্যবহারের ক্ষেত্রগুলি তালিকাভুক্ত করেছি যেখানে একটি SLM একটি LLM-এর তুলনায় আরও দক্ষ হবে।
আপনি যদি ভাবছেন আপনার SLM যাত্রা কোথা থেকে শুরু করবেন, আমি নীচে সাধারণ ব্যবসায়িক কার্যক্রমে সেরা SLM ব্যবহারের ক্ষেত্রগুলি সংকলন করেছি।
LLM মডেলগুলি গ্রাহক সেবার জন্য সহায়ক হতে পারে, তবে বড় সতর্কতার সাথে। এই মডেলগুলি বিশাল ডেটাসেটে প্রি-ট্রেইন করা হয়, যা প্রায়শই ইন্টারনেট থেকে সংগ্রহ করা হয়। এই জ্ঞানের কিছু আপনার গ্রাহক সেবার জন্য প্রযোজ্য হতে পারে বা নাও হতে পারে, বিশেষ করে যখন কোম্পানির নীতিগুলি নির্দিষ্ট হয়। আপনি গ্রাহক-মুখী চ্যাটবট থাকার ঝুঁকিতে পড়েন যা হ্যালুসিনেট করে। উদাহরণস্বরূপ, এয়ার কানাডার ওয়েবসাইটে একটি গ্রাহক সেবা চ্যাটবট একটি নীতির বিরুদ্ধে একজন গ্রাহককে শোক রিফান্ডের প্রতিশ্রুতি দিয়েছিল যা কখনও ছিল না।
গ্রাহক চ্যাটবট এবং অভিযোগ পোর্টালগুলির জন্য SLM আরও বেশি অর্থপূর্ণ। এই পোর্টালগুলি প্রায়শই অত্যন্ত পুনরাবৃত্তিমূলক সমস্যা/প্রশ্নগুলি নিয়ে কাজ করে এবং রেফার করার জন্য কোম্পানির নীতিগুলির একটি সীমিত ভাণ্ডার রয়েছে। মডেলটি অতীত গ্রাহক টিকেট ডেটা এবং কোম্পানির নীতিগুলিতে সহজেই প্রশিক্ষিত করা যেতে পারে। গ্রাহকদের উত্তর দেওয়ার জন্য মডেলের জন্য এটাই যথেষ্ট।
অবশ্যই, SLM সবকিছু পরিচালনা করতে পারে না, এবং যেখানে বট প্রশ্নের উত্তর দিতে পারে না, আপনি সবসময় একজন মানুষকে জড়িত করতে পারেন। যদি এটি একটি চ্যাটবট হয়, আপনি গ্রাহককে কল করার জন্য একটি সাপোর্ট নম্বর প্রদান করতে পারেন। যদি এটি একটি টিকেট ম্যানেজমেন্ট প্ল্যাটফর্ম হয়, তাহলে টিকেটটি স্বয়ংক্রিয়ভাবে সমাধান করা যেতে পারে যদি এটি SLM-এর জন্য একটি পরিচিত সমস্যা হয়, অন্যথায় একজন গ্রাহক সহায়তা কর্মকর্তাকে বরাদ্দ করা যেতে পারে। অন্তত, আপনি নিশ্চিত থাকতে পারেন যে স্বয়ংক্রিয়করণ গ্রাহককে এমন কিছু প্রতিশ্রুতি দিচ্ছে না যা সম্ভব নয়।
LLM নিশ্চিতভাবে বিক্রয় এবং বিপণনের কিছু ক্ষেত্রে উৎকৃষ্ট, বিশেষ করে কন্টেন্ট তৈরিতে। বৃহত্তর প্রশিক্ষণ ডেটা বিভিন্ন বিষয় পরিচালনা করতে সাহায্য করে। কিন্তু লিড কোয়ালিফিকেশন/নার্চারিং এবং ব্যক্তিগতকৃত আউটরিচের মতো আরও নিশ্চিত কাজের জন্য LLM ব্যবহার করা সর্বোত্তম পছন্দ নাও হতে পারে। এর সাধারণীকৃত প্রতিক্রিয়া আপনার সম্ভাব্য গ্রাহকদের কাছে একটি ভাল ধারণা দেবে না।
SLM আপনাকে আরও ব্যক্তিগতকৃত আউটরিচ বার্তা তৈরি করতে সাহায্য করে। এটি লিড যোগ্যতা নির্ধারণের জন্য আপনার মালিকানাধীন ডেটাসেটে প্রশিক্ষিত করা যেতে পারে। আপনি কিছু আউটরিচ বার্তা তৈরি করতে পারেন যা অতীতে আপনার জন্য কাজ করেছে এবং সেগুলির উপর ভিত্তি করে আরও আউটরিচ বার্তা তৈরি করতে SLM মডেল ব্যবহার করতে পারেন। SLM আপনাকে জেনেরিক AI আউটরিচ বার্তা থেকে দূরে সরতে সাহায্য করে।
LLM সাধারণ বাজার বিশ্লেষণের জন্য ব্যবহার করা যেতে পারে। কিন্তু জালিয়াতি সনাক্তকরণ এবং কমপ্লায়েন্স মনিটরিংয়ের মতো উচ্চ ঝুঁকিপূর্ণ কাজের জন্য এটি পিছিয়ে পড়ে। জালিয়াতির হার বাড়ছে উভয় ভোক্তা এবং ব্যবসায়িক অ্যাকাউন্টে। কোম্পানিগুলি জালিয়াতি-সনাক্তকরণ সিস্টেম তৈরি করা সত্ত্বেও, জালিয়াতরা সেগুলি এড়িয়ে যাওয়ার নতুন উপায় খুঁজে পাচ্ছে। মডেলটির ক্রমাগত পুনরায় প্রশিক্ষণের প্রয়োজন। এখানেই SLM উজ্জ্বল হয় এবং LLM পিছনের সিটে চলে যায়।
একটি SLM-এর তুলনায় একটি LLM পুনরায় প্রশিক্ষণ দিতে আরও সময় এবং সম্পদ লাগে। সিস্টেমকে আরও শক্তিশালী করতে SLM-কে সর্বশেষ জালিয়াতি ডেটা দিয়ে ক্রমাগত আপডেট করা যেতে পারে।
কমপ্লায়েন্স ডেটার জন্যও একই কথা। LLM-এর পুরানো কমপ্লায়েন্স তথ্যও থাকতে পারে, যার ফলে মিস হতে পারে। একটি ছোট ডেটাসেটে প্রশিক্ষিত SLM পর্যালোচনা এবং পরিমার্জন করা সহজ যাতে জ্ঞান ভিত্তিতে শুধুমাত্র সর্বশেষ প্রবিধান উপলব্ধ থাকে।
LLM সাধারণ চাকরির বিবরণ, কর্মচারী যোগাযোগ, বা প্রশিক্ষণ সামগ্রী খসড়া করার জন্য দুর্দান্ত। উচ্চ কমপ্লায়েন্স ঝুঁকি সহ কাজগুলি (উদাহরণ: নীতি নথি, কর্মসংস্থান চুক্তি এবং অভিবাসন নথি তৈরি করা) হল যেখানে জিনিসগুলি জটিল হয়ে যায়।
দেশ বা এমনকি রাজ্যগুলি তাদের শ্রম আইন আপডেট করতে থাকে। উদাহরণস্বরূপ, অস্ট্রেলিয়ান সরকার 2025 সালে প্যারেন্টাল লিভ বাড়িয়েছে 24 সপ্তাহ, এবং 2026 সাল থেকে এটি আরও দুই সপ্তাহ বাড়ানো হবে। নিউ ইয়র্ক সম্প্রতি গিগ ওয়ার্কারদের জন্য ন্যূনতম ঘণ্টা প্রতি মজুরি বাড়িয়েছে। জাপান কাজ-জীবন ভারসাম্য এবং নতুন পিতামাতাদের জন্য নমনীয় কাজের ব্যবস্থা প্রচার শুরু করেছে।
LLM ব্যবহার করার অর্থ হল ক্রমাগত চেক করা যে ব্যাকএন্ডে জ্ঞান ভিত্তি সঠিক এবং আপ টু ডেট। ডাটাবেসে ভুলবশত কোনো পুরানো নীতি ফাইল বাদ দিলে হ্যালুসিনেশন হতে পারে।
ছোট ভাষা মডেলের অর্থ হল জ্ঞান ভিত্তিতে আরও বেশি নিয়ন্ত্রণ এবং কমপ্লায়েন্সের জন্য আরও নিশ্চয়তা। উদাহরণস্বরূপ, Deel AI হল একটি ছোট ভাষা মডেল যা এর কমপ্লায়েন্স বিশেষজ্ঞদের দ্বারা কিউরেট করা হয়েছে। এই বিশেষজ্ঞরা ক্রমাগত জ্ঞান ভিত্তি আপডেট করে যাতে আপনি সবচেয়ে আপ-টু-ডেট এবং সঠিক উত্তর পান।
G2 থেকে একটি নতুন AI গ্রহণ সমীক্ষা দেখায় যে প্রায় 75% ব্যবসা দৈনিক ব্যবসায়িক কার্যক্রমে একাধিক AI বৈশিষ্ট্য ব্যবহার করে। AI পরিচালনাগত দক্ষতা চালাচ্ছে এবং উৎপাদনশীলতা উন্নত করছে। SLM এবং LLM উভয়েরই এতে অংশ নেওয়ার আছে।
ঝুঁকি ব্যবস্থাপনা, চাহিদা পূর্বাভাস, সরবরাহকারী পর্যালোচনা এবং আরও অনেক কিছুর মতো কৌশলগত কাজে LLM উজ্জ্বল। এর বিশাল জ্ঞান ভিত্তি একটি পরামর্শ দেওয়ার আগে সব দিক বিবেচনা করতে সাহায্য করে। অন্যদিকে, SLM পুনরাবৃত্তিমূলক কাজের জন্য সবচেয়ে ভাল কাজ করে। ইনভয়েস ম্যানেজমেন্ট, শিপমেন্ট ট্র্যাকিং, রুট অপ্টিমাইজেশন, ব্যাকগ্রাউন্ড চেক, বা প্রিডিক্টিভ মেইনটেন্যান্স সম্পর্কে ভাবুন। কাজগুলি সীমিত নিয়ম এবং কোম্পানির অতীত ডেটার উপর চলতে পারে।
কোম্পানিগুলি রুটিন, পুনরাবৃত্তিমূলক কাজে SLM ব্যবহার করে উপকৃত হচ্ছে। উদাহরণস্বরূপ, Checkr, একটি কর্মচারী ব্যাকগ্রাউন্ড স্ক্রিনিং প্ল্যাটফর্ম, ব্যাকগ্রাউন্ড চেক স্বয়ংক্রিয় করতে LLM থেকে SLM-এ স্থানান্তরিত হয়েছে এবং ভাল নির্ভুলতা, দ্রুত প্রতিক্রিয়া সময় এবং খরচে 5X হ্রাস দেখেছে।
SLM এবং LLM-এর তুলনায়, উত্তরটি SLM এবং LLM-এর মধ্যে বেছে নেওয়া নয়। আরও ভাল পদ্ধতি হল তাদের একটি হাইব্রিড মডেল হিসাবে একসাথে ব্যবহার করা। SLM এবং LLM উভয়েরই নিজস্ব শক্তি এবং দুর্বলতা রয়েছে। SLM সুনির্দিষ্ট স্কোপ এবং সীমিত ডেটাসেট সহ কাজগুলিতে ভাল কাজ করে। কিন্তু যুক্তি প্রয়োজন এমন কাজের জন্য, LLM একটি অনেক ভাল পছন্দ।
সাপ্লাই চেইন ম্যানেজমেন্টের উদাহরণ নেওয়া যাক। সাপ্লাই চেইন ম্যানেজমেন্টের জন্য একটি হাইব্রিড পদ্ধতি ভাল যেখানে:
SLM এবং LLM একসাথে ব্যবহার করে সাপ্লাই চেইনের সমস্ত নাট এবং বোল্ট পরিচালনা করার জন্য একটি সম্পূর্ণ মডেল তৈরি করে।
আপনার SLM বাস্তবায়ন শুরু করার বিষয়ে একটি ভাল জিনিস হল যে ফাইন-টিউনিংয়ের জন্য মডেল উপলব্ধ রয়েছে। আপনি আপনার ব্যবহারের ক্ষেত্র অনুযায়ী এগুলির মধ্যে একটি বেছে নিতে পারেন:
আরও বেশি SLM মডেল চালু হওয়ার সাথে, আপনাকে স্ক্র্যাচ থেকে কোনো মডেল তৈরি করতে হবে না। শুধু আপনার ব্যবহারের ক্ষেত্র অনুযায়ী একটি বিদ্যমান মডেল বেছে নিন, এর জন্য তথ্যের একটি জ্ঞান ভিত্তি তৈরি করুন, এবং আপনি যেতে প্রস্তুত।
\n

