মেটা দ্বারা SAM 2: ফটো এবং ভিডিওর জন্য কৃত্রিম দৃষ্টিতে উদ্ভাবন

SAM 2 মেটা এবং ভিডিওতে সেগমেন্টেশন

মেটা, ফেসবুক, ইনস্টাগ্রাম এবং হোয়াটসঅ্যাপের জন্য দায়ী সংস্থা, অন্যদের মধ্যে, সর্বশেষ ভাগ করা হয়েছে SAM 2 পূর্বরূপ. এটি তার প্রযুক্তির নতুন সংস্করণ সেগমেন্ট এনিথিং মডেল, একটি কৃত্রিম বুদ্ধিমত্তা মডেল যা কোনো বস্তুর পিক্সেল সনাক্ত করতে এবং সেগুলি অনুসরণ করতে যেকোনো ছবি বা ভিডিওকে ভাগ করতে সক্ষম। এইভাবে, একটি চিত্র থেকে একটি নির্দিষ্ট অভিনেতা বা বস্তুকে আলাদা করা এবং তারপরে বিভিন্ন সম্পাদনার কাজ সম্পাদন করা সম্ভব।

2023 সালের এপ্রিলে এটি উপস্থিত হত মেটা এসএএম, এবং এই নতুন সংস্করণে কৃত্রিম বুদ্ধিমত্তা নতুন ফাংশন এবং ক্ষমতা অন্তর্ভুক্ত করে। এই নতুন উপস্থাপনার হাইলাইটগুলির মধ্যে আমাদের অবশ্যই ভিডিও সম্পাদনা ক্ষমতার পাশাপাশি কম্পিউটার গ্রাফিক্সের বিবর্তন এবং অনেক বেশি বাস্তবসম্মত এবং বহুমুখী ইন্টারেক্টিভ কৌশল তৈরি করার সম্ভাবনাকে হাইলাইট করতে হবে।

মেটা, নতুন সেগমেন্টেশন AI থেকে SAM 2 যা অন্তর্ভুক্ত করে

বোঝা মেটা SAM এর অপারেশন এবং দ্বিতীয় সংস্করণ যে নতুন বৈশিষ্ট্যগুলি নিয়ে এসেছে তা প্রযুক্তির জগতে কৃত্রিম বুদ্ধিমত্তার অগ্রগতির প্রতিফলন ঘটায়। প্রথমত, উভয় প্রযুক্তির শেষ লক্ষ্য একই থাকে। এটি উচ্চ নির্ভুলতা সহ চিত্রগুলিতে বস্তুগুলিকে ভাগ করার জন্য ডিজাইন করা হয়েছিল, স্বয়ংক্রিয় সম্পাদনা এবং স্ক্রিনে উপাদানগুলির সনাক্তকরণের সুবিধার্থে৷ AI সেই পিক্সেলগুলিকে চিহ্নিত করে যা একটি নির্দিষ্ট বস্তুর সাথে মিলে যায় এবং প্রযুক্তির জগতে এর একাধিক ব্যবহার রয়েছে।

মেরিটাইম সায়েন্স, মেডিসিন এবং স্যাটেলাইট ইমেজ অ্যানালাইসিসের মতো শাখায়, উদাহরণস্বরূপ, মেটার এসএএম 2 একটি দুর্দান্ত হাতিয়ার হতে পারে। SAM-এর ব্যবহার থেকে উদ্ভূত কিছু টুলের মধ্যে রয়েছে Instagram-এর ব্যাকড্রপ এবং কাটআউট, যা ফটো ফাইল সম্পাদনাকে উল্লেখযোগ্যভাবে সহজ করে তোলে।

কিন্তু SAM এর প্রধান ফোকাস ছিল স্থির চিত্রের উপর. এই নতুন সংস্করণটি চলমান বিষয়বস্তু, ভিডিও এবং টুকরোকেও লক্ষ্য করে যেখানে SAM 2 নির্দিষ্ট বস্তু নির্ধারণ এবং বিচ্ছিন্ন করতে সক্ষম। একটি অডিওভিজ্যুয়াল ফাইল বিশ্লেষণের জটিলতা বেশি, কিন্তু সবকিছুই ইঙ্গিত দেয় যে মেটা কৃত্রিম বুদ্ধিমত্তা এবং এর ব্যবহারিক প্রয়োগের দৌড়ে এগিয়ে যাচ্ছে।

Meta এর SAM 2 যে নতুন বৈশিষ্ট্যগুলিকে অন্তর্ভুক্ত করে

এর SAM 2 সংস্করণে মেটা সেগমেন্টেশন মডেলটি খুব নির্দিষ্ট উদ্দেশ্যের সাথে নতুন ফাংশন অন্তর্ভুক্ত করে। একদিকে, রিয়েল টাইমে সেগমেন্টেশন সঞ্চালনের সম্ভাবনা, ভিডিওতে বস্তুগুলি সনাক্ত করার জন্য, তবে অভিযোজন ছাড়াই একটি ওপেন সোর্স ডিজাইন এবং সাধারণীকরণও।

মুক্ত উত্স

মেটা একটি হিসাবে SAM 2 প্রকাশ করেছে Apache 2.0 লাইসেন্সের অধীনে ওপেন সোর্স. এইভাবে, বিকাশকারীরা যারা এটি করতে ইচ্ছুক তারা কাস্টম অ্যাপস এবং সরঞ্জামগুলি তৈরি করতে সক্ষম হবে যা SAM 2 এর সাথে সম্পূর্ণরূপে সামঞ্জস্যপূর্ণ এবং খুব বেশি জটিলতা ছাড়াই৷

ডেটাসেট SA-V

মেটা সেগমেন্টেশন মডেলের নতুন সংস্করণ অন্তর্ভুক্ত SA-V নামে একটি নতুন ডেটাসেট। বাস্তব জগত থেকে আনুমানিক 51.000 ভিডিও বের করা হয়েছে এবং বিভিন্ন ফাংশন এবং ক্ষমতা যোগ করার জন্য কৃত্রিম বুদ্ধিমত্তা প্রশিক্ষণের জন্য ব্যবহৃত হয়। এছাড়াও, ভিডিও এডিটিং কাজগুলিতে প্রয়োগ করার জন্য এটিতে 600.000-এরও বেশি স্প্যাটিও-টেম্পোরাল মাস্ক অন্তর্ভুক্ত রয়েছে।

রিয়েল-টাইম সেগমেন্টেশন

Meta এর আসল SAM থেকে ভিন্ন, এই সংস্করণ 2 রিয়েল টাইমে ভিডিও এবং ক্রিয়াকলাপে অবজেক্ট সনাক্ত করতে এবং সেগমেন্ট করতে সক্ষম. এই ক্রিয়াটি ব্যবহারকারীকে অ্যাপে উত্সর্গ করতে হবে এমন ইন্টারঅ্যাকশন সময়কে উল্লেখযোগ্যভাবে হ্রাস করতেও কাজ করে।

অভিযোজন ছাড়াই সাধারণীকরণ

SAM 2 সহ আপনি যেকোনো ভিডিও বা ছবিতে যেকোনো বস্তুকে সেগমেন্ট করতে পারেন, এমনকি সেই ভিজ্যুয়াল ডোমেনেও যা আগে দেখা যায়নি। এইভাবে, প্রতিটি নির্দিষ্ট ক্ষেত্রে ব্যক্তিগতকৃত অভিযোজনের প্রয়োজনীয়তা দূর করা হয়।

ইউনিফাইড ফ্রেমওয়ার্ক

মেটা যে আগের মডেলগুলিতে কাজ করেছিল সেগুলি ছবি এবং ভিডিওগুলিতে আলাদাভাবে কাজ করেছিল। এখন SAM 2 পদ্ধতিটি সমন্বিত, এইভাবে নতুন কৌশলগুলির আরও বহুমুখী শিক্ষা অর্জন করে এবং বিশ্লেষণ করা বিভিন্ন ধরণের ভিজ্যুয়াল ডেটা জুড়ে ধারাবাহিক পারফরম্যান্স প্রদান করে।

ইন্টারেক্টিভ সেগমেন্টেশন

SAM 2 ব্যবহারকারী অন্যান্য আকর্ষণীয় ক্ষমতাও তৈরি করে আপনি বাউন্ডিং বাক্সগুলির সাথে মডেলের মনোযোগকে গাইড করতে পারেন অথবা নির্দিষ্ট বিবরণের মাধ্যমে, অথবা ক্লিক করে। এটি একটি মডেল যা নির্দিষ্ট এবং বিভিন্ন প্রয়োজনের সাথে খুব দ্রুত খাপ খায়। শেষ পর্যন্ত, মেটা থেকে একটি ন্যূনতম SAM 2 ইনপুট দিয়ে আপনি মহান নির্ভুলতার সাথে বস্তুগুলি সনাক্ত করতে সক্ষম হবেন।

কিভাবে Meta এর SAM 2 AI কাজ করে

মেটার SAM 2 এর সাথে বিভাজনে গতি এবং দক্ষতা

La মেটা আর্টিফিশিয়াল ইন্টেলিজেন্স এর SAM 2 সংস্করণে এটি বস্তুর বিভাজন প্রক্রিয়ায় গতি এবং দক্ষতা যোগ করে। বিকাশকারীরা এমন একটি প্ল্যাটফর্ম তৈরি করা সম্ভব করেছে যা ফটো এবং ভিডিও থেকে নির্দিষ্ট পাঠ্য বিবরণ পর্যন্ত দ্রুত এবং কার্যকর ফলাফল সহ সমস্ত ধরণের উপাদান বিশ্লেষণ করে৷

উচ্চ রেজোলিউশন ইমেজ প্রক্রিয়াকরণ

SAM 2 উচ্চ মানের ছবি নিয়েও কাজ করে. এটি মডেলের পূর্ববর্তী সংস্করণগুলির দ্বারা সমর্থিত রেজোলিউশনের 4 গুণ পর্যন্ত ফটোগুলি পরিচালনা করতে পারে৷ এটি অনেক বেশি আকর্ষণীয় এবং বাস্তবসম্মত ফলাফলের নিশ্চয়তা দেয়। ওষুধ বা স্যাটেলাইট মানচিত্রের ব্যাখ্যার মতো চিত্র ক্ষেত্রে বিশ্লেষণ এবং স্ক্যান করার ক্ষেত্রে এটি একটি দুর্দান্ত উন্নতি।

উচ্চতর সংজ্ঞা, সহজ এবং দ্রুত বস্তু এবং ব্যক্তি বিভাগ করা যেতে পারে। SAM 2 এর মূল হল একটি বহুমুখী টুল প্রদান করা, যা দ্রুত মানিয়ে নিতে এবং বিভিন্ন ক্রিয়াকলাপের জন্য দুর্দান্ত ফলাফল প্রদান করতে সক্ষম।

SAM 2 কি প্রয়োগ করা যেতে পারে?

কৃত্রিম বুদ্ধিমত্তার দুর্দান্ত অগ্রগতি এবং এর সম্প্রসারণের জন্য কাজ বোঝা, এটি দেখতে আকর্ষণীয় ক্ষেত্র যেখানে মেটা চালু করার সিদ্ধান্ত নিয়েছে. SAM 2 মডেলের মাধ্যমে, বিভিন্ন ক্ষেত্রে অগ্রগতি আশা করা যায়। রিয়েল-টাইম এবং স্বয়ংক্রিয় ভিডিও সম্পাদনা থেকে শুরু করে অটোমেশন এবং রোবোটিক অ্যাকশন।

এছাড়াও চিকিৎসা এবং বিজ্ঞানের ক্ষেত্রগুলি কৃত্রিম বুদ্ধিমত্তার সাথে ঘনিষ্ঠভাবে সম্পর্কিত, অভিনব কৌশল বিকাশ করতে এই অগ্রগতি ব্যবহার করতে সক্ষম হচ্ছে. মেটাতে কম্পিউটার প্রকৌশলীরাও SAM 2-এর সুনির্দিষ্ট ব্যবহার রয়েছে এবং ডেটা টীকা এবং ডাম্পিং সম্পর্কিত ক্ষেত্রগুলিতে দ্রুত অগ্রগতির অনুমতি দেয় তা নিশ্চিত করার জন্য কঠোর পরিশ্রম করছেন। যে প্ল্যাটফর্মগুলি বিভিন্ন ডেটা সংগ্রহ করে সেগুলি SAM 2 ব্যবহার করতে পারে, নিদর্শনগুলি খুঁজে পেতে এবং ফলাফলগুলি যে গতিতে প্রদর্শিত হয় তা দ্রুতগতিতে ত্বরান্বিত করতে পারে৷ দিগন্ত এখনও দৃষ্টির বাইরে। এআই তার সেরা অবস্থায় রয়েছে এবং মেটা নৌকাটি মিস করতে চায় না। এর বিকাশকারীরা পূর্ণ গতিতে কাজ করে, এবং SAM 2 অনেক ফ্রন্টে, এটি একটি দুর্দান্ত প্রস্তাব হতে পারে।


আপনার মন্তব্য দিন

আপনার ইমেল ঠিকানা প্রকাশিত হবে না। প্রয়োজনীয় ক্ষেত্রগুলি দিয়ে চিহ্নিত করা *

*

*

  1. ডেটার জন্য দায়বদ্ধ: মিগুয়েল অ্যাঞ্জেল গাটান
  2. ডেটার উদ্দেশ্য: নিয়ন্ত্রণ স্প্যাম, মন্তব্য পরিচালনা।
  3. আইনীকরণ: আপনার সম্মতি
  4. তথ্য যোগাযোগ: ডেটা আইনি বাধ্যবাধকতা ব্যতীত তৃতীয় পক্ষের কাছে জানানো হবে না।
  5. ডেটা স্টোরেজ: ওসেন্টাস নেটওয়ার্কস (ইইউ) দ্বারা হোস্ট করা ডেটাবেস
  6. অধিকার: যে কোনও সময় আপনি আপনার তথ্য সীমাবদ্ধ করতে, পুনরুদ্ধার করতে এবং মুছতে পারেন।