ন্যানো ব্যানানা ২, নতুন এআই-চালিত ইমেজিং স্ট্যান্ডার্ড যা গুগল তার সমগ্র ইকোসিস্টেমে একীভূত করছে।

  • ন্যানো ব্যানানা ২ (জেমিনি ৩.১ ফ্ল্যাশ ইমেজ) ফ্ল্যাশের মতো গতি এবং প্রায়-প্রো মানের সমন্বয় করে, যার রেজোলিউশন ৪K পর্যন্ত এবং কম ল্যাটেন্সি রয়েছে।
  • রিয়েল-টাইম ওয়েব অ্যাক্সেস, উন্নত টেক্সট-টু-ইমেজ কার্যকারিতা এবং প্রতি প্রবাহে সর্বোচ্চ ৫টি অক্ষর এবং ১৪টি বস্তুর ধারাবাহিকতা এটিকে একটি নতুন ভিজ্যুয়াল স্ট্যান্ডার্ডে পরিণত করেছে।
  • এটি জেমিনি অ্যাপ, সার্চ, লেন্স, গুগল অ্যাডস, এআই স্টুডিও, ভার্টেক্স এআই এবং ফ্লোর সাথে একীভূত হয়, পরবর্তীতে কোনও ক্রেডিট খরচ ছাড়াই।
  • ইউরোপে ডিপফেকের উত্থান এবং নিয়ন্ত্রক প্রয়োজনীয়তার মুখে সিন্থআইডি এবং সি২পিএ শংসাপত্রগুলি কন্টেন্ট ট্রেসেবিলিটি শক্তিশালী করে।

ছবি তৈরির জন্য এআই মডেল

গুগল AI-জেনারেটেড ইমেজারির ব্যবহার দ্বিগুণ করেছে, যা চালু করার সাথে সাথে ন্যানো ব্যানানা ২, জেমিনি পরিবারের মধ্যে নতুন ছবির মানদণ্ডপ্রযুক্তিগতভাবে জেমিনি ৩.১ ফ্ল্যাশ ইমেজ নামে চিহ্নিত এই মডেলটি অতি-দ্রুত সিস্টেম এবং সর্বাধিক ভিজ্যুয়াল ফিডেলিটির উপর দৃষ্টি নিবদ্ধ করে এমন সরঞ্জামগুলির মধ্যে যে ব্যবধান ছিল তা পূরণ করার চেষ্টা করে এবং এটি বিপণন প্রচারণা থেকে শুরু করে বৃহৎ আকারের সামগ্রী উৎপাদন পর্যন্ত পেশাদার ব্যবহারগুলিকে লক্ষ্য করে তা করে।

একটি সাধারণ পুনরাবৃত্তি থেকে অনেক দূরে, এই প্রকাশটি প্রতিনিধিত্ব করে ভিজ্যুয়াল জেনারেশনকে ব্যাপক ব্যবহারের অবকাঠামোতে রূপান্তরিত করার জন্য গুগলের একটি কৌশলগত পদক্ষেপএর পণ্য বাস্তুতন্ত্রের বেশিরভাগ অংশের সাথে একীভূত। 4K পর্যন্ত রেজোলিউশনের সমর্থন, রিয়েল-টাইম তথ্যে অ্যাক্সেস এবং চরিত্র, বস্তু এবং পাঠ্যের উপর সূক্ষ্ম নিয়ন্ত্রণের মাধ্যমে, কোম্পানিটি ন্যানো ব্যানানা 2 কে ইউরোপ এবং বিশ্বের অন্যান্য অংশে বেশিরভাগ সৃজনশীল এবং উৎপাদন কর্মপ্রবাহের জন্য ডিফল্ট মডেল হিসেবে গড়ে তোলার লক্ষ্যে কাজ করে।

জেমিনি ২.৫ ফ্ল্যাশ ইমেজ থেকে ন্যানো ব্যানানা ২ পর্যন্ত: নতুন স্ট্যান্ডার্ডটি এভাবেই আসে

ন্যানো ব্যানানা ২ কোথায় খাপ খায় তা বোঝার জন্য, এটি মনে রাখা মূল্যবান যে প্রথম ন্যানো কলা জেমিনি ২.৫ ফ্ল্যাশ ইমেজের ডেরিভেটিভ হিসেবে জন্মগ্রহণ করেছিলফ্ল্যাশ আর্কিটেকচারের উপর ভিত্তি করে দ্রুত ছবি সরবরাহের উপর দৃষ্টি নিবদ্ধ করা হয়েছিল। এরপর আসে ন্যানো ব্যানানা প্রো, যা জেমিনি 3 প্রো ইমেজের সমতুল্য, যা গত বছরের নভেম্বর থেকে এআই-চালিত ইমেজ এডিটিংয়ে মান এবং নিয়ন্ত্রণের মানদণ্ড হয়ে ওঠে।

নতুন মডেলটি নির্ভর করে আরও এক ধাপ এগিয়ে যায় জেমিনি ৩.১ ফ্ল্যাশ কোর হিসেবেবাস্তবে, এটি জ্ঞানীয় এবং যুক্তিগত ক্ষমতার ক্ষেত্রে এক বিরাট উল্লম্ফন ঘটায়, একই সাথে খুব কম ল্যাটেন্সি বজায় রাখে। প্রযুক্তিগতভাবে, এটি জেমিনি ৩.১ ফ্ল্যাশ ইমেজ, কিন্তু শেষ ব্যবহারকারীর কাছে ন্যানো ব্যানানা ২ নামে বাজারজাত করা হয়েছে। ধারণাটি হল প্রো লাইনের সেরাটি - গভীরতা, ধারাবাহিকতা এবং নিয়ন্ত্রণ - একটি একক সিস্টেমে ফ্ল্যাশ লাইনের গতির সাথে একত্রিত করা।

গুগল ব্যাখ্যা করে যে জেমিনি অ্যাপে ডিফল্ট মডেল হিসেবে ন্যানো ব্যানানা ২ এখন ন্যানো ব্যানানা প্রো-এর পরিবর্তে আসছে। কুইক, থিংকিং এবং প্রো মোডে, যদিও গুগল এআই প্রো এবং আল্ট্রা সাবস্ক্রিপশনধারীরা এখনও অত্যন্ত বিশেষায়িত ক্ষেত্রে প্রো ব্যবহার করতে সক্ষম হবেন। এই পরিবর্তনটি ফোকাসের ক্ষেত্রে একটি স্পষ্ট পরিবর্তন চিহ্নিত করে: "দ্রুত" মডেলটি এখন বেশিরভাগ ব্যবহারের জন্য মানের দিক থেকে "প্রধান" মডেল হয়ে ওঠে।

ভোক্তাদের আবেদনের বাইরে, স্থাপনাটি প্রসারিত হয় এআই সার্চ এবং লেন্স মোড API গুলি এখন AI Studio এবং Vertex AI-তে উপলব্ধ। প্রিভিউ ভার্সনে। তদুপরি, ন্যানো ব্যানানা ২ কে ফ্লোতে ডিফল্ট ভিজ্যুয়াল জেনারেটর হিসেবে সেট করা হয়েছে, যেখানে এটি ব্যবহারকারীদের বিনামূল্যে দেওয়া হয়, যা এটিকে ভিডিও এবং সৃজনশীল সম্পাদনার জন্য একটি নিয়মিত হাতিয়ারে পরিণত হতে উৎসাহিত করে।

কৃত্রিম বুদ্ধিমত্তা ব্যবহার করে ছবি তৈরি করা

ফ্ল্যাশের মতো গতি এবং প্রায়-প্রো মানের

বেশ কিছুদিন আগে পর্যন্ত, আলোক-বাস্তববাদী ছবি তৈরিতে সক্ষম মডেলগুলির জন্য উচ্চ কম্পিউটিং সময় এবং সম্পদের প্রয়োজন হত।এর ফলে গতি অত্যন্ত গুরুত্বপূর্ণ এমন পরিবেশে এটি ব্যবহার করা কঠিন হয়ে পড়ে। ন্যানো ব্যানানা ২ এই গতিশীলতার সাথে বিরতি দেয়, পূর্বে ভারী সংস্করণের জন্য সংরক্ষিত অনেক ক্ষমতাকে একটি কম-বিলম্বিত মডেলে নিয়ে আসে।

গুগলের অভ্যন্তরীণ পরীক্ষাগুলি দেখায় যে এটি সম্ভব মাত্র কয়েক সেকেন্ডের মধ্যে জটিল রচনা তৈরি করুনফ্ল্যাশ লাইনের পূর্ববর্তী প্রজন্মের তুলনায় অপেক্ষার সময় প্রায় তিন-চতুর্থাংশ কমিয়ে আনা। উদাহরণস্বরূপ, পরীক্ষার মাধ্যমে, মডেলটিকে বিটকয়েন ইকোসিস্টেমের একটি সম্পূর্ণ সময়রেখা তৈরি করতে বলা হয়েছিল—যাতে গবেষণা এবং চূড়ান্ত শিল্পকর্ম অন্তর্ভুক্ত ছিল—এবং ন্যানো ব্যানানা প্রো-এর কাজের মাত্র একটি অংশের জন্য যে সময় প্রয়োজন ছিল তার সমান ছিল।

ল্যাটেন্সির এই উন্নতি একা আসে না: মডেলটি প্রবর্তন করে আরও বাস্তবসম্মত আলো, আরও বৈচিত্র্যময় টেক্সচার এবং তীক্ষ্ণ বিবরণ পূর্বসূরীদের তুলনায়। গুগল জোর দিয়ে বলে যে সিস্টেমটি ৫১২ পিক্সেলের দ্রুত স্কেচ থেকে শুরু করে নেটিভ ৪কে রেজোলিউশনের ছবি, একাধিক আকৃতির অনুপাতের সমর্থন সহ, ভিডিওর জন্য প্যানোরামিক ফর্ম্যাট থেকে শুরু করে সোশ্যাল মিডিয়ার জন্য ডিজাইন করা উল্লম্ব ফর্ম্যাট, উদাহরণস্বরূপ, X-এ AI দিয়ে ছবি তৈরি করুন.

কর্মক্ষমতা এবং মানের মধ্যে ভারসাম্য বজায় রাখা হয় একটি কনফিগারযোগ্য যুক্তি প্রক্রিয়াডেভেলপাররা রেন্ডারিংয়ের আগে "চিন্তার" বিভিন্ন স্তর নির্বাচন করতে পারেন - ন্যূনতম, উচ্চ, অথবা গতিশীল - এটি তাদের পুনরাবৃত্তিমূলক কর্মপ্রবাহে গতিকে অগ্রাধিকার দিতে সাহায্য করে অথবা যখন নির্ভুলতা সর্বাধিক গুরুত্বপূর্ণ তখন মডেলটিকে জটিল প্রম্পটগুলি বুঝতে আরও বেশি সময় ব্যয় করার অনুমতি দেয়।

সৃজনশীল, বিপণন, বা পণ্য দলের জন্য, এর অর্থ হল অনেক বেশি চটপটে কাজের গতিঅনেক ধরণের পাইপলাইন, A/B পরীক্ষা এবং ক্রমাগত পরিবর্তনের জন্য উপযুক্ত। গতি একটি বাধা হয়ে দাঁড়ায় এবং কর্মপ্রবাহ ডিজাইনের আরেকটি উপাদান হয়ে ওঠে।

বাস্তব-বিশ্বের জ্ঞান এবং সমন্বিত ওয়েব অনুসন্ধান

ন্যানো ব্যানানা ২ এর নতুন নতুন বৈশিষ্ট্যগুলির মধ্যে একটি হল এর ক্ষমতা ছবি তৈরির সময় রিয়েল টাইমে ওয়েব অ্যাক্সেস করুনপ্রশিক্ষণের সময় যা শেখা হয়েছে তার উপর নির্ভর করার পরিবর্তে, মডেলটি সাম্প্রতিক স্মৃতিস্তম্ভ, লোগো, পণ্য বা ঘটনাগুলিকে আরও সঠিকভাবে উপস্থাপন করার জন্য আপডেট করা তথ্যের সাথে পরামর্শ করতে পারে।

বিস্তারিত জানাতে বলা হলে ক্রিপ্টোকারেন্সি সম্পর্কে একটি ঐতিহাসিক সময়রেখাউদাহরণস্বরূপ, সিস্টেমটি বিভিন্ন উৎসের সাথে পরামর্শ করেছে, প্রাসঙ্গিক মাইলফলক নির্বাচন করেছে এবং সেগুলির উপর ভিত্তি করে রচনাটি গঠন করেছে। ফলাফলটি কেবল একটি সাধারণ কোলাজের মধ্যে সীমাবদ্ধ ছিল না: মডেলটি বাস্তব তথ্যের উপর ভিত্তি করে সম্পাদকীয় সিদ্ধান্ত নিয়েছিল, যা ন্যানো ব্যানানা প্রো একই পরিমাণে করতে পারেনি।

এই "গ্রাউন্ডিং" পদ্ধতি - যাচাইকৃত তথ্যের মাধ্যমে প্রজন্মকে সমর্থন করা - বিশেষ করে প্রাসঙ্গিক যেসব ক্ষেত্র বাস্তবিক নির্ভুলতার উপর নির্ভর করেযেমন ভিজ্যুয়াল জার্নালিজম, কর্পোরেট যোগাযোগ, অথবা প্রযুক্তিগত ডকুমেন্টেশন। ইউরোপে, যেখানে AI-এর নিয়ন্ত্রক কাঠামো সত্যবাদিতা এবং স্বচ্ছতার জন্য বৃহত্তর চাহিদার দিকে এগিয়ে চলেছে, সেখানে এই ধরণের ক্ষমতাগুলি বিভ্রান্তিকর উপস্থাপনা প্রতিরোধের মূল চাবিকাঠি হতে পারে।

একই সাথে, গুগল সার্চ এবং লেন্সের সাথে একীকরণ ন্যানো ব্যানানা ২ কে একটি ভিজ্যুয়াল সার্চ ইঞ্জিন এবং একটি সৃজনশীল জেনারেটরের মধ্যে একটি হাইব্রিড টুলব্যবহারকারী একটি বর্তমান বিষয়ের উপর একটি প্রশ্ন দিয়ে শুরু করতে পারেন এবং কয়েকটি ধাপে, তাদের নির্দিষ্ট প্রয়োজন অনুসারে ইনফোগ্রাফিক্স, চিত্র বা রচনাগুলি পেতে পারেন।

ছবির মধ্যে পাঠযোগ্য লেখা এবং স্বয়ংক্রিয় স্থানীয়করণ

ঐতিহাসিকভাবে, ছবিতে এমবেড করা টেক্সট জেনারেটিভ এআই-এর অ্যাকিলিসের অন্যতম সাফল্য।বিকৃত অক্ষর, বানান ত্রুটি এবং অসঙ্গতিপূর্ণ ফন্টগুলি সাধারণ ছিল। ন্যানো ব্যানানা ২ এই ক্ষেত্রে একটি উল্লেখযোগ্য উন্নতি এনেছে, লেআউটের সাথে সামঞ্জস্যপূর্ণ স্পষ্ট, সুস্পষ্ট লেখা তৈরি করতে সক্ষম।

ম্যাগাজিনের প্রচ্ছদের সাথে পরিচালিত পরীক্ষায়, মডেলটি তৈরি করেছে অদ্ভুত অক্ষর বা বিকৃতি ছাড়াই সুনির্দিষ্ট এবং সুনির্দিষ্ট লেখার লাইনন্যানো ব্যানানা প্রো-এর বিপরীতে, যা কখনও কখনও সামান্য সিন্থেটিক বা 3D রেন্ডার করা ফিনিশের দিকে ঝোঁক দেয়, ন্যানো ব্যানানা 2-এর আউটপুটগুলি ফটোরিয়ালিস্টিক লুকের কাছাকাছি, যা বিশেষ করে বিজ্ঞাপনের উপকরণ বা প্রচারণার মকআপের জন্য কার্যকর।

উপরন্তু, সিস্টেমটি আপনি প্রম্পটে ব্যবহারকারীর দ্বারা নির্দিষ্ট করা টেক্সট লিখতে পারেন অথবা কী অন্তর্ভুক্ত করবেন তা স্বাধীনভাবে সিদ্ধান্ত নিতে পারেন।ছবির প্রেক্ষাপটের উপর নির্ভর করে, এই নমনীয়তা সৃজনশীল কর্মপ্রবাহের দ্বার উন্মুক্ত করে যেখানে মডেল কেবল একটি ধারণাই চিত্রিত করে না বরং স্লোগান, লেবেল বা পরিপূরক বার্তাও প্রস্তাব করে।

আরেকটি গুরুত্বপূর্ণ অগ্রগতি হল এর ক্ষমতা ছবিতে উপস্থিত টেক্সট সনাক্ত, সনাক্ত এবং অনুবাদ করুনউদাহরণস্বরূপ, এটি ইংরেজিতে ডিজাইন করা একটি প্রচারণাকে বিভিন্ন ভাষায় - স্প্যানিশ, জার্মান, ফরাসি ইত্যাদি - রূপান্তরিত করার অনুমতি দেয় - ভিজ্যুয়াল কম্পোজিশনটিকে স্ক্র্যাচ থেকে পুনরায় ডিজাইন না করে। বহুজাতিক উপস্থিতি সহ ইউরোপীয় কোম্পানিগুলির জন্য, এই স্বয়ংক্রিয় ভিজ্যুয়াল স্থানীয়করণ কন্টেন্ট অভিযোজনের সময় এবং খরচ উল্লেখযোগ্যভাবে হ্রাস করতে পারে।

শিল্পের নিজস্ব অনুমান অনুসারে, গ্রাফিক স্থানীয়করণ প্রক্রিয়াগুলি ডিজিটাল উৎপাদন বাজেটের 10% এরও বেশি শোষণ করতে পারে প্রধান ব্র্যান্ডগুলি থেকে। একক ধাপে অনুবাদ এবং নকশা একীভূত করার ফলে ন্যানো ব্যানানা 2 মার্কেটিং বিভাগগুলির জন্য একটি আকর্ষণীয় হাতিয়ার হয়ে উঠেছে যাদের ম্যানুয়াল কাজ বৃদ্ধি না করেই দেশ- বা অঞ্চল-নির্দিষ্ট সংস্করণের প্রয়োজন।

চিত্র মডেলের সৃজনশীল প্রয়োগ

চরিত্র এবং বস্তুর ধারাবাহিকতা: ব্র্যান্ডিং এবং আখ্যানের মূল চাবিকাঠি

মডেলটির আরেকটি শক্তি হলো একাধিক ছবিতে বিষয়ের ধারাবাহিকতাগুগল দাবি করেছে যে ন্যানো ব্যানানা ২ একই কর্মপ্রবাহের মধ্যে সর্বোচ্চ পাঁচটি অক্ষরের সাদৃশ্য বজায় রাখতে পারে এবং ১৪টি বস্তুর দৃশ্যমান বিশ্বস্ততা সংরক্ষণ করতে পারে, যা পূর্ববর্তী প্রজন্মের তুলনায় একটি উল্লেখযোগ্য উল্লম্ফনের প্রতিনিধিত্ব করে।

এই ক্ষমতা বিশেষভাবে প্রাসঙ্গিক স্থিতিশীল চাক্ষুষ পরিচয়ের নির্মাণবিজ্ঞাপন প্রচারণা, ব্র্যান্ড মাসকট, কমিক বইয়ের নায়ক, অথবা চলচ্চিত্র ও টেলিভিশনের স্টোরিবোর্ডে বারবার আসা চরিত্রগুলি। যেখানে একসময় একটি চরিত্রের মুখের বৈশিষ্ট্য বা অনুপাত এক দৃশ্য থেকে অন্য দৃশ্যে পরিবর্তন করা সাধারণ ছিল, এখন সেখানে আরও সুসংগত দৃশ্যমান আখ্যান বজায় রাখা সম্ভব।

বিজ্ঞাপন বা বিনোদনের মতো ক্ষেত্রগুলিতে, এটি অনুবাদ করে গ্রাফিক গল্প বলার একটি গভীর স্বয়ংক্রিয়তাব্র্যান্ডগুলি আর তাদের ভিজ্যুয়াল জগৎকে সামঞ্জস্যপূর্ণ রাখার জন্য দীর্ঘ ফটোগ্রাফি বা চিত্রণ সেশনের উপর এত বেশি নির্ভর করে না; প্রাথমিক পরামিতিগুলি সেট করার জন্য এবং মডেলটিকে মূল নকশা থেকে বিচ্যুত না হয়ে বৈচিত্র তৈরি করতে দেওয়ার জন্য এটি যথেষ্ট।

অতিরিক্তভাবে, ন্যানো কলা 2 এটি প্রম্পটে নির্দেশনা ট্র্যাকিং উন্নত করে এবং কীভাবে AI-কে একটি ছবি তৈরি করতে সাহায্য করেঅন্যান্য সিস্টেমে প্রদর্শিত "আনুমানিক" মার্জিন হ্রাস করা। এর ফলে ব্যবহারকারী যা লেখেন এবং এআই যা তৈরি করেন তার মধ্যে আরও সরাসরি যোগাযোগ তৈরি হয়, পুনরাবৃত্তি সংরক্ষণ করা হয় এবং সময়সীমা কম থাকলে কাজ সহজ করা হয়।

এই ধরণের গ্রানুলার নিয়ন্ত্রণ বিশেষ করে ইউরোপীয় প্রকল্পগুলিতে কার্যকর যেখানে দৃশ্যমান ধারাবাহিকতা আইনি বা ব্র্যান্ডের প্রয়োজনীয়তার সাথে যুক্ত, যেমন প্রাতিষ্ঠানিক প্রচারণা, পাবলিক সাইনবোর্ড, অথবা কর্পোরেট প্রশিক্ষণ উপকরণযেখানে অবাঞ্ছিত পরিবর্তন বিভ্রান্তি বা সম্মতি সমস্যা সৃষ্টি করতে পারে।

সৃজনশীল বাজার এবং চিত্র অর্থনীতির উপর প্রভাব

ন্যানো ব্যানানা ২-এর আগমন এমন এক প্রেক্ষাপটে এসেছে যেখানে জেনারেটিভ এআই ইতিমধ্যেই ঐতিহ্যবাহী মৌলিক নকশা পরিষেবা মডেলকে ধ্বংস করে দিচ্ছে।গুগল যখন থেকে জেমিনির ভিজ্যুয়াল জেনারেশনকে গুগল বিজ্ঞাপনের মতো পণ্যের সাথে একীভূত করতে শুরু করেছে, তখন থেকে ফ্রিল্যান্স প্ল্যাটফর্মগুলি কম-জটিলতার গ্রাফিক ডিজাইন কাজের চাহিদা উল্লেখযোগ্যভাবে হ্রাস পেয়েছে।

এই নতুন মডেলটি যে এআই স্টুডিও, গুগল ক্লাউড, ফ্লো এবং গুগল বিজ্ঞাপনে স্থানীয়ভাবে উপলব্ধ থাকবে এই প্রবণতা ক্রমশ ত্বরান্বিত হচ্ছে: যেকোনো অ্যাকাউন্ট ম্যানেজার বা মার্কেটিং বিশেষজ্ঞ একটি প্রম্পট থেকে সৃজনশীল বৈচিত্র্য আনতে পারেন, আগের মতো এত বড় ডিজাইন টিমের আশ্রয় না নিয়েই।

শিল্প পরামর্শদাতাদের অনুমান ইঙ্গিত দেয় যে উন্নত বাজারে ডিজিটাল প্রচারণায় ব্যবহৃত বেশিরভাগ ভিজ্যুয়াল সম্পদ আগামী বছরগুলিতে এগুলি উচ্চ-গতির এআই মডেল দ্বারা তৈরি বা সহায়তা করা হবে। এটি ঐতিহ্যবাহী সংস্থাগুলির উপর চাপ সৃষ্টি করে, যা তাদেরকে কেবল উৎপাদনের উপর মনোযোগ দেওয়ার পরিবর্তে কৌশলগত এআই পরামর্শ পরিষেবা, সৃজনশীল দিকনির্দেশনা বা গুণমান নিশ্চিতকরণের দিকে ঝুঁকতে বাধ্য করে।

ইউরোপে, যেখানে বিপণনে AI সরঞ্জাম গ্রহণ ইতিমধ্যেই দ্রুত ছড়িয়ে পড়েছে, ন্যানো ব্যানানা ২ এমন এক সময়ে এসেছে যখন অনেক কোম্পানি তাদের উপস্থিতি না হারিয়ে খরচ কমাতে চাইছে।এসএমই এবং স্টার্টআপগুলির জন্য, অল্প সংখ্যক মানবসম্পদ দিয়ে পেশাদার উপকরণ তৈরির সম্ভাবনা বিশেষভাবে আকর্ষণীয়, যদিও এটি মেশিন-উত্পাদিত সামগ্রীতে পরিপূর্ণ পরিবেশে নিজেদের আলাদা করার চ্যালেঞ্জও তৈরি করে।

এই পরিবর্তনটি অগত্যা ম্যানুয়াল ডিজাইনের অন্তর্ধানকে বোঝায় না, তবে এর জন্য একটি পুনর্রূপণ প্রয়োজন: মানটি কার্যকরকরণ থেকে সরঞ্জাম তৈরি, পর্যবেক্ষণ এবং একত্রিত করার ক্ষমতায় পরিবর্তিত হয়।সৃজনশীল প্রক্রিয়ার আরেকটি উপাদান হিসেবে AI-কে একীভূত করা।

নিরাপত্তা, ওয়াটারমার্ক এবং কন্টেন্ট শংসাপত্র

বাস্তবতা থেকে প্রায় আলাদা করা যায় না এমন ছবি তৈরি করতে সক্ষম মডেলের অগ্রগতি তার সাথে নিয়ে আসে ডিপফেক, বিভ্রান্তিকর তথ্য এবং প্রকৃত মানুষের ছবির অপব্যবহার সম্পর্কে স্পষ্ট উদ্বেগগুগল এই প্রেক্ষাপট সম্পর্কে সচেতন এবং ন্যানো ব্যানানা ২-তে তার স্বচ্ছতা কৌশলের দুটি মূল অংশকে আরও শক্তিশালী করেছে।

একদিকে, এটি ব্যবহার বজায় রাখে এবং প্রসারিত করে সিন্থআইডি, একটি অদৃশ্য ডিজিটাল ওয়াটারমার্কিং প্রযুক্তি এই চিহ্নটি সরাসরি AI-জেনারেটেড ছবির পিক্সেলের মধ্যে ঢোকানো হয়। মানুষের চোখে অদৃশ্য হলেও, কিছু সম্পাদনার পরেও এটি সনাক্ত করা যেতে পারে, যার ফলে গুগলের মডেলগুলি থেকে উদ্ভূত সামগ্রী সনাক্ত করা সম্ভব হয়।

অন্যদিকে, সিস্টেমটি সংহত করে C2PA (কনটেন্ট প্রোভেন্যান্স অ্যান্ড অথেন্টিসিটির জন্য জোট) স্ট্যান্ডার্ডের উপর ভিত্তি করে কন্টেন্ট শংসাপত্রএই কাঠামোটি অ্যাডোবি, মাইক্রোসফ্ট এবং বিবিসির মতো কোম্পানিগুলি দ্বারা সমর্থিত। এই শংসাপত্রগুলি ছবির উৎপত্তি এবং এটিতে যে কোনও পরিবর্তনের মাধ্যমে যাচাইযোগ্য মেটাডেটা যুক্ত করে, যা ট্রেসেবিলিটি সহজ করে তোলে।

ইউরোপীয় ক্ষেত্রে, এই ব্যবস্থাগুলি এর সাথে খাপ খায় ইউরোপীয় ইউনিয়নের কৃত্রিম বুদ্ধিমত্তা আইনে স্বচ্ছতার বাধ্যবাধকতাগুলি নির্ধারিত হয়েছেযখন AI দ্বারা কন্টেন্ট তৈরি বা পরিবর্তন করা হয় তখন স্পষ্ট প্রকাশের প্রয়োজন হয়। Google আরও ঘোষণা করেছে যে C2PA যাচাইকরণ অন্তর্ভুক্ত করা হবে মিথুন অ্যাপ, ব্যবহারকারীদের ছবির উৎপত্তি যাচাই করার ক্ষমতা জোরদার করা।

একসাথে, SynthID এবং C2PA লক্ষ্য করে কোম্পানি, মিডিয়া এবং জনপ্রশাসনকে আরও বেশি আইনি এবং সুনামের নিশ্চয়তা প্রদান করা যারা ন্যানো ব্যানানা ২ গ্রহণ করে, উচ্চ-প্রভাবশালী প্রচারণায় কপিরাইট মামলা বা বিভ্রান্তিকর বিষয়বস্তু প্রচারের ঝুঁকি হ্রাস করে।

কন্টেন্ট মডারেশন এবং মডেল সীমা

ট্রেসেবিলিটির পাশাপাশি, গুগল প্রতিষ্ঠা করেছে ন্যানো ব্যানানা ২ কী ধরণের পরিবর্তন এবং দৃশ্য তৈরি করতে পারে তার স্পষ্ট সীমাউদাহরণস্বরূপ, অভ্যন্তরীণ পরীক্ষায় দেখা গেছে যে মডেলটি পোশাকগুলিকে অন্তর্বাস বা স্পষ্ট বিষয়বস্তুতে রূপান্তর করার জন্য আসল ছবি সম্পাদনা করতে অস্বীকৃতি জানায়, বিশেষ করে যখন প্রতিনিধিত্বকারী ব্যক্তিদের গোপনীয়তা বা মর্যাদা লঙ্ঘনের ঝুঁকি থাকে।

যদিও এই মডারেশন সিস্টেমগুলি অসঙ্গতিমুক্ত নয় - কিছু ক্ষেত্রে ছবির লিঙ্গ বা প্রেক্ষাপটের উপর নির্ভর করে বিভিন্ন প্রতিক্রিয়া দেখা যায় - সেন্সরশিপের স্তর ন্যানো ব্যানানা প্রো-এর মতোই রয়ে গেছে।সাধারণভাবে, স্পষ্ট যৌন বিষয়বস্তু বা ইঙ্গিতপূর্ণ পরিস্থিতিতে প্রকৃত মানুষের ছবি ব্যবহার করার উদ্দেশ্যে তৈরি যেকোনো অনুরোধ ব্লক করা হয়।

এই পদ্ধতিটি বাজারে উপলব্ধ অন্যান্য মডেলের আরও অনুমতিমূলক নীতির সাথে বৈপরীত্যপূর্ণ, যার ফলে কিছু সৃজনশীল সম্প্রদায় ঝুঁকিপূর্ণ বা আরও বাস্তবসম্মত দৃশ্যের সাথে পরীক্ষা-নিরীক্ষার প্রয়োজন হলে বিকল্প সমাধান বেছে নিতে বাধ্য হয়েছে।

ইউরোপের কোম্পানি এবং সরকারি সংস্থার জন্য, যেখানে তথ্য সুরক্ষা এবং চিত্র অধিকার সম্পর্কিত নিয়মকানুন বিশেষভাবে কঠোর।এই নিয়ন্ত্রণগুলিকে একটি সুবিধা হিসেবে দেখা যেতে পারে, কারণ এগুলি মডেলের অনুপযুক্ত ব্যবহারের ফলে উদ্ভূত আইনি ঝুঁকির ঝুঁকি হ্রাস করে।

যাই হোক না কেন, কন্টেন্ট ফিল্টার, ওয়াটারমার্ক এবং সোর্স শংসাপত্রের সংমিশ্রণ অন্যান্য প্ল্যাটফর্মের তুলনায় আরও নিয়ন্ত্রিত পরিবেশ তৈরি করে, যা সম্ভবত কোন সেক্টর এবং বিচারব্যবস্থা ন্যানো ব্যানানা 2 কে তাদের প্রধান হাতিয়ার হিসেবে গ্রহণ করবে তা প্রভাবিত করবে।

ভিজ্যুয়াল জেনারেশন বাজারে প্রতিযোগিতা

ন্যানো ব্যানানা ২-এর উৎক্ষেপণ এমন এক সময়ে ঘটছে যখন এআই-জেনারেটেড ইমেজারির ক্ষেত্রে তীব্র প্রতিযোগিতা চলছে। DALL·E, মিডজার্নি বা স্টেবল ডিফিউশনের মতো মডেল তারা ইতিমধ্যেই ডিজিটাল শিল্প থেকে শুরু করে বিজ্ঞাপন সামগ্রী উৎপাদন পর্যন্ত বিভিন্ন ক্ষেত্রে নিজেদের প্রতিষ্ঠিত করেছে।

ইতিমধ্যে, অন্যান্য খেলোয়াড়রা অন্তর্ভুক্ত করা শুরু করেছে রিয়েল-টাইম ওয়েব অনুসন্ধান, উন্নত যুক্তি এবং ভিজ্যুয়াল রেফারেন্সের বৃহত্তর ধারাবাহিকতা তাদের নিজস্ব সমাধানে। উদাহরণস্বরূপ, বাইটড্যান্স সিড্রিম ৫ চালু করেছে, যার মধ্যে মাত্র কয়েক সেকেন্ডের মধ্যে 2K এবং 4K জেনারেশন, স্থানীয়ভাবে চালানোর ক্ষমতা এবং আরও স্বাচ্ছন্দ্যময় মডারেশন নীতি রয়েছে, যা এটিকে নির্দিষ্ট কিছু ক্ষেত্রে খুব সক্রিয় ব্যবহারকারী বেস অর্জন করেছে।

গুগলের প্রধান কার্ড হল ন্যানো ব্যানানা ২ এর পণ্য বাস্তুতন্ত্রের সাথে গভীর একীকরণএই মডেলটি জেমিনি অ্যাপ, সার্চ, লেন্স, গুগল বিজ্ঞাপন, এআই স্টুডিওর মতো ডেভেলপার টুল এবং গুগল ক্লাউড এবং ভার্টেক্স এআই-এর মতো এন্টারপ্রাইজ প্ল্যাটফর্মে উপস্থিত রয়েছে। ইতিমধ্যেই গুগল স্ট্যাকের উপর নির্ভরশীল অনেক ইউরোপীয় কোম্পানির জন্য, এই ধারাবাহিকতা গ্রহণকে সহজ করে তোলে।

তদুপরি, অনুসন্ধান থেকে রিয়েল-টাইম ডেটা অ্যাক্সেস ন্যানো ব্যানানা 2 প্রদান করে একটি প্রসঙ্গায়ন ক্ষমতা যা খুব কম প্রতিযোগীই মেলাতে পারেবিশেষ করে এমন উপস্থাপনাগুলিতে যেখানে ব্র্যান্ড, স্থান বা পণ্যের বর্তমান চেহারা সঠিকভাবে প্রতিফলিত করতে হবে।

ফলাফল এমন একটি পরিস্থিতি তৈরি করে যেখানে প্ল্যাটফর্মগুলির মধ্যে পার্থক্যগুলি বিশুদ্ধ ভিজ্যুয়াল মানের উপর কম নির্ভর করে - যা ক্রমশ একই রকম হয়ে উঠছে - এবং আরও বেশি কিছুর উপর নির্ভর করে যেমন এন্টারপ্রাইজ ইন্টিগ্রেশন, কন্টেন্ট গভর্নেন্স, মডারেশন এবং মালিকানার মোট খরচ কোম্পানি এবং প্রশাসনের জন্য।

স্টার্টআপ এবং এন্টারপ্রাইজগুলিতে প্রাপ্যতা, API এবং গ্রহণ

প্রাপ্যতা সম্পর্কে, ন্যানো ব্যানানা ২ বিশ্বব্যাপী গুগলের প্রধান পৃষ্ঠপোষকতায় চালু হচ্ছেজেমিনি অ্যাপে এটি ডিফল্ট মডেলে পরিণত হয়েছে, অন্যদিকে সার্চ ইঞ্জিন এবং লেন্সে এটি মোবাইল এবং ডেস্কটপ ব্রাউজার উভয় ক্ষেত্রেই এআই মোডের কার্যকারিতা বৃদ্ধি করে।

ডেভেলপার এবং কারিগরি দলের জন্য, মডেলটি এটি AI স্টুডিও এবং Vertex AI-তে Gemini API-এর মাধ্যমে অফার করা হয়।এটি মালিকানাধীন অ্যাপ্লিকেশন, SaaS পণ্য, অথবা অভ্যন্তরীণ কন্টেন্ট তৈরির প্ল্যাটফর্মগুলিতে একীভূত করার অনুমতি দেয়। বিজ্ঞাপনের দিক থেকে, এটি ইতিমধ্যেই Google Ads এবং Flow-এ উপস্থিত রয়েছে, যা পরবর্তী ক্ষেত্রে অতিরিক্ত ক্রেডিট খরচ ছাড়াই কাস্টম সৃজনশীল তৈরিকে সহজতর করে।

স্টার্টআপ ইকোসিস্টেমে, এটি উন্মুক্ত হয় প্রচারাভিযান অটোমেশন, দ্রুত পণ্য প্রোটোটাইপিং এবং ভিজ্যুয়াল সম্পদ তৈরিতে নির্দিষ্ট সুযোগ বৃহৎ ডিজাইন টিমের প্রয়োজন ছাড়াই। পণ্য দলগুলি ঐতিহ্যবাহী ডিজাইনের আরও ব্যয়বহুল ধাপে বিনিয়োগ করার আগে ইন্টারফেস, মকআপ বা ব্যবহারকারীর অভিজ্ঞতার ধারণাগুলি কল্পনা করতে পারে।

API অ্যাক্সেস সাধারণত দ্বারা নিয়ন্ত্রিত হয় ফি এবং অনুরোধের সীমা সহ, প্রতি-ব্যবহারের জন্য অর্থ প্রদানের মডেল কোম্পানিগুলিকে তাদের স্থাপত্যের আকার পরিবর্তন করার সময় যেগুলি বিবেচনা করতে হবে। যদিও গুগল সমস্ত মূল্য প্রকাশ্যে বিস্তারিতভাবে জানায়নি, তবে সাধারণ কাঠামোটি প্রজন্মের সংখ্যা এবং ব্যবহারের ধরণের উপর ভিত্তি করে তৈরি করা হয়, যার জন্য শুরু থেকেই অপারেটিং খরচের উপর প্রভাব পরিকল্পনা করা প্রয়োজন।

একই সময়ে, SynthID এর নেটিভ ক্ষমতা এবং C2PA ইউরোপীয় কোম্পানিগুলির জন্য কাজ সহজ করে তোলে সিন্থেটিক কন্টেন্টের স্বচ্ছতা এবং ট্রেসেবিলিটি সম্পর্কিত উদীয়মান নিয়ম মেনে চলুনএটি এমন একটি দিক যা ফিনটেক, স্বাস্থ্য, অথবা শিক্ষার মতো নিয়ন্ত্রিত ক্ষেত্রগুলিতে একটি প্রয়োজনীয়তা হয়ে উঠতে শুরু করেছে।

এই সমস্ত উপাদানগুলি টেবিলে থাকা অবস্থায়, ন্যানো ব্যানানা 2 নিজেকে এইভাবে অবস্থান করে এআই-চালিত চিত্র তৈরির জন্য একটি মানদণ্ড মডেল যা গতি, গুণমান এবং ট্রেসেবিলিটিকে একত্রিত করেগুগলের বৈশ্বিক অবকাঠামোর দ্বারা সমর্থিত এবং ইউরোপীয় ইউনিয়ন সিন্থেটিক কন্টেন্টের উপর যে নিয়ন্ত্রক প্রয়োজনীয়তা আরোপ করছে তার সাথে সামঞ্জস্যপূর্ণ, এর ব্যাপক গ্রহণযোগ্যতা নির্ভর করবে কোম্পানি, নির্মাতা এবং সরকারগুলি আরও উন্মুক্ত বা নমনীয় বিকল্পগুলির বিরুদ্ধে এই ভারসাম্য কীভাবে মূল্যায়ন করে তার উপর। যাইহোক, এই পদক্ষেপটি স্পষ্টভাবে সঠিক দিকে নির্দেশ করে: ভিজ্যুয়াল জেনারেশন আর একটি বিচ্ছিন্ন পরীক্ষা নয় বরং পরবর্তী দশকের জন্য প্রযুক্তিগত এবং সৃজনশীল স্ট্যাকের একটি কাঠামোগত অংশ হয়ে উঠবে।

এআই ইমেজ এডিটিং এপিআই
সম্পর্কিত নিবন্ধ:
এআই-চালিত চিত্র সম্পাদনা API: মডেল, ব্যবহার এবং স্থাপত্য