
সাম্প্রতিক বছরগুলোতে ৪কে রেজোলিউশন, রে ট্রেসিং এবং ডিএলএসএস নিয়ে অনেক আলোচনা হয়েছে, কিন্তু একটি প্রধান এবং প্রায়শই উপেক্ষিত সীমাবদ্ধতা ছিল গ্রাফিক্স মেমরি। ক্রমবর্ধমান ভারী টেক্সচার এবং আরও চাহিদাপূর্ণ গেমইউরোপের অনেক মাঝারি মানের গ্রাফিক্স কার্ডেরও ভিআরএএম দ্রুত শেষ হয়ে যেত, ফলে ব্যবহারকারীরা কোয়ালিটি সেটিংস কমাতে বাধ্য হতেন অথবা স্টাটারিং ও পারফরম্যান্স কমে যাওয়ার মতো সমস্যা মেনে নিতেন।
সেই প্রেক্ষাপটে দেখা যাচ্ছে যে এনভিডিয়া নিউরাল টেক্সচার কম্প্রেশন (এনটিসি)এটি নিউরাল নেটওয়ার্ক-ভিত্তিক একটি টেক্সচার কম্প্রেশন প্রযুক্তি, যা ২০২৬ সালে GTC এবং GDC-তে বিস্তারিতভাবে উপস্থাপন করা হয়েছিল। এর প্রস্তাবনাটি খুবই সহজ: স্ক্রিনে প্রদর্শিত ছবির মান খারাপ না করে টেক্সচারের মেমরি ব্যবহার ব্যাপকভাবে কমানো, এবং কিছু ক্ষেত্রে প্রচলিত পদ্ধতির তুলনায় এর উন্নতিও ঘটানো।
নিউরাল টেক্সচার কম্প্রেশন কীভাবে কাজ করে এবং কী এটিকে আলাদা করে তোলে
এনটিসি-এর ভিত্তি হলো এর ব্যবহার টেক্সচারের জন্য বিশেষভাবে প্রশিক্ষিত ছোট নিউরাল নেটওয়ার্কশিল্পে বছরের পর বছর ধরে ব্যবহৃত BCn ব্লক কম্প্রেশন ফরম্যাটগুলোর (BC5, BC6, BC7, ইত্যাদি) উপর সম্পূর্ণরূপে নির্ভর করার পরিবর্তে। ঐতিহ্যগতভাবে, এই টেক্সচারগুলো VRAM-এ আগে থেকেই সংকুচিত অবস্থায় সংরক্ষিত থাকে এবং GPU সেগুলোকে তাৎক্ষণিকভাবে ব্যাখ্যা করে, কিন্তু তারপরেও এগুলো উল্লেখযোগ্য পরিমাণ মেমোরি দখল করে।
নিউরাল টেক্সচার কম্প্রেশনের সাথে, টেক্সচার তথ্য আরও অনেক বেশি সংহত উপস্থাপনায় সংরক্ষিত থাকে।এটি এক ধরনের সুপ্ত এনকোডিং যা নিউরাল নেটওয়ার্ক প্রতিটি ফ্রেম রেন্ডার করার সময় রিয়েল টাইমে ডিকোড করে। গিগাবাইট পরিমাণ ডিফিউশন ম্যাপ, নরমাল, রাফনেস ইত্যাদি নিয়ে কাজ করার পরিবর্তে, জিপিইউ অনেক ছোট একটি ডেটাসেট নিয়ে কাজ করে।
এনভিডিয়ার ব্যাখ্যা অনুযায়ী, এই নিউরাল মডেলগুলোতে রয়েছে একটি টেক্সেল দেখতে কেমন হওয়া উচিত তা বোঝার জন্য প্রশিক্ষিত একটি নির্দিষ্ট উপাদানের (যেমন: পাথর, কাঠ) টেক্সচারের "পিক্সেল" ধাতব টেক্সচারসিরামিক, টেক্সটাইল, ইত্যাদি। এই শিখন থেকে, নেটওয়ার্কটি সংকুচিত ডেটা থেকে চূড়ান্ত রূপটি পুনর্গঠন করতে পারে, যা আরও বেশি আয়তনবিশিষ্ট টেক্সচারের ক্ষেত্রে আমরা যে দৃশ্যমান ফলাফল পেতাম, তার অনুকরণ করে।
এর বাস্তব ফল হলো এই যে, টেক্সচারগুলো স্মৃতিতে একটি স্থির "বোঝা" হিসেবে থাকা বন্ধ করে দেয় এবং নির্ভরশীল হয়ে পড়ে একটি ছোট সংকুচিত কোড এবং এআই অনুমান ক্ষমতাএটি এনভিডিয়ার জিপিইউ-গুলিতে ইন্টেলিজেন্ট কম্পিউটিংয়ের দিকে মেমরি এবং ব্যান্ডউইথের লোড স্থানান্তরের সামগ্রিক প্রবণতার সাথে সামঞ্জস্যপূর্ণ।
'টাস্কান হুইলস / টাস্কান ভিলা' ডেমো: ৬.৫ জিবি থেকে ১ জিবিরও কম ভিআরএএম।
প্রযুক্তিটির সম্ভাবনা তুলে ধরতে এনভিডিয়া বেশ কিছু প্রযুক্তিগত প্রদর্শনী দেখিয়েছে, যার মধ্যে এখন সুপরিচিত দৃশ্যটিও অন্তর্ভুক্ত। “টাস্কান হুইলস” বা “টাস্কান ভিলা”একটি ভূমধ্যসাগরীয় ভিলার আবহ, যার বিশদ অভ্যন্তরীণ সজ্জা সূক্ষ্মতার জন্য একটি উচ্চ-স্তরের পরীক্ষাক্ষেত্র হিসেবে কাজ করে।
ঐতিহ্যবাহী কনফিগারেশনে, ফরম্যাট ব্যবহার করে স্ট্যান্ডার্ড BCn সিনের জন্য প্রায় ৬.৫ জিবি VRAM প্রয়োজন হয়। এটি শুধুমাত্র টেক্সচারের ক্ষেত্রে প্রযোজ্য। নিউরাল টেক্সচার কম্প্রেশন সক্রিয় করার মাধ্যমে, একই পরিবেশ প্রায় ১২৮ মেগাবাইট গ্রাফিক্স মেমোরিঅর্থাৎ, মূল ব্যবহারের তুলনায় প্রায় ৮৫% হ্রাস। অন্যান্য প্রদর্শনীতেও অনুরূপ পরিসংখ্যান দেখা গেছে, যেখানে প্রায় ৮০% হ্রাস ঘটেছে (নির্দিষ্ট কিছু দৃশ্যের ক্ষেত্রে যা প্রায় ৬৭০ মেগাবাইট পর্যন্ত নেমে এসেছে)।
শুধু VRAM হ্রাসের পরিমাণই প্রাসঙ্গিক নয়, বরং যে দুটি সংস্করণের মধ্যে দৃশ্যগত তুলনা করলে কার্যত কোনো পার্থক্য করা যায় না। সাধারণ ব্যবহারকারীর জন্য। এনভিডিয়ার মতে, একই মেমোরি 'বাজেট' বজায় রাখা হলে, ডাউনস্কেল বা রিস্কেল করা বিসিএন টেক্সচারের চেয়েও এনটিসি আরও সূক্ষ্ম বিবরণ সংরক্ষণ করতে সক্ষম।
ভিলার ভেতরে একটি বাস্তব উদাহরণ দেখা যায়, যেখানে একটি টেবিল বাসনপত্র, বোতল এবং সাজসজ্জার সামগ্রী দিয়ে ঢাকা রয়েছে। সেই তুলনার পরিপ্রেক্ষিতে, একই পরিমাণ মেমোরি ব্যবহার করে NTC দিয়ে প্রসেস করা অংশটিতে অধিকতর তীক্ষ্ণতা এবং সূক্ষ্ম বিবরণ দেখা যায়। একই VRAM বাজেটের মধ্যে আনার জন্য রেন্ডার করা অংশটিতে BCn টেক্সচারের সংখ্যা কমানো হয়েছে।
এই ধরনের ফলাফল প্রযুক্তির দ্বৈত ব্যবহারের ইঙ্গিত দেয়: গবেষণায় বেছে নেওয়া যেতে পারে গুণমান না কমিয়ে মেমরি ব্যবহার ব্যাপকভাবে হ্রাস করুন অথবা দৃশ্যমানতা বজায় রেখে ভিজ্যুয়াল ফিডেলিটি আরও এক ধাপ বাড়িয়ে তোলা, যা এমন সব প্রোজেক্টের জন্য বিশেষভাবে আকর্ষণীয় যেগুলো প্রায় ফটোরিয়ালিস্টিক লুক আনতে চায়।
গেম এবং গ্রাফিক্স ইঞ্জিনের জন্য বাস্তব সুবিধা
উন্নয়নের দৃষ্টিকোণ থেকে, এই সবকিছুর প্রধান পরিণতি হলো যে জটিল দৃশ্য ডিজাইন করার ক্ষেত্রে টেক্সচার এখন আর ততটা সীমাবদ্ধতা তৈরি করে না।সারফেস ম্যাপ দ্বারা কম VRAM ব্যবহৃত হওয়ার অর্থ হলো অন্যান্য সিস্টেমের জন্য অথবা একই সাথে প্রদর্শিত কন্টেন্টের পরিমাণ বাড়ানোর জন্য আরও বেশি জায়গা পাওয়া।
ইউরোপীয় বাজারকে লক্ষ্য করে তৈরি পিসি গেমগুলোর ক্ষেত্রে, যেখানে ব্যবহারকারী গোষ্ঠীর একটি উল্লেখযোগ্য অংশ এখনও... মাঝারি মানের জিপিইউ অথবা যেগুলোর ৮ জিবি মেমোরি আছেএই ধরনের কঠোর কম্প্রেশন এমন সিস্টেমগুলিতে উচ্চ-রেজোলিউশনের টেক্সচার ব্যবহারের সুযোগ করে দেয়, যেগুলি বর্তমানে VRAM সীমা অতিক্রম করা এড়াতে কোয়ালিটি কমাতে বাধ্য হয়।
এনভিডিয়া যেসব সুবিধার কথা তুলে ধরেছে, সেগুলোর মধ্যে রয়েছে:
- VRAM ব্যবহারে ব্যাপক হ্রাসনির্দিষ্ট পরিস্থিতিতে সাতবার পর্যন্ত।
- পরিচালনা করার ক্ষমতা উচ্চতর রেজোলিউশনের টেক্সচার মেমরির প্রয়োজনীয়তা সক্রিয় না করেই।
- বাধার সমাধান মেমরি ব্যান্ডউইথ এবং অ্যাসেট স্ট্রিমিং সম্পর্কিত।
- সম্ভাব্য ছোট ইনস্টলেশন এবং প্যাচের আকারডিস্কে আরও সংহত টেক্সচার প্যাকেজ করার মাধ্যমে।
- এর আরও ভালো ব্যবহার বহনযোগ্য ডিভাইস এবং ভবিষ্যতের কনসোলযেখানে মেমরি একটি আরও সীমিত সম্পদ।
এই সবকিছু এমন একটি বাজারের সাথে খাপ খায়, যেখানে এমনকি ইউরোপেও গেমের ডাউনলোড সাইজ সহজেই ১০০ জিবি ছাড়িয়ে যায় এবং যেখানে উপলব্ধ ব্যান্ডউইথ সবসময় পর্যাপ্ত থাকে না, বিশেষ করে গ্রামীণ এলাকায় বা দুর্বল সংযোগগুলোতে। গুণমান বজায় রেখে টেক্সচারের আকার হ্রাস করুন এর ফলে ডাউনলোডের সময় এবং আপডেটে পার্থক্য দেখা যেতে পারে।
তাছাড়া, ইন্টেলিজেন্ট কম্পিউটিংয়ের ওপর অধিক নির্ভর করার ফলে ফিজিক্যাল মেমোরির ওপর চাপ কিছুটা কমে আসে এবং আধুনিক জিপিইউ-এর কম্পিউটিং ক্ষমতা আরও দক্ষতার সাথে ব্যবহৃত হয়, যা এনভিডিয়া বেশ কিছুদিন ধরে অন্যান্য এআই সলিউশনের মাধ্যমে প্রচার করে আসছে।
নিউরাল উপকরণ: কম চ্যানেল, বেশি গতি
এনটিসি-র পাশাপাশি এনভিডিয়াও ধারণাটি উপস্থাপন করেছে। নিউরাল উপকরণএটি নিউরাল কম্প্রেশন ধারণার একটি স্বাভাবিক সম্প্রসারণ, যা শুধু টেক্সচারের ক্ষেত্রেই নয়, বরং রেন্ডারিং-এ ব্যবহৃত উপাদানগুলোর ভৌত মডেলের ক্ষেত্রেও প্রয়োগ করা হয়।
প্রচলিত কার্যপ্রক্রিয়ায়, আলোর প্রতিক্রিয়ায় কোনো পৃষ্ঠতল কীভাবে আচরণ করে তা বর্ণনা করার জন্য নিম্নলিখিত বিষয়গুলো একত্রিত করা হয়। একাধিক চ্যানেল এবং মানচিত্রবেস কালার, নরমাল, রাফনেস, মেটালিটি, অক্লুশন এবং গ্রাফিক্স ইঞ্জিন দ্বারা ব্যবহৃত BRDF সমীকরণের সাথে যুক্ত অন্যান্য নির্দিষ্ট ডেটা। এর ফলে প্রতি পিক্সেলে প্রচুর ডেটা, অনেক মেমরি অ্যাক্সেস এবং বেশ কিছু গাণিতিক অপারেশন সম্পন্ন হয়।
নিউরাল উপকরণ দিয়ে, এই চ্যানেল সেটটিকে একটি আরও সংহত সুপ্ত উপস্থাপনায় রূপান্তরিত করা হয়। একটি ক্ষুদ্র নিউরাল নেটওয়ার্ক রেন্ডারিংয়ের সময় রিয়েল টাইমে ডিকোডিং এবং উপাদানটির দৃশ্যগত বৈশিষ্ট্য পুনর্গঠনের দায়িত্বে থাকে।
এনভিডিয়া কর্তৃক শেয়ার করা পরীক্ষাগুলোতে, একটি কনফিগারেশন ১৯টি চ্যানেলের উপাদান কমিয়ে মাত্র ৮টি চ্যানেলে আনা হয়েছিল।যা, 1080p রেজোলিউশনের টেস্ট সিনগুলিতে, রূপান্তরিত হয়েছিল ২ থেকে ১০ বারের মধ্যে ত্বরণ রেন্ডারিং সময়ে, এটি নির্দিষ্ট ক্ষেত্রের উপর নির্ভর করে।
এই পদ্ধতি শুধু মেমরিই সাশ্রয় করে না, বরং এটি প্রতি পিক্সেলের জন্য ডেটা অ্যাক্সেস এবং অপারেশনের সংখ্যা সরল করে।এটি বিশেষত রে ট্রেসিং এবং পাথ ট্রেসিং কনফিগারেশনের ক্ষেত্রে অত্যন্ত গুরুত্বপূর্ণ, যেখানে প্রতিটি আলোক প্রতিফলনের খরচ বহুগুণে বেড়ে যায়।
এনভিডিয়ার নতুন এআই-চালিত গ্রাফিক্স পাইপলাইনের মধ্যে এনটিসি
নিউরাল টেক্সচার কম্প্রেশন এককভাবে আসে না। এটি একটি বৃহত্তর কৌশলের অংশ, যার মধ্যে রয়েছে এনভিডিয়া নিউরাল নেটওয়ার্ক ব্যবহার করে গ্রাফিক্স পাইপলাইনের গুরুত্বপূর্ণ অংশগুলো নতুন করে ডিজাইন করছে।DLSS, ফ্রেম জেনারেশন বা আসন্ন DLSS 5-এর মতো প্রযুক্তিগুলো একই মূল ধারণার উপর ভিত্তি করে তৈরি: রেন্ডারিংয়ের কিছু প্রথাগতভাবে "কঠিন" কাজকে অপ্টিমাইজড এআই মডেলের ওপর ছেড়ে দেওয়া।
জিটিসি-র বেশ কয়েকটি প্রযুক্তিগত আলোচনায় ব্যাখ্যা করা হয়েছে যে, সাধারণ ইমেজ পোস্ট-প্রসেসিং ছাড়াও, টেক্সচার এবং ম্যাটেরিয়ালের কম্প্রেশন ও নিউরাল রেন্ডারিং হল মূল উপাদান। সেই ইকোসিস্টেমটি ভালোভাবে কাজ করার জন্য। মেমরি কমানো, প্রতিবন্ধকতা হ্রাস করা এবং রিসোর্স মুক্ত করার ফলে ডিএলএসএস (DLSS) ইমেজ রিকনস্ট্রাকশনের মতো অন্যান্য পর্যায়গুলো আরও বেশি কর্মপরিধি পায়।
এনভিডিয়া যে একটি বিষয়ের উপর জোর দেয় তা হলো, এনটিসি এবং নিউরাল ম্যাটেরিয়ালসের ক্ষেত্রে, শৈল্পিক বিষয়বস্তু "উদ্ভাবন" করার জন্য জেনারেটিভ এআই ব্যবহার করা হচ্ছে নাবরং, এগুলো হলো ইনফারেন্স মডেল, যা আর্ট টিম দ্বারা পূর্বে নির্ধারিত টেক্সচার এবং মেটেরিয়ালের চেহারা বিশ্বস্তভাবে পুনরুৎপাদন করার জন্য ডিজাইন করা হয়েছে। এর লক্ষ্য হলো গেমের মূল ভিজ্যুয়াল অভিপ্রায়ের উপর এআই-এর সম্ভাব্য প্রভাব সম্পর্কে কমিউনিটিতে উত্থাপিত কিছু সমালোচনার সমাধান করা।
বাস্তবে, ঘোষিত লক্ষ্য হলো নিউরাল টুলগুলো এমনভাবে কাজ করবে যেন তারা প্রযুক্তিগত ত্বরণকারীএবং শিল্পী ও স্টুডিওগুলোর সৃজনশীল কাজের বিকল্প হিসেবে নয়, যা নিয়ে বিতর্ক নিশ্চিতভাবেই চলতে থাকবে যখন এই সমাধানগুলো বাণিজ্যিক মাধ্যমে আসবে।
এনভিডিয়া অনুসারে, যে নেটওয়ার্কগুলো NTC সমর্থন করে, সেগুলোকে ভিডিও গেমে সাধারণত পাওয়া যায় এমন বিভিন্ন ধরনের উপকরণের জন্য ইতিমধ্যেই প্রশিক্ষণ দেওয়া হয়েছে।প্রযুক্তিটি ডেভেলপারদের জন্য উন্মুক্ত হয়ে গেলে, এটি তাত্ত্বিকভাবে বাণিজ্যিক ইঞ্জিনগুলিতে এর সংযোজনকে সহজতর করবে।
ইউরোপীয় বাজার এবং ভবিষ্যৎ স্থাপনার উপর সম্ভাব্য প্রভাব
এখন পর্যন্ত, এনভিডিয়া বাণিজ্যিক গেমগুলিতে নিউরাল টেক্সচার কম্প্রেশন ব্যাপকভাবে বাস্তবায়নের জন্য কোনো নির্দিষ্ট তারিখ নির্ধারণ করেনি, কিন্তু প্রযুক্তিগত প্রদর্শনীগুলো এমন একটি পরিস্থিতির ইঙ্গিত দিচ্ছে যেখানে VRAM-এর ব্যবহার কম সীমাবদ্ধ হয়ে উঠতে পারে।, বিশেষ করে পিসিতে।
ইউরোপে, যেখানে হার্ডওয়্যারের ক্ষেত্রটি অত্যন্ত বৈচিত্র্যময়, এই ধরনের সমাধান একটি সুস্পষ্ট প্রভাব ফেলতে পারে। অনেক ব্যবহারকারী খেলেন ৬ বা ৮ জিবি ভিআরএএম যুক্ত জিপিইউ সহ গেমিং ল্যাপটপ বা ডেস্কটপ'আল্ট্রা' টেক্সচারযুক্ত কিছু AAA গেমে এই পরিমাণ ইতিমধ্যেই অপ্রতুল হতে শুরু করেছে। NTC যদি তার প্রতিশ্রুতি পূরণ করে, তবে এটি গেমের টেক্সচার অদলবদল হওয়া বা হঠাৎ পারফরম্যান্স কমে যাওয়া ছাড়াই এই হাই সেটিংস বজায় রাখতে সাহায্য করতে পারে।
গবেষণাগুলোর দৃষ্টিকোণ থেকে, কিছু বাস্তব প্রণোদনাও রয়েছে: টেক্সচার ডেটা কম থাকার অর্থ হলো বিল্ডগুলো হালকা হবে।ট্রায়াল গেমের ডাউনলোড সাইজ ছোট হবে এবং আপডেট হতে আরও যুক্তিসঙ্গত সময় লাগবে। ইউরোপীয় গেমারদের জন্য, যেখানে সবার কাছে উচ্চ-গতির ফাইবার অপটিক সংযোগ নেই, বড় গেম ইনস্টল বা আপডেট করার সময় এটি কিছুটা কম হতাশাজনক অভিজ্ঞতা দিতে পারে।
তবে, পর্যবেক্ষণ করার মতো বিষয়ও থাকবে। নিউরাল টেক্সচার কমপ্রেশনের প্রকৃত গ্রহণযোগ্যতা নির্ভর করবে... আনরিয়েল ইঞ্জিন, ইউনিটি বা অন্যান্য অভ্যন্তরীণ ইঞ্জিনের মতো ইঞ্জিনগুলিতে সহজে একীভূত হওয়ার সুবিধাএটি নির্ভর করে বিভিন্ন প্রজন্মের জিপিইউ-এর সমর্থন এবং প্রতিটি স্টুডিওর জন্য গুণমান, কর্মক্ষমতা ও বাস্তবায়ন ব্যয়ের ভারসাম্যের উপর।
যাই হোক না কেন, যা স্পষ্ট মনে হচ্ছে তা হল গ্রাফিক্স মেমরি অপ্টিমাইজেশনের জন্য একটি অগ্রাধিকারমূলক লক্ষ্যে পরিণত হয়েছে।এবং এনটিসি-র মতো প্রস্তাবনাগুলো 'নিউরাল রেন্ডারিং'-এর বৃহত্তর একটি ধারার সঙ্গে সামঞ্জস্যপূর্ণ, যেখানে বুদ্ধিমান কম্পিউটিং শুধুমাত্র ব্রুট ফোর্স-ভিত্তিক কিছু প্রচলিত সমাধানকে প্রতিস্থাপন করে।
বৃহত্তর প্রেক্ষাপটে দেখলে, নিউরাল টেক্সচার কম্প্রেশন, নিউরাল ম্যাটেরিয়ালস এবং ডিএলএসএস-কে কেন্দ্র করে ঘোষিত অন্যান্য কৌশলগুলো এমন এক প্রজন্মের গ্রাফিক্স ইঞ্জিনের দিকে ইঙ্গিত করে, যেখানে এআই শুধু পিক্সেল তৈরিই করে না, বরং সেগুলোকে কীভাবে সংরক্ষণ, সংকুচিত এবং পুনর্গঠন করতে হবে, সেই সিদ্ধান্তও নেয়।যদি বাণিজ্যিক গেমগুলোতে ভিআরএএম সাশ্রয়, উন্নত ডিটেইল এবং রেন্ডারিং সময় কমানোর প্রতিশ্রুতিগুলো বাস্তবায়িত হয়, তাহলে রিয়েল-টাইম গ্রাফিক্স তৈরি ও সম্পাদনের পদ্ধতিতে সাম্প্রতিক বছরগুলোর অন্যতম গুরুত্বপূর্ণ একটি পরিবর্তন আমরা দেখতে পারি।