এআই দিয়ে ছবি সম্পাদনায় বড় সমস্যা ছিল ধারাবাহিকতা। একটি ছোট পরিবর্তনের অনুরোধে পুরো ছবি বদলে যেত। ওপেনএআই বলছে, নতুন মডেল এই সমস্যার সমাধান করবে। মডেলটির নাম ‘জিপিটি ইমেজ ১.৫’।
এর মাধ্যমে কৃত্রিম বুদ্ধিমত্তাভিত্তিক ছবি তৈরির প্রযুক্তিতে আরও এক ধাপ এগোল ওপেনএআই। প্রতিষ্ঠানটি নতুন একটি ইমেজ জেনারেশন মডেল উন্মোচন করেছে। এটি ইতিমধ্যে চ্যাটজিপিটি ব্যবহারকারীদের জন্য চালু হয়েছে। এপিআইয়ের মাধ্যমেও এটি ব্যবহার করা যাবে।
ওপেনএআই জানায়, নতুন এই মডেল আগের তুলনায় নির্দেশনা ভালোভাবে অনুসরণ করতে পারে। ছবি সম্পাদনা হবে আরও নিখুঁতভাবে। ছবি তৈরির গতি বাড়বে চার গুণ পর্যন্ত।
এআই প্রযুক্তির বাজারে প্রতিযোগিতা দিন দিন তীব্র হচ্ছে। বিশেষ করে গুগলের জেমিনি সিরিজের সঙ্গে ওপেনএআইয়ের লড়াই এখন প্রকাশ্য। গত মাসে ওপেনএআইয়ের প্রধান নির্বাহী স্যাম অল্টম্যান একটি অভ্যন্তরীণ বার্তায় ‘কোড রেড’ ঘোষণা করেন। সেখানে বলা হয়, বাজারে নেতৃত্ব ধরে রাখতে দ্রুত নতুন প্রযুক্তি আনবে ওপেনএআই।
গুগল সম্প্রতি তাদের জেমিনি ৩ এবং নতুন ইমেজ জেনারেটর ‘ন্যানো বানানা প্রো’ উন্মোচন করেছে। এগুলো একাধিক মানদণ্ডে ভালো ফল দেখিয়েছে। এর জবাবে ওপেনএআই গত সপ্তাহে জিপিটি–৫.২ মডেল ছাড়ে। এবার এল নতুন ইমেজ মডেল।
ওপেনএআইয়ের আগের ইমেজ মডেল ‘জিপিটি ইমেজ ১’ প্রকাশিত হয়েছিল এপ্রিলে। নতুন সংস্করণে যুক্ত হয়েছে উন্নত পোস্ট–প্রোডাকশন সুবিধা। ছবি সম্পাদনার সময় মুখের অভিব্যক্তি, আলো, রঙ ও কম্পোজিশনের সামঞ্জস্য রাখা সহজ হবে।
চ্যাটজিপিটিতে ছবির জন্য আলাদা একটি ইন্টারফেসও যুক্ত করা হয়েছে। সাইডবারে থাকা এই অংশটি কাজ করবে একটি ‘ক্রিয়েটিভ স্টুডিও’র মতো। এখানে ছবি দেখা, সম্পাদনা এবং নতুন আইডিয়া নেওয়া সহজ হবে।
ওপেনএআইয়ের অ্যাপ্লিকেশন প্রধান নির্বাহী ফিদজি সিমো এক ব্লগ পোস্টে বলেন, ছবি তৈরির অভিজ্ঞতা আরও ভিজ্যুয়াল করা হচ্ছে। ব্যবহারকারীরা এখন ট্রেন্ডিং প্রম্পট ও প্রস্তুত ফিল্টার থেকেও অনুপ্রেরণা পাবেন।
এ ছাড়া সার্চ ফলাফলেও আরও ভিজ্যুয়াল তথ্য দেখানোর পরিকল্পনা রয়েছে। এতে মাপজোক রূপান্তর বা খেলাধুলার স্কোর দেখার মতো কাজে সুবিধা হবে।
ওপেনএআই বলছে, লক্ষ্য একটাই। ব্যবহারকারীর ভাবনাকে দ্রুত বাস্তবে রূপ দেওয়া। শব্দের পাশাপাশি ছবি দিয়েও গল্প বলাই এখন তাদের নতুন অগ্রাধিকার।
-মাহমুদ










