অ্যাপল নিউজ

অ্যাপলের সর্বশেষ এআই টুল আপনার বর্ণনার উপর ভিত্তি করে একটি ছবি অ্যানিমেট করতে পারে

অ্যাপল তার ক্রমবর্ধমান AI ভাণ্ডারে আরেকটি সংযোজন করেছে এমন একটি টুল তৈরি করে যা ব্যবহারকারীর টেক্সট প্রম্পটের উপর ভিত্তি করে স্ট্যাটিক ইমেজ অ্যানিমেট করার জন্য বৃহৎ ভাষার মডেল (এলএলএম) ব্যবহার করে।





DALL·E দিয়ে তৈরি MacRumors ইমেজ
অ্যাপল একটি নতুন গবেষণা পত্রে উদ্ভাবনের বর্ণনা দিয়েছে ' কীফ্রেমার: বড় ভাষার মডেল ব্যবহার করে অ্যানিমেশন ডিজাইনের ক্ষমতায়ন। '

'যদিও Dall·E এবং Midjourney-এর মতো বাণিজ্যিক টেক্সট-টু-ইমেজ সিস্টেমে ওয়ান-শট প্রম্পটিং ইন্টারফেস সাধারণ, আমরা যুক্তি দিই যে অ্যানিমেশনের জন্য ব্যবহারকারীর বিবেচনার আরও জটিল সেট প্রয়োজন, যেমন সময় এবং সমন্বয়, যা সম্পূর্ণরূপে নির্দিষ্ট করা কঠিন। একটি একক প্রম্পট—অতএব, বিকল্প পন্থা যা ব্যবহারকারীদের পুনরাবৃত্তভাবে তৈরি ও পরিমার্জন করতে সক্ষম করে, বিশেষ করে অ্যানিমেশনের জন্য প্রয়োজন হতে পারে।



'আমরা কীফ্রেমার নামে একটি নতুন এআই-চালিত অ্যানিমেশন টুল তৈরি করতে এলএলএম-এর কোড-জেনারেশন ক্ষমতার সাথে ডিজাইন আর্টিফ্যাক্টগুলির ভাষা-ভিত্তিক প্রম্পটিং-এর জন্য উদীয়মান নকশা নীতিগুলিকে একত্রিত করেছি৷ কীফ্রেমারের সাহায্যে, ব্যবহারকারীরা প্রাকৃতিক ভাষা প্রম্পটিংয়ের মাধ্যমে স্ট্যাটিক 2D চিত্রগুলি থেকে অ্যানিমেটেড চিত্র তৈরি করতে পারে৷ GPT-4 3 ব্যবহার করে, Keyframer একটি ইনপুট স্কেলেবল ভেক্টর গ্রাফিক (SVG) অ্যানিমেট করতে CSS অ্যানিমেশন কোড তৈরি করে।'

একটি অ্যানিমেশন তৈরি করতে, ব্যবহারকারী একটি SVG ছবি আপলোড করে – একটি স্পেস রকেটের, বলুন – তারপর একটি প্রম্পটে টাইপ করুন যেমন 'তিনটি ডিজাইন তৈরি করুন যেখানে আকাশ বিভিন্ন রঙে বিবর্ণ হয়ে যায় এবং তারাগুলি জ্বলে ওঠে।' কীফ্রেমার তারপর অ্যানিমেশনের জন্য CSS কোড তৈরি করে এবং ব্যবহারকারী কোডটি সরাসরি সম্পাদনা করে বা অতিরিক্ত পাঠ্য প্রম্পট প্রবেশ করে এটিকে পরিমার্জন করতে পারে।

'কীফ্রেমার ব্যবহারকারীদের তাদের সম্পূর্ণ নকশা অগ্রিম বিবেচনা করার পরিবর্তে, ক্রমাগত প্রম্পটিংয়ের মাধ্যমে তাদের ডিজাইনগুলিকে পুনরাবৃত্তিমূলকভাবে পরিমার্জন করতে সক্ষম করেছে,' লেখক ব্যাখ্যা করেন। 'এই কাজের মাধ্যমে, আমরা ভবিষ্যতের অ্যানিমেশন ডিজাইন টুলগুলিকে অনুপ্রাণিত করার আশা করি যা LLM-এর শক্তিশালী জেনারেটিভ ক্ষমতাকে একত্রিত করে গতিশীল সম্পাদকদের সাথে ডিজাইন প্রোটোটাইপিংকে ত্বরান্বিত করতে যা নির্মাতাদের সৃজনশীল নিয়ন্ত্রণ বজায় রাখতে সক্ষম করে।'

গবেষণাপত্র অনুসারে, পেশাদার অ্যানিমেশন ডিজাইনার এবং প্রকৌশলীদের সাথে সাক্ষাত্কারের মাধ্যমে গবেষণাটি জানানো হয়েছিল। 'আমি মনে করি এটি আমার করা অনেক কিছুর চেয়ে অনেক দ্রুত ছিল,' গবেষণাপত্রে উদ্ধৃত একজন অংশগ্রহণকারী বলেছেন। 'আমি মনে করি এর আগে এরকম কিছু করতে কয়েক ঘন্টা সময় লাগত।'


উদ্ভাবনটি অ্যাপলের AI ব্রেকথ্রুগুলির একটি সিরিজের সর্বশেষতম। গত সপ্তাহে অ্যাপলের গবেষকরা ড মুক্তি একটি এআই মডেল যা চিত্রগুলিতে পিক্সেল-স্তরের সম্পাদনা সম্পাদন করতে মাল্টিমোডাল এলএলএম-এর শক্তি ব্যবহার করে।

ডিসেম্বরের শেষ দিকে, অ্যাপলও প্রকাশিত এটি একটি উদ্ভাবনী ফ্ল্যাশ মেমরি ব্যবহার কৌশল উদ্ভাবনের মাধ্যমে সীমিত মেমরি সহ আইফোন এবং অন্যান্য অ্যাপল ডিভাইসে এলএলএম স্থাপনে অগ্রগতি অর্জন করেছে।

উভয় তথ্য এবং বিশ্লেষক জেফ পু বলেছেন যে অ্যাপলের কিছু ধরণের জেনারেটিভ এআই বৈশিষ্ট্য উপলব্ধ থাকবে। আইফোন এবং আইপ্যাড বছরের পরে , কখন iOS 18 মুক্তি না. অ্যাপলের মোবাইল সফ্টওয়্যারের পরবর্তী সংস্করণে একটি অন্তর্ভুক্ত রয়েছে বলে জানা গেছে সিরির উন্নত সংস্করণ ChatGPT-এর মতো জেনারেটিভ এআই কার্যকারিতা সহ, এবং এটি ‌আইফোনের ইতিহাসে 'সবচেয়ে বড়' আপডেট হওয়ার সম্ভাবনা রয়েছে, ব্লুমবার্গ রিপোর্টার মার্ক গুরম্যান .

(এর মাধ্যমে ভেঞ্চারবিট .)