Revolutionizing Video Generation: VideoPoet by Google
فيديوبويت بواسطة بحث Google هو برنامج متطور يحول نماذج اللغة إلى مولدات فيديو قوية. إنه يستفيد من مكونات متقدمة مثل محلل الفيديو MAGVIT V2 ومحلل الصوت SoundStream لتحويل الصور ومقاطع الفيديو والصوت إلى تسلسل من الرموز الم diskrete. هذه الرموز، المدمجة مع نماذج اللغة المعتمدة على النص، تمكن الأداة من توقع الرمز الفيديو أو الصوت التالي في التسلسل. يقدم فيديوبويت مجموعة واسعة من أهداف التعلم الإنشائي، بما في ذلك النص إلى الفيديو، الصورة إلى الفيديو، تنسيق الفيديو، والمزيد، مما يبرز مرونته في توليد الفيديو.
يتميز فيديوبويت بقدرته على إنشاء مقاطع فيديو عالية الجودة بتنسيق مربع أو بورتريه، ملبيًا احتياجات المحتوى قصير الشكل. مع ميزات مثل التعددية المهام على المداخل المركزة على الفيديو، الحفاظ على هوية الكائن، وقدرات تحرير الفيديو التفاعلية، يظهر فيديوبويت كيف يمكن استغلال نماذج اللغة لإنشاء مقاطع فيديو ذات تناسق زمني ملحوظ.