يمكن أن يكون إنشاء نماذج ثلاثية الأبعاد واقعية لتطبيقات مثل الواقع الافتراضي وصناعة الأفلام والتصميم الهندسي عملية مرهقة تتطلب الكثير من التجارب اليدوية والأخطاء.
في حين أن نماذج الذكاء الاصطناعي التوليدية للصور يمكنها تبسيط العمليات الفنية من خلال تمكين المبدعين من إنتاج صور ثنائية الأبعاد واقعية من المطالبات النصية، فإن هذه النماذج ليست مصممة لإنشاء أشكال ثلاثية الأبعاد. ولسد هذه الفجوة، تعمل تقنية تم تطويرها مؤخرًا تسمى Score Distillation على الاستفادة من نماذج توليد الصور ثنائية الأبعاد لإنشاء أشكال ثلاثية الأبعاد، لكن مخرجاتها غالبًا ما تكون ضبابية أو كرتونية.
استكشف باحثو معهد ماساتشوستس للتكنولوجيا العلاقات والاختلافات بين الخوارزميات المستخدمة لإنشاء صور ثنائية الأبعاد وأشكال ثلاثية الأبعاد، وحددوا السبب الجذري للنماذج ثلاثية الأبعاد ذات الجودة المنخفضة. ومن هناك، قاموا بصياغة إصلاح بسيط لـ Score Distillation، والذي يتيح إنشاء أشكال ثلاثية الأبعاد حادة وعالية الجودة تكون أقرب في الجودة إلى أفضل الصور ثنائية الأبعاد التي يتم إنشاؤها بواسطة النماذج.
تحاول بعض الطرق الأخرى حل هذه المشكلة عن طريق إعادة التدريب أو الضبط الدقيق…