BEİJİNG, 2 Ağustos (Xinhua) -- Çinli yapay zeka şirketi ShengShu Technology ve Tsinghua Üniversitesi tarafından geliştirilen ve metinden ve resimden video üretebilen büyük video oluşturma modeli Vidu kısa süre önce küresel kullanıma açıldı. 30 saniye içinde 4 saniyelik kısa videolar oluşturabilen Vidu, tek seferde 32 saniye uzunluğunda videolar üretebiliyor. Tsinghua Yapay Zeka Enstitüsü Müdür Yardımcısı Zhu Jun, "Vidu, yüz ifadelerini titizlikle işlemesinin yanı sıra doğal ışık ve gölge efektleri gibi fiziksel yasalara uygun ayrıntılı sahneler oluşturarak reel dünyanın simülasyonunu gerçekleştirebiliyor. Ayrıca derinliği olan ve karmaşık sürreal içerik de üretebiliyor" dedi. Zhu, Vidu'nun bilim-kurgu, romantizm ve animasyon gibi farklı türler için her bir tarzın özüne uygun sahneler üretebildiğini ve ayrıca duman ve mercek parlaması gibi yüksek kaliteli sinematik efektler de oluşturabildiğini sözlerine ekledi. Bu yapay zeka modeli, geniş plan, yakın plan ve orta boy çekim gibi çekim türlerini yönetebiliyor ve tek plan çekim, netlik ayarı ve yumuşak sahne geçişlerini zahmetsizce üretebiliyor. Kullanıcılar portre ya da özelleştirilmiş karakter görüntülerini yükleyip metin açıklamaları yardımıyla karakterlerin herhangi bir sahnede herhangi bir hareketi yapmasını sağlayabiliyor. Bu özellik video üretim sürecini kolaylaştırıp yaratıcı özgürlüğü artırıyor. Şirket, Vidu'nu temel mimarisinin 2022'de önerildiğini söyledi.
Çin'de geliştirilen büyük video oluşturma modeli Vidu küresel kullanıma açıldı
Bunlar da ilginizi çekebilir