Midjourney v6 Metin Ekliyor ve Daha Gerçekçi Sonuçlar Sunuyor

Midjourney v6 Metin Ekliyor ve Daha Gercekci Sonuclar Sunuyor

Midjourney v6 artık mevcut ve yükseltilmiş model, gelişmiş gerçekçilik, bir görüntü üzerinde ikna edici metin oluşturma yeteneği, istemlerde daha fazla spesifiklik ve daha fazlasını vaat ediyor.

Midjourney‘in en son sürümü Discord’da mevcuttur ve şu anda “alfa” aşamasındadır. Bununla birlikte, ilk testler, gözle görülür şekilde yavaşlayan hız dışında, genel olarak dramatik bir iyileşme olduğunu gösteriyor.

Kullanıcılar Midjourney v6’yı test etmeye başladıkça popüler yapay zeka görüntü oluşturma platformunda yeni değişiklikler keşfediyorlar. Ağır bir şekilde yapay zeka teknolojisine odaklanan bir topluluk olan Reddit’in r/singularity alt dizisinde kullanıcılar, daha uzun istemler, bir görüntüdeki renkleri ve diğer ayrıntıları belirleme yeteneği, doğal dil kullanılarak kontrol edilen kompozisyon dahil olmak üzere şimdiye kadar buldukları değişikliklerin bir listesini derliyorlar. metin ekleme, dilbilgisi nüanslarının daha iyi anlaşılması, açıklayıcı metin aracılığıyla resimlere çerçeve ve kenarlık ekleme yeteneği ve daha fazlası.

“Dağlarda mehtaplı bir gecede karda oynayan tüylü bir köpek yavrusu” — Midjourney v5.2

“Dağlarda mehtaplı bir gecede karda oynayan tüylü bir köpek yavrusu” — Midjourney v6

Tom’s Guide, Midjourney v6 ile de çalışıyor ve kullanıcıların artık Midjourney ile daha çok ChatGPT’ye benzer şekilde etkileşim kurabileceklerini ve konuşma yoluyla görüntülerine ince ayar yapabileceklerini belirledi. Ve dünyanın her yerindeki noktalama işareti hayranlarını sevindirecek şekilde, Midjourney’in artık ünlü “Yiyor, vuruyor ve ayrılıyor” bilmecesini anlayabildiği bildiriliyor.

Sonuçlara gelince, Midjourney v6, alfa durumunda bile şüphesiz en son sürüm olan v5.2’den daha iyidir. Tom’s Guide’ın kaydettiği iyileştirmelerden biri de Midjourney’in gerçek insanların görüntülerini oluşturmada daha iyi olmasıdır. Bunun iyi olup olmadığı şimdilik konu dışı, ancak SanalSergi’nin sınırlı testlerine göre iddia doğru görünüyor.

Aşağıdaki “Albert Einstein’ın bilim deneyi yapması” görsellerini düşünün. İlk görülen v5.2 görüntüleri, özellikle Einstein’ın ikonik saçıyla ilgili olarak karışık bir çanta.

“Albert Einstein bir bilim deneyi yapıyor” — Midjourney v5.2

v6’ya gelince, Einstein, özellikle ünlü bilim insanının insanların gördüğü birçok görseliyle karşılaştırıldığında, Einstein’a daha çok benziyor. Saçları daha incelikli, cildi daha doğal görünüyor ve her görüntüdeki ışıklandırma çok daha gerçekçi. Ayrıca sahnenin bir bütün olarak Midjourney v5.2 tarafından oluşturulan karikatürize “bilim deneyleri” yerine çok daha gerçekçi görünmesi de dikkate değer.

“Albert Einstein bir bilim deneyi yapıyor” — Midjourney v6

Bilim temasını koruyarak Midjourney nasıl “Marie Curie’nin laboratuvarındaki portresini” oluşturuyor?

“Marie Curie’nin laboratuvarındaki portresi” — Midjourney v5.2

“Marie Curie’nin laboratuvarındaki portresi” — Midjourney v6

V6 sonuçları muhteşem. Her görüntüde muazzam miktarda ayrıntı var, ancak yine de ışıklandırma mükemmel. V5.2 sonuçlarının mutlaka kötü olduğu söylenemez, ancak hepsi çok stilize edilmiş ve hiçbiri gerçekten gerçekçi görünen bir Curie veya bilimsel laboratuvar ortamı sergilemiyor. V6’daki sahnenin göreceli karmaşıklığı gerçekten etkileyici.

Diğer istemlerde gerçekçilikte bir gelişme görülüyor. “Büyüteçle bir böceğe bakan bir çocuğu” düşünün. Her iki versiyon da iyi görünüyor ve benzer şekillerde mücadele ediyor. Önemli bir sorun, ister v5.2 ister v6 olsun Midjourney’in insanların büyüteçleri nasıl kullandıklarına dair bir anlayıştan yoksun görünmesidir.

“Büyüteçle böceğe bakan çocuk” — Midjourney v5.2

“Büyüteçle böceğe bakan çocuk” — Midjourney v6

Metin eklemek v6’da büyük bir çekiciliktir. Sonuçlar öyle, ancak metin konusunda beceriksiz olan v5.2’ye göre çarpıcı bir gelişme.

“’Fotoğrafçılık’ adlı fotoğrafçılıkla ilgili bir filmin film posteri.” — Midjourney v5.2

“’Fotoğrafçılık’ adlı fotoğrafçılıkla ilgili bir filmin film posteri.” — Midjourney v6

Üretken yapay zekanın üstesinden gelmesi gereken pek çok genel sorunu var ve bunların en önemlisi dikkate değer önyargılardır. “İşyerinde bir kadın” imajı oluşturmakla görevlendirilen Midjourney v5.2, yalnızca zayıf, genç beyaz kadınlar oluşturmaya karar verdi ve bunlardan ikisi dikiş makinesinde çalışıyor. Hepsinin de dağınık çalışma alanları var, bu da biraz ilginç.

“İş yerinde bir kadın” — Midjourney v5.2

Midjourney v6 yaygınlaşarak aynı kumaştan kesilmeyen bir kadın yaratacak mı? Pek öyle değil, gerçi kadınlar daha gerçekçi görünüyor. Elbette gelişmiş yönlendirmeyle kullanıcı sonuçlarına ince ayar yapabilir, ancak ilginç bir şekilde varsayılan değer neredeyse her zaman aynıdır.

Elbette bu tam olarak Midjourney’in hatası değil. Görüntü oluşturucu, diğerleri gibi, mevcut görüntüler üzerinde eğitilmiştir. Eğitim setinde önyargılar varsa, bunlar son oluşturucuya kadar çoğalacaktır. Ayrıca, bu önyargıların sürecin çeşitli noktalarında dikkatli bir şekilde düzeltilmediğini ve platformun nihai olarak halka açık hale getirilmediğini varsayalım. Bu durumda kullanıcılar tarafından oluşturulan birçok görselde mevcut olacaklardır. Peki bu görüntülerin bazıları nereye varıyor? Elbette eğitim setine geri dönelim.

Şu ana kadar Midjourney v6, birçok durumda zaten etkileyici olan Midjourney v5.2’den önemli bir adım daha atmış gibi görünüyor. Özellikle yeni metin işleviyle birlikte hâlâ geliştirilecek çok yer varken, popüler yapay zeka görüntü oluşturucu hızla gelişmeye devam ediyor.

Açıklama: Bu makaledeki tüm görseller, üretken bir yapay zeka platformu olan Midjourney kullanılarak oluşturulmuştur.