Loading...
Z-Image ile görüntü oluşturma ve düzenleme. Geliştirilmiş gerçekçilik, daha net metin oluşturma ve ileri AI teknolojisi tarafından desteklenen yerel düzenleme yetenekleri.
Z-Image, fotoğrafik gerçekçi görüntü oluşturma, Çince ve İngilizce metni doğru şekilde oluşturma ve iki dilli talimatları güçlü bir şekilde uyma konusunda güçlü yetenekleri olan güçlü bir AI modelidir. Yalnızca 8 adımda lider rakiplere eşit veya onları aşan performans elde eder.
Z-Image modeli, Ölçeklenebilir Tek Akışlı DiT (S3-DiT) mimarisini benimser. Bu tasarım, çeşitli koşullu girdilerin (metin ve görüntü katıştırmaları gibi) işlenmesini gürültülü görüntü gizli değişkenleriyle birleştirir ve bunları tek bir diziye dönüştürerek Transformer arka ucuna besler. Metin, görsel anlamsal jetonlar ve görüntü VAE jetonları, çift akışlı yaklaşımlara kıyasla parametre verimliliğini maksimize etmek için dizi düzeyinde birleştirilir.
6 milyar parametreli bir model için görüntü oluşturmada istisnai performans gösterir. ModelScope platformunda (NVIDIA A10 GPU'ları kullanan) test sırasında, çoğu oluşturma yalnızca 9 adımda en fazla 2 saniye sürdü. Yüksek kaliteli tüketici GPU'larında (RTX 3090 veya 4090 gibi) bu yaklaşık 2 ila 3 saniye, orta seviye kartlarda 4 ila 5 saniye sürer.
Z-Image, fotoğrafçılık düzeyinde gerçekçiliğe sahip görüntüler üretmede mükemmeldedir ve ayrıntılar, aydınlatma ve dokular üzerinde ince kontrol gösterir. Yüksek sadakati güçlü estetik kaliteyle bileşim ve genel ruh halinde dengelenmiştir. Oluşturulan görüntüler yalnızca gerçekçi değil, aynı zamanda görsel olarak etkileyicidir.
Z-Image, yüz gerçekçiliğini ve genel estetik bileşimi korurken Çince ve İngilizce metni doğru şekilde oluşturabileceği için en üst düzey kapalı kaynaklı modellerle karşılaştırılabilir sonuçlar elde eder. Poster tasarımında güçlü bileşim becerilerini ve iyi tipografi duygusunu gösterir. Küçük yazı boyutları gibi zor senaryolarda bile yüksek kaliteli metin oluşturabilir ve metinsel olarak kesin ve görsel olarak büyüleyici tasarımlar sunar.
Güçlü istem geliştirici (PE), mantık ve sağduyuyu enjekte etmek için yapılandırılmış bir akıl yürütme zinciri kullanır ve modelin 'tavşan ve tavuk problemi' gibi karmaşık görevleri veya klasik Çin şiirini görselleştirmeyi yönetmesini sağlar. Düzenleme görevlerinde, belirsiz kullanıcı talimatlarıyla karşılaşıldığında bile, model temel niyeti çıkarmak ve mantıksal olarak tutarlı bir sonuç sağlamak için akıl yürütme yeteneklerini uygulayabilir.
Z-Image-Edit, iki dilli düzenleme talimatlarının güçlü bir şekilde anlaşılmasını gösterir ve hayal gücü ile esneklik içinde görüntü dönüşümlerini sağlar. Yerleşik düzenleme özellikleri, harici araçlar olmadan sorunsuz değişikliklere izin verir.
Z-Image, yalnızca 8 adımla lider rakiplere eşit veya onları aşar. Enterprise düzeyinde H800 GPU'larında alt saniye çıkarsama gecikmesi sunar ve 16G VRAM tüketici cihazları içinde rahatça yer alır.
Elo tabanlı İnsan Tercih Değerlendirmesine (Alibaba AI Arena'da) göre, Z-Image diğer lider modellerle oldukça rekabetçi performans gösterirken, açık kaynaklı modeller arasında en gelişmiş sonuçları elde eder.
Yalnızca 8 adımda doğru iki dilli metin oluşturma ile fotoğrafik gerçekçi görüntüler oluşturun. Yıldırım hızında oluşturma ile profesyonel kalitede sonuçları deneyimleyin.
Görüntünüzü ayrıntılı istemlerle tanımlayın. Z-Image, karmaşık iki dilli talimatları anlamada mükemmeldir ve Çince ve İngilizce metin oluşturmayı hassasiyet ile yönetebilir.
Yerleşik İstem Geliştirici (PE), mantık ve sağduyuyu enjekte etmek için yapılandırılmış akıl yürütme kullanır. Karmaşık görevleri çözebilir ve belirsiz talimatlardan bile niyetinizi çıkarabilir.
Yalnızca 8 adımda alt saniye gecikmesi ile oluşturun. Iki dilli düzenleme talimatları ve yerel düzenleme yetenekleri ile yaratıcı dönüşümler için Z-Image-Edit kullanın.
Doğru Çince ve İngilizce oluşturma için iki dilli metin gereksinimlerini açıkça belirleyin
Fotoğrafçılık düzeyinde gerçekçilik için aydınlatma, gölgeler ve dokular açıklayın
Karmaşık yaratıcı görevler ve akıl yürütme için istem geliştiriciyi kullanın
Hızlı yineleme için hızlı 8 adımlı oluşturmadan yararlanın
Poster tasarımı ve tipografi için bileşim becerilerinden yararlanın
Belirsiz yaratıcı talimatları yönetmek için modelin akıl yürütmesine güvenin
Z-Image, fotoğrafik gerçekçi görüntü oluşturma, Çince ve İngilizce metni doğru şekilde oluşturma ve iki dilli talimatları güçlü bir şekilde uyma konusunda güçlü yetenekleri olan güçlü bir AI modelidir. Yalnızca 8 adımda lider rakiplere eşit veya onları aşan performans elde eder.
Z-Image, metin, görsel anlamsal jetonlar ve görüntü VAE jetonlarını dizi düzeyinde birleştirilmiş bir girdi akışı olarak birleştiren Ölçeklenebilir Tek Akışlı DiT (S3-DiT) mimarisini kullanır. Bu, çift akışlı yaklaşımlara kıyasla parametre verimliliğini maksimize eder.
Z-Image, enterprise düzeyinde H800 GPU'larında alt saniye çıkarsama gecikmesi sunar. NVIDIA A10 GPU'larında, çoğu oluşturma yalnızca 9 adımda en fazla 2 saniye sürer. RTX 3090/4090 gibi tüketici GPU'larında yaklaşık 2-3 saniye, orta seviye kartlarda 4-5 saniye sürer.
Evet, Z-Image, yüz gerçekçiliğini ve genel estetik bileşimi korurken Çince ve İngilizce metni doğru şekilde oluşturmada mükemmeldür. Güçlü bileşim becerilerini ve tipografi duygusunu gösterir ve küçük yazı boyutları gibi zor senaryolarda bile yüksek kaliteli sonuçlar sunar.
İstem Geliştirici, mantık ve sağduyuyu enjekte etmek için yapılandırılmış bir akıl yürütme zinciri kullanır ve modelin 'tavşan ve tavuk problemi' gibi karmaşık görevleri yönetmesini veya klasik Çin şiirini görselleştirmesini sağlar. Belirsiz talimatlardan bile temel niyeti çıkarabilir.
Alibaba AI Arena'daki Elo tabanlı İnsan Tercih Değerlendirmesine göre, Z-Image diğer lider modellerle oldukça rekabetçi performans gösterirken, açık kaynaklı modeller arasında en gelişmiş sonuçları elde eder.
Yalnızca 8 adımda doğru iki dilli metin oluşturma ile fotoğrafik gerçekçi görüntü oluşturmayı deneyimleyin. Yıldırım hızında performans en gelişmiş kaliteyle buluşur.
Z-Image, fotoğrafçılık düzeyinde gerçekçilik, kesin Çince ve İngilizce metin oluşturma ve İstem Geliştirici aracılığıyla gelişmiş akıl yürütme yetenekleri sunar. Tüketici GPU'larında 2-5 saniyede profesyonel kalitede görüntüler oluşturun.
Z-Image'ı deneyimleyin - S3-DiT mimarisi ile en gelişmiş açık kaynaklı görüntü oluşturma