OPENAI'NİN METİNDEN VİDEOYA DÖNÜŞTÜRME MODELİ 'SORA' VE ÇİN'İN YAPAY ZEKASI 'AI'

OPENAI'NİN METİNDEN VİDEOYA DÖNÜŞTÜRME MODELİ 'SORA' VE ÇİN'İN YAPAY ZEKASI 'AI'

OpenAI'nin son metinden videoya modeli Sora, Çin'e dünyanın en iyi yapay zeka (AI) teknolojileriyle arasındaki uçurum hakkında yeni bir uyarı atışı yaparak, ülkenin neden benzer bir ürüne sahip olmadığı konusunda soruları tetikledi.

♦OpenAI’nin metinden videoya dönüştürme modeli Sora

OpenAI’nin metinden videoya dönüştürme modeli Sora, yapay zeka savaşında yeni bir cephe açtı ve ülke, arayı kapatmak için yollar ararken Çin’de daha fazla iç arayışa yol açtı.

OpenAI’den Sora, metinden videoya ilerlemeler daha fazla iç arayışı teşvik ederken, Çin’in AI hayallerine ‘soğuk su’ döküyor..

  1. Sora’nın piyasaya sürülmesi, Çin’in yapay zeka endüstrisini, artan ABD yaptırımları karşısında en son teknolojiyi nasıl yakalayacağı konusunda bir kez daha boğuşmaya zorladı…
  2. Çin, geniş veri hazinesi aracılığıyla yapay zeka yarışını domine edeceğini hayal etmişti ancak kaliteli eğitim verilerinin artık kritik olduğu kanıtlandı
OpenAI’nin son metinden videoya modeli Sora, Çin’e dünyanın en iyi yapay zeka (AI) teknolojileriyle arasındaki uçurum hakkında yeni bir uyarı atışı yaparak, ülkenin neden benzer bir ürüne sahip olmadığı konusunda soruları tetikledi.

ChatGPT’nin 2022 lansmanından sonra yerel araştırmacıları ve yatırımcıları araştırdık .

Sadece birkaç yıl önce Çin, yüz tanıma gibi işlevlere yönelik olgun uygulamalar geliştirmek için ülkenin engin veri hazinesinden yararlanarak sonunda küresel yapay zeka yarışına hakim olacağını hayal etmişti..

Metin, resim ve video gibi içerik üretmek için büyük modeller kullanan üretken yapay zekadaki son gelişmeler, hesabı değiştirdi ve Çin’in bir kez daha geride kalmasına neden oldu..

16 Şubat’ta başlatılan Sora, yapay zeka savaşını video üretimi alanına taşıyor; tıpkı Çin’in, önde gelen yapay zeka çip tasarımcısı Nvidia tarafından geliştirilen gelişmiş grafik işleme birimleri (GPU’lar) gibi önemli araçlara erişim eksikliği nedeniyle daha büyük zorluklarla karşı karşıya olduğu bir dönemde.

ABD’nin artan ihracat kısıtlamaları nedeniyle. Ülkenin en iyi yapay zeka oyuncuları, Pekin’in kendinden menkul internet yönetişim modelinin bir sorumluluk gibi göründüğü üretken yapay zeka alanında Amerikalı akranlarından  zaten birkaç yıl geride.

Bu hafta Sora’ya tepki olarak Pekin, en güvendiği devlete ait kuruluşlardan yapay zeka konusunda liderlik etmelerini istedi. 

Danıştay’ın Devlet Varlıkları Denetleme ve İdare Komisyonu Pazartesi günü, merkezi hükümetin doğrudan kontrolü altındaki firmaları “yapay zekanın getirdiği derin değişiklikleri benimsemeye” çağırdı. Bu firmalardan on tanesi yapay zekayı teşvik etme konusunda şampiyon olarak belirlendi, ancak gözlemci seçilen şirketlerin isimlerini vermedi.

New York Üniversitesi Courant Matematik Bilimleri Enstitüsü’nde Bilgisayar Bilimleri alanında yardımcı doçent olan Xie Saining, Sora’nın geliştirilmesinde yer aldığını yalanladı ve yetenek, veri ve bilgi işlem gücünün önemini vurguladı. 

–    Xie Saining:

‘Çin’in Sora’ya hazır olup olmadığını soruyorum ve ülkenin teknolojinin ‘bazı kişiler veya gruplar tarafından vurgunculuk ve manipülasyon aracı olarak kötüye kullanılmamasını’ sağlaması gerektiğini söylemek istiyorum.”

Sora’nın erişimi şu anda sınırlıdır. OpenAI’nin önceki modellerinden bazılarının aksine, açık kaynak değildir ve modelin deneme sürümüne yalnızca az sayıda kişi erişebilir.

   -Çin ana karasında, ulusal Siber Uzay İdaresi, halka açık tüm büyük dil modellerinin (LLM’ler) otoriteye kayıtlı olmasını şart koşmaktadır..
OpenAI, hizmetlerini doğrudan ana karada veya Hong Kong’da sunmuyor ve Google, Gemini AI ürününü bu pazarlarda kullanıma sunmuyor. OpenAI’nin GPT modellerini kullanan Microsoft’un Copilot’u Hong Kong’da mevcuttur..
Anakarada yabancı oyuncuların bulunmaması, birçok yerel teknoloji devini 200’den fazla LLM’den oluşan kalabalık bir pazarda yer kapmak için itişip kakışmaya itti. Çinli arama devi Baidu , sosyal medya devi Tencent Holdings ve South China Morning Post’un sahibi e-ticaret kralı Alibaba Group Holding , kendi Yüksek Lisans Programlarını açıkladı..

Ancak çok az kişi Sora’yla eşleşebiliyor, bunun nedeni kısmen yeni Difüzyon Transformatörü (DiT) mimarisini henüz kullanmamaları.

 –   TikTok’un Pekin merkezli sahibi ByteDance:
 ”Video oluşturmaya yardımcı olmak için kullanılan şirket içi video hareket kontrol aracı Boximator’ın henüz emekleme aşamasında olduğunu ve toplu olarak yayınlanmaya hazır olmadığını söyleyebilirim.. Görüntü kalitesi, aslına uygunluk ve süre açısından önde gelen video oluşturma modelleriyle hâlâ büyük bir farkı var.”

Ancak sektördeki bazı kişiler, Sora’yı eşleştirmek yerine OpenAI modeline erişim sağlamanın daha acil bir sorun olduğunu düşünüyor.

 Pekin merkezli Sinodata , metinden videoya dönüştürme aracının OpenAI’nin en büyük destekçisi olan Microsoft’un bulut bilişim platformu Azure’da kullanıma sunulmasının ardından Sora API aboneliğine başvuran ilk şirketlerden biri olacağını söyledi ..
   -Ancak ABD’de yasa yapıcılar halihazırda Çin’in Amerikan yapay zeka bulut hizmetlerine erişimini engellemenin yollarını arıyor..

Bu arada Londra merkezli tek boynuzlu at Stability AI, Sora’nın popülaritesinin ardından mimarinin üretken yapay zeka oluşturmak için ana akım haline gelebileceği için DiT’yi de kullanan metinden görüntüye modeli Stable Diffusion 3’ü piyasaya sürdü..

 –   Çinli bir geliştirici:

”Çinli yapay zeka mühendisleri için muhtemel yolun ‘önce Sora’nın kodunu çözmek ve onu kendi verileriyle eğiterek benzer bir ürün ortaya çıkarmak’ olduğunu söyleyebilirim”

Doğu Zhejiang eyaleti Hangzhou merkezli bir yapay zeka girişimcisi olan Xu Liang, Çin’in benzer hizmetlere sahip olmasının çok uzun sürmeyeceğini söyledi.

–    Xu Liang

 “Önümüzdeki bir veya iki ay içinde Çin pazarından Sora benzeri modeller çıkacak ve önümüzdeki altı ayda da bol miktarda olacak.. Ancak Xu, Çin ürünleri ile Sora arasında hala göz ardı edilemeyecek bir fark olabileceğini kaydetmeliyim..”

♦Çin’in yapay zekası ChatGPT’ye karşı nasıl bir performans sergiliyor?

 

–    Tianjin Normal Üniversitesi’nde (TJNU) yapay zeka ve makine öğrenimi üzerine yoğunlaşan profesör Wang Shuyi:

”Geçen yıl yüksek lisans geliştirme deneyiminin Çin Büyük Teknoloji firmalarının bu alandaki bilgi birikimini oluşturmasına ve stok oluşturmasına olanak sağladığını söyleyebilirim. Gerekli donanıma sahip olacak ve onlara önümüzdeki altı ay içinde Sora benzeri ürünler üretme yeteneği kazandıracak.”

Sora’nın lansmanı, etkileyici çıktısının ardındaki sır hakkında spekülasyonlara yol açtı. 

–   New York Üniversitesi’nden ve DiT’in iki geliştiricisinden biri olan Xie:

“Veriler muhtemelen Sora’nın başarısı için en kritik faktördür.. Sora’nın yaklaşık 3 milyar parametreye sahip olabileceğini tahmin ediyorum.. Eğer doğruysa bu mantıksız bir model boyutu değil.. Bu, Sora modelinin eğitiminin tahmin edildiği kadar çok GPU gerektirmeyebileceğini düşündürebilir; ilerideki yinelemelerin çok hızlı olmasını beklerdim.”

Sora’nın piyasaya sürülmesinden birkaç ay önce bir grup araştırmacı, Runway’in Gen-2 ve Pika performansını değerlendirmek üzere tasarlanmış video oluşturma modelleri için bir kıyaslama aracı olan VBench’i başlattı. 

Gen-2, 16 boyut arasında görüntüleme kalitesi ve estetik kalite gibi alanlarda öne çıkıyor ancak dinamik aralık ve görünüm tarzı açısından zayıftı..

    -Stanford Üniversitesi’nde Çinli doktora adayı Guo Wenjing tarafından ortaklaşa kurulan Pika, arka plan tutarlılığı ve zamansal titreme konusunda en iyisidir ancak görüntüleme kalitesinde iyileştirmelere ihtiyaç duymaktadır..

Singapur Nanyang Teknoloji Üniversitesi ve Çin’deki Şanghay Yapay Zeka Laboratuvarı’ndan araştırmacılardan oluşan VBench ekibi, OpenAI tarafından sağlanan demolara dayanarak Sora’nın diğer modellerle karşılaştırıldığında genel video kalitesinde üstün olduğunu buldu.

 Modelin metin istemlerini videolara nasıl dönüştürdüğüne dair sınırlı bilgi var.

–    IDC Çin’in gelişen teknolojiye ilişkin araştırmasının araştırma direktörü Lu Yanxia:

”​​Baidu, Alibaba ve Tencent gibi teknoloji devlerinin ülkede benzer hizmetleri ilk uygulayanlar arasında olacağını söyleyebilirim..”

Yerel AI oyuncuları iFlyTek, SenseTime ve Hikvision’un (tümü de Washington tarafından onaylanmış) yarışta yer alacağını söyledi.

Ancak analistlere göre Çin, ülkenin teknoloji pazarının sermaye, donanım, veri ve hatta insanlar açısından giderek daha fazla dünyadan uzaklaşmasıyla zorlu bir mücadeleyle karşı karşıya.

Microsoft, Google ve Nvidia gibi ABD’dekilerle karşılaştırıldığında Çin’in önde gelen teknoloji firmaları arasındaki piyasa değeri farkı, Pekin’in “sermayenin irrasyonel genişlemesini” dizginlemek adına teknoloji devlerine diz çöktürmeye karar vermesinden bu yana son yıllarda önemli ölçüde arttı.

  –   Lu Yanxia:

”Çin’in bir zamanlar veri miktarı açısından avantajlı olduğu düşünülürken, ülkenin artık bu yeni modelleri eğitmek için gereken kaliteli veri kıtlığıyla karşı karşıya olduğunu, bunun da gelişmiş çiplere sınırlı erişiminden kaynaklanan zorlukları artırdığını söylemeliyim.. Yetenek eksikliği de başka bir endişe kaynağı; çünkü ülkenin yapay zeka alanındaki en iyi ve en parlak kişileri ABD’deki önde gelen oyuncular için çalışırken parlamayı daha kolay buluyor..

Örneğin OpenAI’de Çin’den eğitim geçmişi olan teknoloji profesyonelleri önemli bir grup oluşturuyor.

OpenAI’nin LinkedIn’deki 1.677 ilişkili üyesi arasında 23’ü, Cambridge Üniversitesi ve Yale Üniversitesi’ni geride bırakarak, start-up’ın çalışanları arasında en yaygın dokuzuncu yüksek öğretim kurumu olan Çin’deki Tsinghua Üniversitesi’nde eğitim gördü..

Stanford Üniversitesi, Kaliforniya Üniversitesi, Berkeley ve Massachusetts Teknoloji Enstitüsü, OpenAI çalışanları arasında sırasıyla 88, 80 ve 59 çalışanıyla ilk üç kurum olup bu okulları LinkedIn profillerinde listeliyor..”

Ancak uzmanlar, gerekli yeteneğe sahip olsa bile, ABD-Çin ticaret gerilimlerinden kaynaklanan mevcut kısıtlamalarla karşı karşıya kalırken Çin’in kendi geliştirdiği üretken yapay zekanın ne kadar ileri gidebileceğini sorguluyor.

Ping An Securities bir raporda, ABD’den devam eden yarı iletken ihracat kısıtlamalarının “yerli AI çip endüstrisinin olgunluğunu hızlandırabileceği” ancak “yerli alternatiflerin beklentilerin altında kalabileceği” uyarısında bulundu.

  -Washington, ABD menşeli herhangi bir teknolojiyi içeren ilgili ürünlere yönelik kısıtlamalar yoluyla Çinli şirketlerin dünyanın en gelişmiş yarı iletken araçlarına erişimini engelledi.

  -Ekim ayında ABD, bu kısıtlamaları bir kez daha sıkılaştırdı ve Nvidia’nın daha önceki sınırlamalara yanıt olarak Çinli müşteriler için özel olarak tasarladığı GPU’lara anakaranın erişimini engelledi.

 –    Teknoloji araştırma ve danışma grubu Omdia’da ileri bilgi işlem baş analisti Alexander Harrowell:

”Çin’in yüksek lisans eğitiminde GPU’ların ötesinde seçeneklere sahip olduğunu belirtmeliyim.. Google’ın TPU’sunu [Tensör İşleme Birimi], Huawei’nin Ascend’ini, AWS’nin Trainium’unu veya pek çok start-up ürününden birini kullanabilirsiniz”

Ancak GPU’ları değiştirmenin bir maliyeti vardır.

 –   Harrowell:

“GPU yolundan ne kadar uzaklaşırsanız, yazılım geliştirme ve sistem yönetiminde size o kadar fazla çabaya mal olur”

Hangzhou merkezli girişimci Xu’ya göre, özellikle Çin pazarına yönelik fırsatlar da olacak. 

 –    Xu:

“Sora hakkındaki teknik raporun yayınlanması ve açık kaynaklı video modellerinin yayınlanmasıyla Çinli oyuncuların öğrenebileceği bir zemin oluşturulacak.. Yerel video modellerinin Çince dilini daha iyi destekleyeceğini de sözlerime eklemek isterim..”.

–    TJNU’dan Wang:

”Sora demo videolarından birinin, aktivitenin basmakalıp bir tasviri olduğunu düşündüğü dans eden bir Çin ejderhası sahnesini içerdiğini belirtmek isterim..  Çin’in çok sayıda etnik grubunun, halk geleneklerinin, geleneklerinin ve coğrafi çeşitliliğinin, yerel video modellerinin yerel kullanıcılara daha iyi hitap edebilmesi için zengin bir malzeme sunduğunu söyleyebilirim.”.

Wang ayrıca Çin ve Amerikan yapay zekası arasında “aşılmaz bir ayrım” olduğu fikrine de karşı çıktı.

–   Wang:

“Çin şirketleri, ABD’li meslektaşları yeni bir ürün ortaya çıkardığında aynı şeyi yapıp soygun yapmayı mı tercih edecekler, yoksa güvenli yapay genel zeka için çabalamak için daha büyük bir hedef belirlemeyi mi tercih edecekler?”

Please follow and like us:

Bir yanıt yazın

Social media & sharing icons powered by UltimatelySocial
Verified by MonsterInsights