İki dev arasındaki rekabet büyüyor

Microsoft’un yatırım yaptığı OpenAI ve Google, geçen hafta art arda teknoloji dünyası için çok önemli sayılabilecek gelişmelere ve birkaç açıdan yeni başlangıçlara imza attı…
24.05.2024 11:55 GÜNCELLEME : 24.05.2024 11:55

PARA YAPAY ZEKA/ ŞULE GÜNER OpenAI, 13 Mayıs'ta yapay zeka sohbet robotu ChatGPT'nin yeni versiyonu olan GPT-4o'yu tanıtırken; Google 14 Mayıs'ta yazılım geliştiriciler için her yıl düzenlenen O/I etkinliğinde Proje Astra'yı, yeni video modeli Veo'yu ve Gemini'nin Docs, Gmail gibi iş araçlarında kullanılabileceği yeniliklerini açıkladı.

GPT-4Vo kullanıcılarla sesli diyaloga girebiliyor. Önceki versiyonu GPT4'e göre daha hızlı ve dili konuşma diline daha yakın, hem insani hem de robotik bir tonla ve zaman zaman flörtöz bir dil kullanıyor.

Buna örnek olarak, Apple'ın sesli asistanı Siri gibi Amerikan aksanıyla İngilizce konuşan yumuşak bir kadın sesinin kullanıldığı robot, tanıtım toplantısına gelen davetlilere nasıl olduklarını sordu. Bir övgüyle karşılaştığındaysa, "Lütfen, beni utandırıyorsun" yanıtını verdi. GPT-4o versiyonunun 50'ye yakın dilde iletişime geçebileceği söyleniyor.

Yeni versiyon görselleri okuyabiliyor ve yüz ifadelerinden duyguları ayırt edebiliyor. Daha önce verdiği yanıtları da hatırlayabiliyor. ChatGPT-4o daha kolay bir sohbet diline sahip ve sorulara anında yanıt veriyor.

GPT-4o ise yazılı, sesli ve görsel bilgileri algılayıp eş zamanlı olarak yanıt verebiliyor. Diğer yandan GPT-4o'nun sesli versiyonunun kullanıldığı canlı tanıtımda yapay zeka robotu bir kağıda yazılmış olan basit bir denklemi çözmektense "şu uygulamaları kullanarak" faydalı tavsiyelerde bulundu. Başka bir örnekteyse gülümseyen bir adamı tahta bir yüzeyle karıştırdı ve henüz ona gösterilmemiş bir denklemi çözmeye başladı.

Bazı bilgisayar kodlarını analiz etti, İtalyanca ve İngilizce çeviriler yaptı ve gülümseyen bir insanı gösteren bir fotoğraftan o insanın duygularını okudu.

Bu gibi aksaklıklar, yapay zeka sohbet robotlarını güvenilmez ve potansiyel olarak tehlikeli yapan "teknik kusur ve halüsinasyonların" giderilmesi için gidilecek yol olduğunu gösteriyor.

Ancak yeni versiyon bize gösteriyor ki, GPT-4o yeni nesil yapay zeka asistanı olma yönünde ilerliyor.

Yapay zekayla ilgili, kimsenin görmek istemediği büyük bir sorun da, bu teknolojinin doğaya maliyeti. Yapay zeka normal bilgisayar işlemlerinden çok daha fazla enerjiye ihtiyaç duyuyor. Yaptığı işlemler karmaşıklaştıkça, harcadığı enerji de artıyor.

ASTRA VE VEO

Google'ın yapay zeka üzerine düzenlenen O/I etkinliğinde ise bir yapay zeka asistanı olan Project Astra tanıtıldı. Project Astra aynı zamanda akıllı gözlüklerle de uyumlu. Etkinlikte bu yeni asistan video ile tanıtıldı ve bir kişi telefonunun kamerası açık şekilde etrafında gördüklerini yapay zekaya sordu. Astra gördüğü her şeyi tanımlayabiliyor ve soruları yanıtlıyor.

Veo ise Google'ın bugüne kadarki en gelişmiş video oluşturma modeli olarak duyuruldu. Veo'nun Sora'ya rakip olarak kurgulandığını söylemek mümkün.

Yüksek kaliteli 1080p ve 1 dakikadan uzun videolar üretebilen Veo, sinematik veya farklı tarzlarda videolar üretebiliyor. Hatta konutlarınızı sinematogratif bir dille ifade etmeniz halinde bunları da anlıyor. Veo'da komutlarınızı metin, görsel veya video olarak verebilirsiniz.

Kullanıcının yaratıcı vizyonuna en yakın videoyu ortaya çıkarmaya çalışan Veo, uzun istemlerdeki ayrıntıları doğru bir şekilde anlıyor ve istenilen görsel tonu yakalayabiliyor.

Üstelik Veo da OpenAI'ın Sora'sı gibi bazı film yapımcısı ve yaratıcı ekiple çalışıyor. Veo'yu ilk deneyeceklerse, etkinliğin ismine uygun bir şekilde bazı yazılım geliştiriciler olacak.

Diğer yanda etkinlikte tanıtılan Google'ın en kaliteli metinden görüntüye modeli olduğu belirtilen Imagen 3 versiyonu, eski versiyonuna göre daha kaliteli görüntüler oluşturuyor.

Dilleri ve komutları anlamada daha iyi seviyeye gelen Imagen 3, uzun komutlardaki en küçük ayrıntıları bile çalışmasına dahil edebiliyor.

Son olarak etkinlikte Google'ın çalışma araçlarında (Workspace) Gemini 1.5 Pro tarafından desteklenen yan panelin Gmail, Google Docs ve diğer uygulamalarda kullanıma sunulacağını duyurdu. Bu yeni özellik, kullanıcılara tüm Google Workspace uygulamalarını tek bir pencerede kolayca yönetme imkanı sağlayarak, dosya yönetiminden e-postalara kadar iş akışlarını önemli ölçüde kolaylaştırıyor.

Tüm iş akışları yapay zekaya bağlanıyor ve çalışma sürecinin çok daha kısalacağı ve verimli olacağı belirtiliyor.

*******

Oturduğunuz yerden film yapımcısı olabilirsiniz

Video geliştiren üretken yapay zeka uygulaması Runway'in 2'inci Yapay Zeka Film Festivali'nin sonuçları açıklandı. Bu yıl 3 bine yakın başvuru yapıldı.

Hollywood'da senaristler, yapımcılar ve oyuncular yapay zekanın sinemada kullanılması konusunda bölünse de yapay zeka giderek sinemaya dahil oluyor.

Üretim sürecinde yapay zeka araçlarının kullanıldığı festivalin organize eden Runway, bireylerin kendileri için anlamlı ve özel işler ortaya çıkarmasının önemli olduğunu söylüyor. Yani insanlar film yönetmeni veya yapımcısı gibi hissedecek.

Runway'ın EşKurucusu Cristуbal Valenzuela, yapay zekanın çalışanların değil, "işlerin" yerini alacağını düşünüyor. Süreçler hızlanacak ve insan enerjisini başka işlerde kullanacak. Diyor ki, yapay zeka araçlarından nasıl faydalanacağını, bizi ileride neyin beklediğini düşünmenin, yapay zekanın işlerini alacağı düşüncesinden daha iyi bir "mental model" olur.

Geçen yıl festivale katılanlar yeni işler bulmuş. Bu nedenle sinema sektöründen bağımsız olarak ilgilenen genç ve profesyonellerimiz üretken yapay zeka araçlarını bir an önce öğrenerek gelecek yıl aday olabilir.

Haftasonu öğrencilerine anlattığım üzere, bu araçları öğrenmek, pratik ederek "projeler geliştirmek", "gerçekçi olmak gerekirse" en azından yeni serbest çalışma fırsatları ortaya çıkaracak. Uluslararası bu işleri evinizden de yapabilirsiniz.

BİZE ULAŞIN