Duyguları olan metaverse alemlerinin sanal karakterleri ve sosyal robotlar geliyor

Geçmişi hatırlayan ve duygusal olarak iletişim kurabilen robot öğretmen geliştiren Dr. Zerrin Yumak, "Öğrenciler, insan öğretmen yerine geçmişi hatırlayan ve duygusal zekası olan robot öğretmenleri tercih etti" dedi

İletişim teorileri gösteriyor ki, insanlar bilgisayarlara ve çeşitli objelere sosyal bir aktör gibi davranma eğilimi gösterebiliyorlar.

Geçmişte bilgisayarlar sadece rasyonel işlemler yapabilen hesap makineleri gibi görülüyordu.

Şu an insanlarla ilgili çok farklı verileri işleyebildikleri, duygu ve sosyal iletişimle ilgili ipuçlarını yakalayarak, bir insanın yorgun ya da pozitif bir ruh halinde olup olmadığını anlamaları sağlanabiliyor.

Sanal gerçeklik boyutunda, metaverse ile ilgili özellikle duygulanım ve sosyal becerileri olan sanal karakterler ve robotlarla ilgili çalışan Dr. Zerrin Yumak, "Yapmaya çalıştığımız bu karakterlere bu becerileri kazandırmak, böylece karakterlerin insanlarla iletişimlerini daha doğal, kolay ve hızlı bir şekilde olmasını sağlamak istiyoruz" dedi. 
 

Dr. Zerrin Yumak.jpg
Utrecht Üniversitesi İnsan Odaklı Araştırma Grubu Hareket Algılama ve Sanal Gerçeklik Laboratuvar Lideri Dr. Zerrin Yumak

 

Geçmişi hatırlayan ve duygusal olarak iletişim kurabilen robot öğretmen geliştiren Hollanda'daki Utrecht Üniversitesi İnsan Odaklı Araştırma Grubu Hareket Algılama ve Sanal Gerçeklik Laboratuvar Lideri Dr. Zerrin Yumak, "Öğrenciler, insan öğretmen yerine geçmişi hatırlayan ve duygusal zekası olan robot öğretmenleri tercih etti" dedi.

"Geliştirdiğimiz sosyal robot, öğrencilerle uzun dönemli iletişim kurabiliyor ve geçmişte yapılan diyalogları hatırlayabiliyor" diyen Yumak, çalışma hakkında şu bilgileri verdi:

Öğrencilerle bazı testler yaptık, sonucunda geçmişi hatırlayan ve duygusal zekası olan robot versiyonlarını, insan öğretmenlerden daha çok tercih ettiklerini ve onlarlar birlikte daha iyi öğrendiklerini bulduk.
 

 

Robotların jest ve mimikleri kullanmaları hedefleniyor

Çalışma ile amaçlananın bilgisayarlara sadece belli bir işi yaptırmak değil, insanlar gibi iletişim kurmalarını öğretmek olduğunu söyleyen Yumak, şunları anlattı:

Örneğin insanlarla konuşarak diyalog kurmalarını istiyoruz. Bunu yaparken de yüz ve bedenlerindeki jest ve mimikleri kullanmalarını hedefliyoruz. Robotlar ve üç boyutlu karakterler her ne kadar fiziksel olarak birbirlerinden farklı olsalar da kullandığımız yapay zeka algoritmaları birbirine çok benziyor.
 

Bu algoritmalar 3 aşamada gerçekleşiyor. İlk aşamada sanal karakterler ve robotların, diğer insanları ve etrafta olup bitenleri anlamaları için gereken algoritmalar oluyor.

Bunun için kameralardan gelen piksel seviyesindeki verileri ve doğal dil işleme algoritmaları kullanılıyor.

Bazen farklı sensörlerden gelen verilerin bir araya getirilmesiyle birlikte değerlendirilmesi gerekebiliyor.

Örneğin, iki insanın el sıkışması ya da göz teması kurması gibi hareketler algılanabiliyor. 

İkinci aşamada, bu verilere dayanarak sanal karakterlerin ya da robotun bir karar vermesi gerekiyor.
 

 

Böylece, her bir adımda ne yapacağı belirleniyor. Örneğin, resepsiyonist bir robotun, kendisine doğru gelen birkaç insan olduğunda, bunlardan hangisine hizmet vereceği belirleniyor.

Eğitim alanında kullanılan bir sanal karakterin, karşısındaki öğrenci bir öğrenme zorluğu yaşadığı zaman, onunla nasıl doğru şekilde iletişim kuracağı üzerinde çalışılıyor.


Resepsiyonist bir robot daha çok ilgi isteyen kişiye doğru yöneliyor

Resepsiyonist bir robotun kalabalık bir ortamda kendisine yaklaşan insanlardan hangisine öncelikle hizmet vermesi gerektiğine karar veren bir algoritma geliştiren Yumak, bu robotun çok kısa sürede birçok sensörden gelen veriyi bir araya getirerek, her insan için bir ilgi puanı hesaplaması sağladıklarını belirtiyor. Böylece robot daha çok ilgi isteyen kişiye doğru yönelerek, bir diyalog başlatıyor. 

Üçüncü adım ise, bu kararı alındıktan sonra uygulanacağı aşama oluyor.

Karakterin yüz ve beden hareketleri nasıl oluşturulacak?

Tam olarak ne söyleyecek? Bunu hangi ses tonuyla ifade edecek?

Bunların insanlar için kolay olduğunu ancak aslında çok karmaşık süreçler ve disiplinler arası çalışmalar gerektirdiğini belirten Yumak, "Sadece bilgisayar bilimlerini değil, sosyal bilimler ve başka alanları da içeren çalışmalar gerekiyor. Utrecht Üniversitesi'nde biz insan odaklı yapay zeka ve oyun medya araştırmaları gibi çalışma gruplarında bu disiplinler arası çalışmaları yapıyoruz" diye anlattı. 
 

 

Hollywood filmlerindeki gibi sistemler kullanılıyor

Jest ve mimiklerin veri odaklı yapay zeka algoritmalarıyla üretilmesi üzerine yaptığı çalışma hakkında Yumak, şunları söyledi:

Örneğin bir sanal karakterin bir şeyler söylemesini ve bu diyaloğun uygun bir şekilde yüz ve beden hareketleri oluşturmasını istiyoruz. Çalışmalar gösteriyor ki, söylediğimiz şeyin içeriği kadar, nasıl söylediğimiz de çok  büyük önem taşıyor. Yüz ve beden ifadeleri insan-makine iletişiminin daha güvenilir algılanmasını ve insanların bu teknolojileri daha uzun süre kullanmasını sağlıyor. Tabii ancak doğru yapıldığı zaman mümkün oluyor.

Biz öncelikle motion capture adında bir insan hareket algılama sistemiyle çalışıyoruz. Hollywood filmlerinde kullanılan sistemlere benzer tekniklerle veri topluyoruz. Aktörler, özel işaretleyicilerden oluşan bir kıyafet giyiyor ve yüz hareketlerini yakalamak için giyilebilir bir kamera takıyor.

Toplanan veri, senkronize edilmiş vücut, yüz hareketleri ve ses kayıtlarını içeriyor. Mümkün olduğunca doğal veri toplamak istiyoruz ve bunun için bazen profesyonel aktörlerle çalışmamız gerekebiliyor.

Özellikle duygusal veri toplanmasında önemli oluyor. Örneğin dans eden ya da şarkı söyleyen bir karakter yaratmak istiyorsanız, öncelikle bu veriyi toplamanız gerekiyor. İki boyutlu videolardan da bu verileri toplamak mümkün. Ancak bunların kalitesi yeteri kadar yüksek olmuyor.


Metaverse için insanlarla anında ve gerçek zamanlı iletişim kuran karakterler geliştiriliyor

Verileri toplandıktan sonra, sadece ses ve metindeki içerik bilgisini kullanarak, yapay zeka ve derin öğrenme algoritmaları geliştiriliyor.

Sesteki titreşim bilgisi ve söylenen bir kelimeyle yüzdeki bir ifadenin ya da vücuttaki bir hareketin nasıl ilişkilendirilebileceğine bakılıyor.

Bunu bilgisayarlara öğrettiklerini belirten Yumak, "Böylelikle bir sanal karakterin davranışları çok kısa sürede, otomatik olarak oluşturulabiliyor. Eğer bunu manuel olarak yapacak olursanız, oyun sektöründe ya da Pixar, Disney filmlerinde olduğu gibi bu yöntem oldukça pahalı oluyor ve çok zaman alıyor. Ayrıca Metaverse için özellikle insanlarla anında ve gerçek zamanlı iletişim kuran karakterler geliştirmek istiyoruz. Dolayısıyla bizim geliştirdiğimiz algoritmalar, bu hareketlerin daha kısa sürede ve maliyetsiz olarak üretilmesini sağlayabiliyor" dedi. 


Siri, Alexa gibi sistemler sadece o anki konuşmamızı anlıyorlar, geçmişi hatırlamıyor

Geliştirilen algoritmaların ve oluşan davranışların insanlar üzerindeki etkileri de ölçülüyor.

Peki, yapay zekanın ürettiği sonuç, gerçekten doğru bir sonuç mu?

Öncelikle nesnel yöntemlerle ölçümler yaptıklarını kaydeden Yumak, şunları anlattı:

Oluşan sonucu çeşitli metriklerle orijinal veriyle kıyaslıyoruz. Fakat işin içinde insan faktörü olduğu için bu yeterli değil. Ayrıca insan-makine deneyleri yapıyoruz ve nesnel faktörleri de dikkate alıyoruz. Özellikle neyin doğru ya da yanlış sonuç verdiğini anlamaya çalışıyoruz.

Örneğin, insanlar gerçekçi görünen bir karakter mi unreal engine metahuman ya da Meta'daki çizgi film gibi görünen karakterler mi tercih ediyorlar? Bu karakterlerin, duygusal iç dünyalarının modellenmesi, hatırlama, duygulanım gibi becerilerin verilmesi ve böylece kişiye özel bir iletişim kurabilmeleri de hedefleniyor.

Örneğin şu anda kullandığımız Siri, Alexa gibi sistemler sadece o anki konuşmamızı anlıyorlar. Belki sizin için bir alışveriş listesi oluşturabiliyor ya da trafik durumunu kontrol edebiliyor. Fakat birkaç dakika önce ya da dün ne konuştuğumuzu hatırlamıyor. Sizin daha önce ne yaptığınızı ya da o gün nasıl bir duygu durumunda olduğunuzu bilmiyor.


"İnsanlar bazen sanal karakterlerle konuşmayı daha çok tercih ediyor"

Sanal karakterler eğlence ve ciddi amaçlı oyunlarda, sanal ve artırılmış gerçeklik gibi uygulamalarda da genel olarak, insan-makine ara yüzü olarak kullanılabiliyor.

Örneğin, eğitim alanında sanal bir eğitmen ya da arkadaş olabiliyor. Sağlık alanında, dijital bir eczanede sağlık sigortaları ile ilgili bilgi veren bir sanal danışman görevi üstleniyor.

Finans ya da bankacılık alanında örneğin ev kredisi vermek için görüşme yapabilen, insanları bilgilendiren bir karakter olabiliyor.

Yumak, "Çalışmalar gösteriyor ki, insanlar bazen sanal karakterlerle konuşmayı daha çok tercih ediyor. Başka bir gerçek insan karşılarında olduğunda, onunla konuşmaktan çekinebiliyorlar ya da zaman açısından bu karakterler daha büyük bir esneklik sağlayabiliyor. Günün her anında sizinle yorulmadan konuşabiliyorlar" diye konuştu.


Müzelerde geçmişte yaşamış önemli tarihsel karakterler, çocuklarla buluşturulabilir

Eğlence ve kültür sektöründe etkileşimli müze, dijital konserler ya da bir marka için dijital influencer gibi kullanıldığı örnekler de bulunuyor.  

Müzelerde geçmişte yaşamış önemli tarihsel karakterler, çocuklarla buluşturulabilir ve çocuklar bu kişilere istedikleri soruları sorabilirler. Bir alışveriş merkezinde, hava alanında, konser salonunda yol göstermek ve bilgi vermek için kullanılabilirler.


Star Wars'taki gibi hologramlar ile iletişim kurmamız mümkün olacak

Sanal karakterlerin diğer bir önemli kullanım alanı ise, telekomünikasyon alanı olabiliyor.

Pandemi döneminde kullanılan Zoom, Teams gibi ortamlarda iletişim kurulmaya başlandı.

Fakat bu ortamların aslında iletişim için çok da uygun olmadığını kaydeden Yumak, "Beden dili ve göz teması gibi unsurlar iyi bir şekilde ifade edilemiyor. Dolayısıyla 3 boyutlu olan sanal ortamların avantajları tartışılıyor. Mesela, şu an Star Wars'taki gibi hologramlar ile iletişim kurmamız mümkün ve bu teknolojiler çok fazla uzak değil. Avantajı sadece uzaktaki insanlarla bizi bir araya getirmesi değil, çevreye de katkıları oluyor. Örneğin gereksiz iş seyahatlerini azaltacağı için karbon ayak izini azaltmak gibi birçok başka alanda da kullanılabilir. Örneğin, otobüs duraklarındaki bilet gişelerinde insanlara bilgi vermek ya da işaret diliyle iletişim kurarak, insanlara yardımcı olabilirler. Dolayısıyla çok fazla farklı seçenek var. İnsan iletişiminin gerektiği birçok alanda bu karakterler çözüm sağlayacak" şeklinde konuştu.


"Son kararı her zaman gerçek insanların vermesi gerekiyor"

Robotlar ve sanal karakterlerin etik boyutu da bulunuyor. Bunlardan biri  olan deepfakelerle, insanların dijital kopyaları çok kısa bir sürede oluşturulabiliyor.  

Bu nedenle, nasıl kullanacağı konusunda regülasyonların olması çok büyük bir önem taşıyor.

"Çok kısa sürede bir ülke başbakanının gerçek olmayan bir konuşması yaratılabiliyor" diyen Yumak, şu noktaya dikkat çekti:

Bu tarz karakterlerin ve uygulamaların insanların işlerini elinden alacağı gibi korkular da var. Araştırmacılar olarak bizim yaklaşımımız, bu karakterler hiçbir zaman bir insanın yerine ikame edecek şekilde tasarlanmamalı. Bu uygulamalar sadece var olan süreçleri destekleyecek araçlar olarak kullanılmalı ve nihai amaç insanların hayat kalitesini arttırmak olmalı. Son kararı her zaman gerçek insanların vermesi gerekiyor.

 

© The Independentturkish

DAHA FAZLA HABER OKU