Günümüzde birçok alanda karşımıza çıkan yapay zeka temelli teknolojilerin kullanım alanları, dijitalleşme ile birlikte gitgide genişliyor. Yapay zeka destekli dijital ses çözümleri konusunda dikkat çeken çalışmalara imza atan Türk girişim şirketi DeepZen de seslendirme, oyun ve otomotiv sektörleri de dahil olmak üzere “sesin olduğu” bir çok alandaki teknolojileriyle hayalleri gerçeğe dönüştürüyor.
Power House’un yatırımcısı olduğu ve yüksek teknoloji ürünü çözümleriyle, birden fazla dilde insan sesine en yakın sesi üretebilen ve bu sesleri üretirken duygu kontrolü de yapabilen İngiltere merkezli Türk girişim şirketi DeepZen, Türkiye ve Dünya’da bu yetenekte dijital ses çözümleri sunabilen öncü teknoloji şirketleri arasında yer alıyor. Sahip olduğu bilgi birikimi ve üstün nitelikli mühendislerden oluşan uzman ekibiyle sektörde önemli projelere imza atmaya devam eden DeepZen, bu kapsamda otomatik deşifre, Makine Tabanlı Sinir Ağlarına Dayalı Çeviri (NMT), ses sentezi, dudak senkronizasyonu ve yeni geliştirilen ses klonlama teknolojileri sayesinde geleneksel dublajı aratmayacak işler ortaya koyuyor.
Ses klonlaması ile dublaj çalışmaları
Günümüzde dünyada sadece birkaç şirket, yapay zekâ bazlı dublaj çalışmaları yapabiliyor. Ülkemizde sektör lideri konumunu günden güne pekiştiren DeepZen de Türkiye’nin en iyi bilinen sanatçılarından birinin sesini kopyalayıp (klonlayıp), sanatçının kendi sesiyle ve yapay zekâ sayesinde dublaj yapabilecek seviyeye ulaşmak üzerine çalışmalarını sürdürüyor. Buna dayanarak, ses klonlamasını mümkün kılan teknolojiler geliştirip kişilerin kendi seslerini kullanarak ya da müşterilerinin talepleri doğrulusunda özel sesler oluşturarak kullanmalarına olanak sağlıyor. Bununla birlikte, sesli kitaplar, reklam, pazarlama, podcasting, oyun ve sanal asistanlar dahil olmak üzere, diğer sesli içerik türleri için de dijital ses çözümleri üretiyor.
Tüm bunlara ilave olarak DeepZen, stüdyoya girmeksizin az miktarda ses verisinden (evde çekilmiş videolar gibi) ses klonlaması gerçekleştirebiliyor. Böylelikle kişilerin kendi seslerini kullanarak ya da markaları için istedikleri biçimde özel sesler oluşturarak kullanmalarına olanak sağlıyor. Örneğin, şirket sahibinin ya da şirket yöneticilerinin seslerini klonlayıp, istediği tüm iletişimleri, bilgilendirmeleri (yılbaşı mesajı, ya da uluslararası şirket toplantısı gibi) yazılabilecek tüm metinleri kişinin sesinden konuşturabilmesini mümkün oluyor.
DeepZen Kurucu ve CEO’su Taylan Kamış konuyla alakalı olarak; “Bizce her yapay zekâ tabanlı teknolojide olduğu gibi teknolojinin doğru ve insanlığın yararına kullanılması çok kıymetli. Biz DeepZen olarak bu sorumluluk bilinciyle insanlık adına güzelliklere imza atacağımıza inanıyoruz. Bizi dinlemeye devam edin!” yorumunu yapıyor.
DeepZen, Power House ile Globalde Büyümesini Artıracak
2018 yılında Türk girişimciler tarafından kurulan ve Türkiye’de pazar liderliğini pekiştiren DeepZen, teknoloji ve video yayıncılığı alanında en önemli yatırım platformlarından biri olan Power House’dan aldığı destek ile global alanda da büyüme ivmesini artırmayı hedefliyor. Video yayıncılık ekosistemini yatırımlarıyla destekleyen Power House’un Kurucu Ortağı Enes Usta, “Dijitalleşmenin her geçen gün arttığı günümüzde DeepZen gibi dikkat çeken teknolojiler geliştiren bir girişime yatırımlarımızla ve yaratıcı fikirler, stratejik düşünce ve teknoloji üzerine geliştirdiğimiz programlar ile destek olmaktan büyük mutluluk duyuyoruz. Türkiye’nin mühendislik ve teknoloji geliştirme gücünü DeepZen gibi başarılı girişimlerle dünyaya göstermeye devam edeceğiz” diyor.
Efsanevi Sanatçı Edward Herrmann’ın Sesine Hayata Verdiler
DeepZen Kurucu ve CEO’su Taylan Kamış ilginç projelere imza atıklarını belirterek, “Biz DeepZen olarak kendimizi teknoloji ile özdeşleştiriyor, sürekli gelişen bilgiyi, hayata ve insanlığa anlam katma sanatı ile birleştirmeyi seviyoruz. Adımız da o yüzden DeepZen. Yapay zeka her alanda ağırlığını artırmaya devam ederken bu yeni duruma uyum sağlamak isteyenler için biz de payımıza düşeni yapmaya özen gösteriyoruz. Örneğin; Bugüne kadar yaptığımız en ilginç projelerden biri, 2014 yılında vefat eden efsanevi sanatçı Edward Herrmann’ın eski ses kayıtlarını, ailesinden izin alıp klonlamak oldu. Bizce her yapay zekâ tabanlı teknolojide olduğu gibi teknolojinin doğru ve insanlığın yararına kullanılması çok kıymetli. Daha nice güzelliklere imza atacağımıza inanıyoruz” diyerek sözlerini tamamlıyor.
Sektör önümüzdeki yıllarda nasıl şekillenecek?
Peki yeni teknolojiler, yapay zekâ ile dublaj, makineler tarafından yapılan montaj sektöre iyi gelecek mi? İnsanlar işsiz kalacak mı? Bu sektörde çalışanlar buna nasıl tepki gösterecekler sorularına ilişkin DeepZen Kurucu ve CEO’su Taylan Kamış , “Aynı kitap işine ilk başladığımızdakine benzer şekilde, bugün seslendirme dünyasında, sektör önderleri, ses sanatçıları, sendikalar ve film sektör paydaşları arasında farklı görüşler hâkim. Bizim baktığımız taraftan şöyle görmek mümkün, ne yaparsak yapalım teknoloji geliyor, doğru değerlendirenler, doğru pozisyon alanlar avantajlarından faydalanırken, teknolojiyi dışarıda tutmak isteyenler sıkıntı yaşayabilirler. Bu yeni teknolojilere uyum sağlamak isteyen ler için biz payımıza düşeni yapmaya çaba gösteriyoruz. Tüm işlerimizde ses sanatçılarının haklarını ve seslerini koruyacak hukuksal lisanslama surecine önem veriyor, destek olmak için elimizden geleni yapıyoruz.” diyor.
Lisanslama süreci nasıl ilerliyor?
DeepZen, Dünya’nın çeşitli yerlerinde ses sanatçıları ile anlaşıp, seslerini kullanabilmek için lisans anlaşması yapıyor. Seslerinin ne kadar süre ile hangi alanlarda kullanabileceğini sanatçılar seçiyor. Anlaşma sonrası, ses sanatçıları ile stüdyoya giriliyor. Dil bilimciler, mühendisler ve uzman bir ekip tarafından uyarlanan sistematik bir kurguyla ses kayıt alma ve işlemesi yapılıyor (duyguları kayıt edebilmek için önceden özenle hazırlanan scriptler üzerinden). Daha sonra DeepZen yapay zeka ses teknolojisi, sanatçısının kayıt edilmiş sesinden, onun gibi konuşmayı öğreniyor ve daha sonra yazılacak her metni, tıpkı o sanatçı gibi, farklı stillerde (haber, konuşma vb.) okuyabiliyor.
Sesiniz hep aynı kalıyor!
Bu teknoloji sayesinde sözgelimi 20 yaşındaki bir dublaj sanatçısı, stüdyoya girip sesini DeepZen teknolojisi ile kaydettiğinde, 50 yaşına bile gelse 20 yaşındaki sesiyle seslendirme yapabiliyor olacak. Sesi kısılsa bile kaydettiği gün olduğu gibi sağlıklı sesiyle dublaja devam edilebilecek.