Teknoloji
Moderator
OpenAI DevDay'de tanıtılan geliştirici araçları kapsamında şirketin bulut hizmeti Realtime API'yi sizlere aktarmıştık. Şirket, beta sürümünde olan Realtime API'yi güncelleyerek platformuna konuşmadan konuşmaya uygulamalar için yeni sesler ekliyor. Bununla beraber, şirket, istemleri önbelleğe alma konusunda maliyetleri azaltıyor.
Güncelleme kapsamında Realtime API'nin beta kullanıcıları, uygulamalarını oluşturmak için kullanabilecekleri beş yeni sese sahip olacak. OpenAI, X'te yayınladığı bir gönderi ile bu beş sesten üçü olan Ash, Verse ve Ballad'ı sergiledi. Şirketin API dokümantasyonunda paylaştığı bilgilere göre; yerel konuşmadan konuşmaya özelliği ile ara metin formatının atlanması, düşük gecikme ve nüanslı çıktıyı beraberinde getiriyor. Buna ek olarak bu yeni beş ses, önceki seslere kıyasla daha kolay yönlendirilebiliyor.
Öte yandan OpenAI'ın belirttiğine göre, API, henüz beta aşamasında olduğu için istemci tarafında kimlik doğrulaması sunulamıyor. Bununla beraber şirket, gerçek zamanlı sesin işlenmesiyle ilgili sorunlar olabileceğini de belirtiyor. Bu anlamda OpenAI, ağ koşullarının gerçek zamanlı ses üzerindeki etkisine dikkat çekiyor.
Realtime API piyasaya sürüldüğünde, fiyatlandırması ses girişinin dakikası başına 0,06 dolar ve ses çıkışı başına 0,24 dolar olarak karşımıza çıkmaktaydı. Bu fiyatların pek de ucuz olmadığını belirtelim. Şimdi şirket, hızlı önbellekleme ile gerçek zamanlı API fiyatlarını düşürmeyi planlıyor. Böylece önbelleğe alınan metin girdileri yüzde 50, önbelleğe alınan ses girdileri ise yüzde 80 oranında indirimli olacak. Üstelik OpenAI, DevDay'de duyurduğu İstem Önbellekleme (Prompt Caching) özelliği ile şirketin modellerinin belirli durumlarda kullanıcı girdisini yeniden kullanmasını sağlıyor. Böylece modeller, daha önce bir kez tamamladıkları hesaplamaları tekrarlamak durumunda kalmıyor.
Konuşmadan konuşmaya yapay zeka, işletmelerin bir ses kullanarak daha gerçek zamanlı yanıtlar oluşturmasını sağlıyor. OpenAI ise Realtime API ile sesli asistanların oluşturulmasını hızlandırmayı amaçlıyor. Bu yaklaşımla şirketlerin müşteri hizmetleri departmanlarının ciddi bir yapay zeka dönüşümüne uğrayacağını söylemek mümkün.
Güncelleme kapsamında Realtime API'nin beta kullanıcıları, uygulamalarını oluşturmak için kullanabilecekleri beş yeni sese sahip olacak. OpenAI, X'te yayınladığı bir gönderi ile bu beş sesten üçü olan Ash, Verse ve Ballad'ı sergiledi. Şirketin API dokümantasyonunda paylaştığı bilgilere göre; yerel konuşmadan konuşmaya özelliği ile ara metin formatının atlanması, düşük gecikme ve nüanslı çıktıyı beraberinde getiriyor. Buna ek olarak bu yeni beş ses, önceki seslere kıyasla daha kolay yönlendirilebiliyor.
Öte yandan OpenAI'ın belirttiğine göre, API, henüz beta aşamasında olduğu için istemci tarafında kimlik doğrulaması sunulamıyor. Bununla beraber şirket, gerçek zamanlı sesin işlenmesiyle ilgili sorunlar olabileceğini de belirtiyor. Bu anlamda OpenAI, ağ koşullarının gerçek zamanlı ses üzerindeki etkisine dikkat çekiyor.
Realtime API piyasaya sürüldüğünde, fiyatlandırması ses girişinin dakikası başına 0,06 dolar ve ses çıkışı başına 0,24 dolar olarak karşımıza çıkmaktaydı. Bu fiyatların pek de ucuz olmadığını belirtelim. Şimdi şirket, hızlı önbellekleme ile gerçek zamanlı API fiyatlarını düşürmeyi planlıyor. Böylece önbelleğe alınan metin girdileri yüzde 50, önbelleğe alınan ses girdileri ise yüzde 80 oranında indirimli olacak. Üstelik OpenAI, DevDay'de duyurduğu İstem Önbellekleme (Prompt Caching) özelliği ile şirketin modellerinin belirli durumlarda kullanıcı girdisini yeniden kullanmasını sağlıyor. Böylece modeller, daha önce bir kez tamamladıkları hesaplamaları tekrarlamak durumunda kalmıyor.
Konuşmadan konuşmaya yapay zeka, işletmelerin bir ses kullanarak daha gerçek zamanlı yanıtlar oluşturmasını sağlıyor. OpenAI ise Realtime API ile sesli asistanların oluşturulmasını hızlandırmayı amaçlıyor. Bu yaklaşımla şirketlerin müşteri hizmetleri departmanlarının ciddi bir yapay zeka dönüşümüne uğrayacağını söylemek mümkün.