في إعلان جديد، كشفت شركة جوجل عن نموذج جديد يعتمد على الذكاء الاصطناعي اللغوي، والذي يحمل اسم AudioPaLM، ويتميز بالقدرة على الاستماع والتحدث والترجمة بدقة عالية وسرعة كبيرة.
ويتميز هذا النموذج بأنه يستند إلى نقاط القوة في نموذجين آخرين موجودين بالفعل، وهما PaLM-2 و AudioLM، حيث يقوم بجمعهما معًا لتوليد النصوص والكلام بكفاءة عالية.
ويمكن لنموذج AudioPaLM الجديد أن يقوم بالعديد من الوظائف المختلفة، مثل الترجمة الصوتية من لغة إلى أخرى مع الحفاظ على نبرة الصوت نفسها، كما يمكنه التقاط الأصوات أو الأوامر المنطوقة، ثم إعادة إنتاج الصوت بلغات أخرى مختلفة.
ويمكن للنموذج أيضًا تعرّف الأصوات وترجمتها إلى نصوص، حتى إنه يمكنه ترجمة التراكيب اللغوية التي لم يتعرض لها من قبل بدقة كبيرة، وفقًا للباحثين العاملين على النموذج.
يعتبر هذا الإعلان بمثابة خطوة مهمة لشركة جوجل نحو تطوير الذكاء الاصطناعي اللغوي، والذي يمكن أن يستخدم في العديد من المجالات، مثل تحرير المقاطع الصوتية بكفاءة، وأخذ العينات الصوتية لتوليد كلام بلغات مختلفة.
ويجب الإشارة إلى أن هذا النموذج لا يزال قيد البحث والتطوير، ولا يُعرف حتى الآن موعد توفره للجمهور.
ويجب أيضًا الإشارة إلى أن شركة ميتا أعلنت سابقًا عن نموذج ذكاء اصطناعي جديد، يحمل اسم Voicebox، ويتميز بالقدرة على أداء مهام إنشاء الكلام، والتي يمكن استخدامها في العديد من المجالات المختلفة.