مَا هُوَ بَرْنَامَجُ لايرا؟

 

"لايرا- Lyra" تكنلوجيا الصوت الجديدة التي تستخدمها غوغل


لايرا- Lyra تكنلوجيا الصوت الجديدة

يستخدم Google duo على android تقنية جديدة، وتُسمّى هذه التكنلوجيا "لايرا- Lyra"، بحيث يتمتع الأشخاص بجودة عالية وصوت موثوق به أثناء مكالمات الفيديو على أي شبكة.

تم تطوير برنامج لايرا- Lyra خصيصًا عندما تكون على اتصال ذي نطاق ترددي منخفض مثل شبكة 2G.


ما هو برنامج لايرا- Lyra؟

Lyra-لايرا هو برنامج ترميز صوتي عالي الجودة ومنخفض معدل البت يجعل الاتصال الصوتي متاحًا حتى على أبطأ الشبكات. للقيام بذلك، يتم تطبيق تقنيات الترميز التقليدية مع الاستفادة من التطورات في التعلم الآلي (ML) مع نماذج مدربة على آلاف الساعات من البيانات لإنشاء طريقة جديدة لضغط ونقل الإشارات الصوتية.

المصدر: What is Lyra | GitHub


ويتمثّل دور برنامج لايرا- Lyra في أنه يقوم بـضغط الملف الصوتي في الوقت الفعلي لدرجة أنه يمكن تشغيله بسرعة 3 كيلوبايت في الثانية مع بقاء الصوت بنبرته الأصلية، هذا يعني أنه يمكن أن يعمل حتى على مودم طلب هاتفي قديم يعمل عبر خط أرضي.

في السنة الماضية، قامت Google DUO و Google Meet بنشر 1 تريليون رسالة من مقاطع الفيديو على مستوى العالم، وقد أثبت لنا حقًا أن مكالمات الفيديو أصبحت أفضل طريقة للناس في جميع أنحاء العالم للتواصل مع بعضهم البعض.

ويتمّ بماء برنامج لايرا- Lyra، لأنه في أماكن وبلدان مثل الهند والبرازيل، لا تزال بعض المناطق الريفية تعمل على شبكة 2G، بينما تعاني المدن المزدحمة من شبكات مزدحمة في كل مكان.

وبسبب هذا، يمكن أن يؤدي إلى تقطّع في المكالمة أو قطع مكالمات الصوت والفيديو نهائيا، مما يجعل من الصعب على الأشخاص البقاء على اتصال.

بدأ Google duo في طرح هذا البرنامج الآن، بحيث يمكن للأشخاص الاتصال بأصدقائهم وعائلاتهم بالفيديو في أي وقت وفي أي مكان دون مواجهة مشكلات الصوت.

بعد طرح لايرا- Lyra على Google duo، يتمّ التّخطيط لإصداره كبرنامج مفتوح المصدر، يمكن تضمينه في أي منصة للاتصالات.

ما هو برنامج لايرا- Lyra؟
كيفية عمل Lyra


ولتطوير لايرا- Lyra، يتعين على المبرمجين حل العديد من التحدّيات التقنية مثل ضوضاء الخلفية والتعامل مع أصوات أشخاص متعددة وجعلها تعمل على هاتف في الوقت الفعلي.

وكان على المبرمجين أيضًا التأكد من أن هذا البرنامج سيعمل مع الجميع دون مشاكل بعد الإطلاق.

يختلف صوت كل شخص، لذلك احتاجت لايرا- Lyra إلى العمل بلغات ولهجات مختلفة.

لحل هذه التحديات،  قام المبرمجون بالاستفادة من البيانات المتاحة للجمهور (Publicly available data) لتدريب النموذج.


وقد امتد هذا التّدريب إلى آلاف الساعات من الصوت، بأكثر من 70 لغة ولهجة مختلفة، وتَمَّ بعد ذلك تعزيز هذه الأصوات عن طريق إضافة مؤثرات اصطناعية وضوضاء وارتداد للتأكد من أن لايرا- Lyra يمكنها التعامل مع أي موقف قد تواجهه.

كانت الصناعةُ تبحث عن كيفية استخدام الذكاء الاصطناعي لـضغط الصوت لفترة من الوقت، ولكن هذه هي المرة الأولى التي يتمّ فيها جمع كل شيء معًا وحلّ الكثير من تلك المشكلات الفنية.


تقول Google:

التصميم الأساسي لبرنامج ترميز Lyra بسيط للغاية. يتم استخراج الميزات ، أو سمات الكلام المميزة ، من الكلام كل 40 مللي ثانية ثم يتم ضغطها للإرسال. الميزات نفسها هي مخططات طيفية لوغاريتمية ، وهي قائمة بالأرقام التي تمثل طاقة الكلام في نطاقات تردد مختلفة ، والتي تم استخدامها تقليديًا لأهميتها الإدراكية لأنها تم تصميمها على غرار الاستجابة السمعية البشرية. على الطرف الآخر ، يستخدم النموذج التوليفي تلك الميزات لإعادة إنشاء إشارة الكلام. بهذا المعنى ، فإن Lyra تشبه إلى حد كبير برامج الترميز البارامترية الأخرى ، مثل MELP.

المصدر: Lyra: A New Very Low-Bitrate Codec for Speech Compression | Google AI Blog


لهذا السبب كان هناك حماس كبير لجعل لايرا- Lyra مفتوح المصدر، لاعتباره لبنة أساسية لما هو التالي في ضغط الصوت.


المصادر:



الصورة الشّخصية لمحمد الورياغلي خبير منتجات Google


كتابة تعليق ...

إرسال تعليق

كتابة تعليق ...

يُمكنك كتابة التّعليق هنا (0)

أحدث أقدم