ما هو التعرف على الكلام؟

استخدام صوتك كطريقة إدخال

التعرف على الكلام هي تقنية تسمح بالإدخال المنطوق في الأنظمة. تتحدث إلى جهاز الكمبيوتر أو الهاتف أو الجهاز وتستخدم ما قلته كمدخل لتشغيل بعض الإجراءات. يتم استخدام التقنية لاستبدال طرق الإدخال الأخرى مثل الكتابة أو النقر أو التحديد بطرق أخرى. إنها وسيلة لجعل الأجهزة والبرامج أكثر سهولة في الاستخدام وزيادة الإنتاجية.

هناك الكثير من التطبيقات والمجالات التي يتم فيها استخدام التعرف على الكلام ، بما في ذلك الجيش ، كمساعدات للأشخاص الذين يعانون من ضعف (تخيل شخص مصاب بالشلل أو عدم وجود يدين أو أصابع) ، في المجال الطبي ، في الروبوتات إلخ. في المستقبل القريب ، سيتعرض الجميع تقريبًا للتعرف على الكلام بسبب انتشاره بين الأجهزة الشائعة مثل أجهزة الكمبيوتر والهواتف المحمولة.

تستخدم بعض الهواتف الذكية ميزة التعرف على الكلام بشكل مثير للاهتمام. أجهزة iPhone و Android هي أمثلة على ذلك. من خلالها ، يمكنك بدء مكالمة إلى جهة اتصال بمجرد الحصول على تعليمات منطوقة مثل "Call Office". يمكن أيضًا الترفيه عن أوامر أخرى ، مثل "تشغيل البلوتوث".

مشاكل مع التعرف على الكلام

كما تم استخدام التعرف على الكلام ، في نسخته المعروفة باسم الكلام إلى نص (STT) ، لفترة طويلة لترجمة الكلمات المنطوقة إلى نص. "أنت تتحدث ، من النوع" ، كما يقول ViaVoice في صندوقه. ولكن هناك مشكلة واحدة مع STT كما نعرفها. منذ أكثر من 10 سنوات ، حاولت استخدام ViaVoice ولم يدم أسبوعًا على جهاز الكمبيوتر الخاص بي. لماذا ا؟ كان ذلك غير دقيق إلى حد كبير ، وانتهى بي الأمر إلى قضاء المزيد من الوقت والطاقة والتحدث والتصحيح من كتابة كل شيء. ViaVoice هي واحدة من الأفضل في هذه الصناعة ، لذلك تخيل الباقي. لقد نضجت التكنولوجيا وحسّنت ، لكن الكلام إلى النص ما زال يجعل الناس يطرحون الأسئلة. واحدة من الصعوبات الرئيسية هي الاختلافات الهائلة بين الناس في نطق الكلمات.

ليست كل اللغات مفترضة في التعرف على الكلام ، وغالبًا ما لا يتم دعم تلك اللغات بالإضافة إلى الإنجليزية. نتيجة لذلك ، فإن معظم الأجهزة التي تقوم بتشغيل برنامج التعرف على الكلام تعمل بشكل معقول فقط باللغة الإنجليزية.

تجعل مجموعة من متطلبات الأجهزة صعوبة في التعرف على الكلام في حالات معينة. تحتاج إلى ميكروفون ذكي بما فيه الكفاية لتصفية ضجيج الخلفية ولكن في الوقت نفسه قوي بما يكفي لالتقاط الصوت بشكل طبيعي.

الحديث عن الضوضاء في الخلفية ، يمكن أن يتسبب في فشل النظام بأكمله. نتيجة لذلك ، فشل التعرف على الكلام في العديد من الحالات بسبب وجود ضوضاء خارجة عن تحكم المستخدم.

لقد ثبت أن التعرف على الكلام أفضل حالًا كطريقة إدخال للهواتف الجديدة وتكنولوجيات الاتصال مثل VoIP ، بدلاً من كونه أداة إنتاجية لإدخال النص الشامل.

تطبيقات التعرف على الكلام

تكتسب هذه التكنولوجيا شعبية في العديد من المجالات ونجحت في ما يلي:

- جهاز التحكم. إن مجرد قول "OK Google" إلى هاتف يعمل بنظام Android يعمل على إطلاق نظام يمثل كل الأذنين للأوامر الصوتية.

- أنظمة بلوتوث السيارة. العديد من السيارات مجهزة بنظام يربط آلية الراديو بهاتفك الذكي من خلال البلوتوث. يمكنك حينئذٍ إجراء مكالمات وتلقيها دون لمس هاتفك الذكي ، بل ويمكنك أيضًا طلب الأرقام فقط عن طريق نطقها.

- النسخ الصوتي. في المناطق التي يضطر فيها الأشخاص لكتابة الكثير ، يلتقط بعض البرامج الذكية كلماتهم المنطوقة وينسخها في نص. هذا هو الحال في بعض برامج معالجة النصوص. يعمل النسخ الصوتي أيضًا مع البريد الصوتي المرئي .