עיקרי טכנולוגיה

טכנולוגיית זיהוי דיבור

טכנולוגיית זיהוי דיבור
טכנולוגיית זיהוי דיבור

וידאו: מקרר שמתערב לנו בדיאטה ורכב שנוהג במקומנו - טכנולוגיות זיהוי דיבור 2024, יולי

וידאו: מקרר שמתערב לנו בדיאטה ורכב שנוהג במקומנו - טכנולוגיות זיהוי דיבור 2024, יולי
Anonim

זיהוי דיבור, יכולתם של מכשירים להגיב לפקודות מדוברות. זיהוי דיבור מאפשר שליטה דיבורית על מכשירים וציוד שונים (ברכה מסוימת לנכים רבים), מספק קלט לתרגום אוטומטי ויוצר תכתיב מוכן להדפסה. בין היישומים המוקדמים ביותר לזיהוי דיבור היו מערכות טלפון אוטומטיות ותוכנת תכתיב רפואי. הוא משמש לעתים קרובות לכתיבה, לשאילת מסדי נתונים ולמתן פקודות למערכות מבוססות מחשב, במיוחד במקצועות הנשענים על אוצר מילים מיוחד. זה מאפשר גם עוזרים אישיים בכלי רכב וסמארטפונים, כמו סירי של אפל.

לפני שמכונה כלשהי יכולה לפרש דיבור, מיקרופון צריך לתרגם את הרטט של קולו של אדם לאות חשמלי גל. אות זה בתורו מומר על ידי חומרת המערכת - למשל כרטיס קול של מחשב - לאות דיגיטלי. זהו האות הדיגיטלי שתוכנית זיהוי דיבור מנתחת על מנת לזהות פונמות נפרדות, אבני הבניין הבסיסיות של הדיבור. לאחר מכן משלבים את הפונמות למילים. עם זאת, מילים רבות נשמעות כאחד, וכדי לבחור את המילה המתאימה, על התוכנית להסתמך על ההקשר. תוכנות רבות מייצרות הקשר באמצעות ניתוח טריגרמה, שיטה המבוססת על בסיס נתונים של אשכולות תלת-מילים תכופים בהם מוקצות הסתברויות לכך ששתי מילים יבואו אחריה מילה שלישית נתונה. לדוגמה, אם הדובר אומר "מי אני", המילה הבאה תזהה ככינוי "אני" ולא כ"עין "הנשמעת דומה, אך פחות סבירה." עם זאת, לעיתים יש צורך בהתערבות אנושית על מנת לתקן שגיאות.

תוכניות לזיהוי כמה מילים בודדות, כמו מערכות ניווט קולי טלפוני, עובדות כמעט לכל משתמש. מצד שני, יש להכשיר תוכניות דיבור רצופות, כמו תוכניות הכתבה, להכיר את דפוסי הדיבור של האדם; ההדרכה כוללת את המשתמש בקריאה של דגימות טקסט. כיום, עם העוצמה הגוברת של מחשבים אישיים ומכשירים ניידים, דיוק זיהוי הדיבור השתפר באופן ניכר. שיעורי השגיאות הופחתו לכ -5 אחוזים באוצר המילים המכילים עשרות אלפי מילים. דיוק רב יותר מושג גם באוצר מילים מוגבל ליישומים מיוחדים כמו תכתיב לאבחנות רדיולוגיות.