██ متن فصل شانزدهم نسخه‌ی رایگان ایبوک هوش مصنوعی ██

 

مترجم: سهراب جلوه گر جلوه‌گر

 

فصل شناخت سُخَن یا سخن‌شناسی  

 

فهرست برخی از عنوان‌های نوشته‌ها

سخن‌شناسی

سخن به صورت استدلال احتمالی

مدل‌های پنهان مارکوف

 

سخن‌شناسی

 تعریف نخست: عملیّات لازم‌ برای توانمندسازی یک کامپیوتر‌ برای شناسایی و واکنش دادن به صداهای به وجود آمده در سخن انسان می‌باشد ‌.

 تعریف دوّم: سخن‌شناسی یا تشخیص صدا ‌، توانایی سیستم‌های کامپیوتری‌ برای دریافت سخن‌ به صورت ورودی‌ و پردازش بر روی آن یا بیان آن‌ به صورت نوشته می‌باشد‌.

کاربردهای عملی سخن‌شناسی‌ شامل سیستم‌های پرس‌و‌جوکننده از پایگاه داده  و سیستم‌های بازیابی اطّلاعات  می‌باشد‌. سخن‌شناسی‌ دارای کاربرد در روبوتیک و مخصوصاً توسعه‌ی روبوت‌هایی که می‌توانند «بشنوند»، می‌باشد‌. 

سخن به صورت استدلال احتمالی

سیگنال‌های سخن‌، پارازیت‌دار(اغتشاش‌دار) ‌، متغیّر و مبهم  می‌باشند‌؛ [در این صورت] شبیه‌ترین ترتیب کلمات و سیگنال سخن ارائه شده چیست‌؟‌، برای این کار‌ از قانون بیز‌ استفاده نمایید‌:

P(Words|signal) = αP(signal|Words)P(Words)

تمام سخنان انسان‌ ترکیبی از 40 تا 50 صُوْتْ  می‌باشد‌. آرْپابِتْ ، الفبایی برای بیان صداهای موجود در انگلیسی آمریکایی می‌باشد و به صورت زیر است‌:

[iy]   beat  [b]    bet    [p]    pet

[ih]   bit     [ch]  Chet  [r]     rat

[ey]  bet    [d]    debt  [s]    set

[ao]  bought      [hh]  hat    [th]   thick

[ow]  boat  [hv]  high  [dh]  that

[er]   Bert  [l]     let     [w]   wet

[ix]    roses[ng]  sing  [en]  button

 

برای مثال‌، برای کلمه‌ی «‌ceiling‌‌« داریم‌: [s iy l ih ng] / [s iy l ix ng] / [s iy l en]

صداهای سخن ‌- سیگنال خام میکروفون‌ به صورت تابعی از زمان می‌باشد‌؛ سیگنال‌های صوتی که در ابتدا به صورت آنالوگ هستند، به صورت سیگنال دیجیتالی نمونه‌برداری شده‌ی پلّه‌ای در می‌آیند، در پردازش‌، قاب‌ها‌ روی هم می‌افتند و همگی به وسیله‌ی پستی و بلندی‌اشان تشخیص داده می‌شوند‌.

 

صوت‌های سه بخشی ‌: هر صوت‌ دارای سه بخش می‌باشد(آغاز ‌، وسط ‌ و پایان ‌)‌، به عنوان مثال‌، حرف [t]‌، دارای ابتدای آرام ‌، وسط قوی   و انتهای خَشِنْ  می‌باشد‌.

مدل‌های پنهان مارکوف

به طور گسترده‌ای در تعداد زیادی از سیستم‌ها مورد استفاده قرار می‌گیرند. سیستم‌های سخن‌شناسی پیشرفته براساس مدل‌های پنهان مارکوف می‌باشند؛ مدل‌های پنهان مارکوف مدل‌هایی آماری هستند که رشته‌ای از سمبل‌ها را به وجود می‌آورند. از مدل‌های پنهان مارکوف به این دلیل در سخن‌شناسی استفاده می‌شود که، سیگنال سخن می‌تواند به صورت تکّه سیگنالی ثابت یا سیگنالی ثابت کوتاه مدّت دیده شود؛ در زمانی کوتاه، مثلاً ده میلی ثانیه، سخن می‌تواند به صورت یک پردازش ثابت تخمین زده شود. دلیل دیگری که از این مدل‌ها استفاده می‌کنیم، این است که، از نظر محاسباتی امکان‌پذیر هستند.

 

چکیده‌ی مطلب‌های فصل شانزدهم

 سخن‌شناسی‌، توانایی سیستم‌های کامپیوتری‌ برای دریافت سخن‌ به صورت ورودی‌ و پردازش بر روی آن یا بیان آن‌ به صورت نوشته می‌باشد‌.

سیستم‌های سخن‌شناسی پیشرفته براساس مدل‌های پنهان مارکوف می‌باشند؛ مدل‌های پنهان مارکوف، مدل‌هایی آماری هستند که رشته‌ای از سمبل‌ها را به وجود می‌آورند.