پروژه سیستم های خبره27صفحه
تبدیل حرف به صدا در زبان فارسی به کمک شبکه های عصبی پرسپترون چندلایه ای
ساخت سیستم های اتوماتیک تبدیل حرف به صدا برای استفاده در سیستم های تبدیل متن به گفتار در زبان فارسی، به دلیل عدم استفاده از اعراب در نوشتار و در نتیجه مستوربودن بعضی از واژه ها مشکل می باشد و عموماً این سیستم ها برای زبان فارسی کارآیی پایینی دارند . در این مقاله ساختار یک سیستم تبدیل حرف به صدا با معماری سه لایه بررسی شده است. لایه اول این سیستم قانون گرا می باشد و لایه دوم از پنج شبکه عصبی پرسپترون چندلایه ای و یک بخش کنترلر برای تعیین دنباله واژه های متناظر با حروف تشکیل شده است. برای تعیین دنباله واژه های متناظر با حروف، از شبکه های عصبی استفاده می شود. بخش کنترلر نیز، خروجی شبکه ها را کنترل می کند تا دنباله واژه های نهایی متناظر با کلمات با ساختار هجابندی فارسی مطابقت داشته باشد.در لایه سوم نیز یک شبکه عصبی برای تعیین حروف مشدد، با استفاده از نتایج مراحل قبل وجود دارد. اجزاء مختلف این سیستم به گونه ای طراحی شده اند که در نهایت برای هر کلمه، یک دنباله واژه منطقی تولید گردد منظور از دنباله واژه منطقی، دنباله واژه می باشد که در آن اصول بدیهی واژه نگاری و ساختار هجابندی زبان فارسی رعایت شده باشد. میزان درستی به دست آمده برای حروف 88 % و برای کلمات %61 می باشد که برای تبدیل حرف به صدای زبان فارسی کارآی بسیارخوبی می باشد.
کلید واژه: تبدیل حرف به صدا، شبکه عصبی پرسپترون چندلایه، الگوریت مترازبندی حرف صدا، زبان فارسی.
1 - مقدمه:
یکی از بخش های اصلی سیستم های تبدیل متن به گفتار، تعیین طرز خواندن کلمات یا دنباله واژه آنها می باشد. این سیستم ها عموماً از یک واژگان یا دادگان لغت برای استخراج دنباله واژه کلمات استفاده می کنند. این روش نیاز به حافظه زیادی دارد ولی به دلیل قابلیت اطمینان بالای آن نسبت به روش های دیگرترجیح داده می شود. ولی جمع آوری تمامی لغات یک زبان همچون اسامی خاص، کلمات وارداتی از زبا ن های دیگر در یک واژگان از نظر عملی غیر ممکن می باشد. بنابراین این سیستم ها در کنار واژگان، از یک سیستم تبدیل حرف به صدا برای حدس زدن دنباله واژه کلمات ناموجود در واژگان استفاده می کنند .
[ 1] البته نا م های دیگری و یا نگاشت (GPC)[1] نیز برای این سیستم همچون مبدل نویسه به واژه متن به واژه[2] 2 انتخاب شده است
پروژه سیستم های خبره