پروژه سیستم خبره تصحیح خودکار املای زبان فارسی

تهران آی تی / پروژه / پروژه سیستم خبره تصحیح خودکار املای زبان فارسی
پروژه سیستم خبره تصحیح خودکار املای زبان فارسی

پروژه سیستم خبره تصحیح خودکار املای زبان فارسی

پروژه سیستم خبره تصحیح خودکار املای زبان فارسی یکی از  بهترین پروژه های سایت تهران آی تی بوده و برای اولین بار در ایران پروژه ای با مضمون تصحیح خودکار املای زبان فارسی در سیستم های خبره به نگارش در آمده است این پروژه شامل ۲۳ صفحه است که با فرمت های داکیومنت و پی دی اف برای دانلود قرار داده شده است از مزایای این پروژه میتوان به موضوع جذاب و جدید آن و همچنین فرمت داکیومنت آن اشاره کرد که به راحتی دانشجویان میتوانند آن را ویرایش کرده و مطابق نیاز خود از آن استفاده کنند و همچنین این پروژه تمامی قوانین مربوط به یک پروژه را رعایت کرده مانند فهرست ، مقدمه ، چیکیده به زبان فارسی و انگلیسی و .. از این پروژه برای درس های سیستم خبره ، هوش مصنوعی تحت عناوین پروژه سیستم خبره ، پروژه پردازش زبان های طبیعی و پروژه هوش مصنوعی میتوان استفاده کرد.

این پروژه شامل ۲۲ صفحه و دارای فرمت های داکیومنت . پی دی اف میباشد و کلیه قوانین مربوط به پروژه در آن رعایت شده است.

چکیده پروژه سیستم خبره تصحیح خودکار املای زبان فارسی

در این پروژه به ارائه یک سیستم تصحیح گر خود کار خطاهای املایی زبان فارسی پرداخته می شود. این سیستم می تواند جهت پس پردازش برای تصحیح خود کار متون حاصل از نرم افزارهای بازشناسی حروف بصری (OCR) و یا تصحیح متون نوشتاری انسانی مورد استفاده قرار گیرد. بخشهای مختلف این سیستم عبارتند از: لغت نامه زبان فارسی، الگوریتم تشخیصی خطاها و الگوریتم تصحیح کلمات خطادار که با استفاده از توابع ابتکاری بخصوصی خطاهای موجود در متن مدل شده و تصحیح می گردد.

برای تشخیص کلمات غلط از یک لغت نامه که بصورت خودکار تولید می شود، استفاده شده و پس از آن، مناسب ترین کلمه صحیح انتخاب می گردد. در انتخاب مناسب ترین کلمه صحیح از توابع ابتکاری مختلفی استفاده می گردد که بر حسب آنکه متن ورودی، تایپی یا حاصل از خروجی نرم افزار بازشناسی حروف بصری باشد، تعریف شده اند. آزمایشات مختلف در این پژوهش نشان داده است که با استفاده از لغتنامه ی دقیق از کلمات زبان فارسی در دامنه متون مورد بحت می توان به نتایج قابل توجهی در تصحیح خطاهای متنی دست یافت.

مقدمه پروژه سیستم خبره تصحیح خودکار املای زبان فارسی

با رشد سریع و روزافزون صنعت و تکنولوژی اطلاعات، روزانه حجم زیادی از نوشتارهای الکترونیکی چون روزنامه ها، نامه ها، وب نگاشتها، سایتهای اینترنتی، کتاب ها، و پایان نامه ها تولید می گردد. با وجود آنکه تهیه مستندات الکترونیکی مزایای قابل توجه ای چون تسهیل سازماندهی و مدیریت داده ها را در پی دارد، ولی هزینه تولید چنین مستنداتی قابل توجه است. تولید این مستندات قابل پردازشی، چه از طریق تایپ اطلاعات و چه از طریق استفاده از نرم افزارهای بازشناسی حروف بصری صورت گیرد، به نیروی انسانی جهت تصحیح اطلاعات نیازمند است. از اینرو وجود سیستم های خبره جهت تصحیح خودکار خطاهای موجود در مستندات می تواند در جهت کاهش هزینه و بالا بردن سرعت تولید مستندات الکترونیکی بسیار سودمند باشند.

از جمله کاربردهای چنین سیستمی می توان به رفع خطاهای باقیمانده از سیستمهای تشخیص حروف بصری ، آسان سازی و تسریع ویرایش الکترونیکی در محیطهای مختلف مانند ویرایشگرهای نامه نگاری الکترونیکی، پیرایش جملات ورودی کاربران در سیستمهای خودکار پردازش جملات زبان مانند مترجم های ماشینی، سیستم های پرسش و پاسخ، کمک به کاربرانی که به زبان مورد نوشتار تسلط کاملی ندارند و پیشنهاد کلمات مشابه در دیکشنری ها اشاره کرد .

تحقیقات در زمینه کاربردهای بازیابی اطلاعات از مستندات نشان داده است که واقعا نیازی به دقت کامل و ۱۰۰٪ در مستندات در اینگونه فعالیتها نیست و اصلاح خود کار خطاها بطوریکه دقت را به حد قابل قبولی برساند نیز می تواند بسیار مفید باشد. بنابراین ایجاد سیستمهای خود کار می تواند در کاهش هزینه تولید مستندات مورد نیاز کاربردهای مذکور، تاثیر فراوانی داشته باشد. تصحیح خود کار متون نوشتاری و متون حاصل از بازشناسی حروف بصری مورد توجه بسیاری از محققین قرار گرفته شده است و این حوزه برای زبان انگلیسی پیشرفت قابل توجهی داشته است. سیستم های پیشرفته ای مانند SMART و INQUERY سیستمهایی هستند که با استفاده از مدلهای آماری و با توجه به میزان تکرار کلمات بطور هوشمند امکان تشخیصی خطا و انتخاب گزینه های درست را دارند .

همچنین علاوه بر فعالیتهای پژوهشی، محصولات متعدد تجاری نیز در زبانهای مختلف یافت می شود. در زبان فارسی نیز فعالیتهای مختلفی بصورت تجاری صورت گرفته است که از این بین می توان به فعالیتهای بنیاد پژوهشی رباتیک و هوش مصنوعی سپنتا و نامه نگار محصول شرکت گام الکترونیک نام برد. فعالیت یک سیستم خبره تصحیح متون به سه قسمت اصلی بررسی مستند ورودی، تشخیصی خطاهای احتمالی و اصلاح خطاهای موجود تقسیم میگردد. اغلب روشهای موجود در تصحیح خود کار با توجه به مدلهای احتمالاتی و استفاده از یک سیستم مبتنی بر دانش بنا شده اند.

عموما سیستم های خبره تصحیح خودکار پس از تشخیص کلمه خطادار، در صورتیکه قابلیت انتخاب دقیق خروجی را داشته باشد، بطور کاملا خودکار آن را با کلمه صحیح جایگزین می کند. در غیر اینصورت لیستی از پیشنهادات برای انتخاب به کاربر معرفی می شود که در این حالت بیشتر برای آن دسته از کاربرانی مفید خواهد بود که به زبان مورد نوشتار تسلط کافی ندارند. میزان شباهت برای این سیستمها اغلب به عنوان فاصله دو کلمه از یکدیگر معرفی می گردد که با روشهای مختلفی قابل محاسبه است. به عبارت دیگر هر میزان فاصله دو کلمه از یکدیگر کمتر باشد، احتمال اینکه دو کلمه جایگزین همدیگر شده باشند، بیشتر خواهد بود. از طرف دیگر تصحیح متون به نحوه تولید آن متون کاملا وابسته است.

متونی که توسط کاربر انسانی تایپ شده است، عموما دارای مشکلاتی متفاوت از متونی است که توسط سیستمهای بازشناسی حروف بصری ایجاد شده است. علاوه بر این، با توجه به پیچیدگی خط الرسلام زبان فارسی نسبت به انگلیسی، تصحیح متون فارسی از پیچیدگیهای بیشتری نسبت به انگلیسی برخوردار است.

اکثر سیستم های خبره تصحیح خودکار، تشخیصی کلمات غلط را بر اساسی یک لغتنامه حجیم شامل کلمات متداول زبان انجام میدهند. در این لغتنامه تمام ریشه ها و مشتقات آنها که از نظر زبان مرسوم و درست است وجود دارد. با اینحال برخی دیگر از سیستمها برای تشخیص کلمات غلط از لغتنامه ای کوچک و در کنار آن از مجموعه قواعد ساختواژی زبان استفاده می کنند.

بدین ترتیب برای تعیین درستی کلمه ورودی، در صورت عدم وجود در لغتنامه، آن را مورد تحلیل ساختاری قرار میدهند. در ادامه این مقاله معماری و الگوریتم های مورد استفاده در سیستم خبره تصحیح خود کار متون پیشنهادی توضیح داده می شود و سپس نتایج ارزیابی آن را روی داده های متفاوت بیان می گردد.

توجه : مهم ترین مباحثی که در این پروژه مورد بحث قرار گرفته اند عبارتند از : چکیده فارسی ، چکیده انگلیسی ، مقدمه ، سیستم خبره تصحیح خودکار ، تشخیص و تصحیح خطاها ، استفاده از کلمات همسایه ، نتیجه گیری ، منابع و رفرنس ها و ..

فیلم آموزش پروژه سیستم خبره به زبان فارسی

این فیلم درباره معرفی پروژه بوده و بعضی از قسمت های پروژه را مانند فهرست و چکیده پروژه را در قالب فیلم به نمایش در می آورد و صرفا جهت آشنایی کاربران با پروژه را دارد .لطفا این فیلم را مشاهده کنید

لطفا از فیلم مربوط به پروژه سیستم خبره تصحیح خودکار املای زبان فارسی دیدن فرمایید
راهنمای خرید

خرید از تهران آی تی به صورت آنلاین بوده لینک دانلود به صورت خودکار برای شما ایمیل میشود بدیهی است که در هنگام خرید باید از ایمیل واقعی خود استفاده کنید. چنانچه نیاز به هرگونه سوال درباره محصول و یا مشاوره و کمک در خرید آنلاین داشتید از طریق ایمیل و یا شماره های تماس ارتباط برقرار کنید 09121486770 ahadian2@gmail.com

جستجو کنید

طراحی و پیاده سازی پروژه های طراحی سایت دانشجویی

انجام، اجرا و طراحی پروژه های طراحی سایت برای دانشجویان با HTML CSS PHP ASP.NET JAVA و ... با کمترین هزینه. برای مشاهده نمونه کارها و یا دریافت مشاوره رایگان از تیم طراحی سایت تهران آی تی با ما در تماس باشید. ما بهترین پروژه های طراحی سایت را با حداقل هزینه برای شما طراحی میکنیم - مشاوره رایگان 09121486770

مــشاوره و مشاهده نمونه کارها

مطالب مرتبط

لطفا از مطالب مرتبط با این پست دیدن فرمایید

دوره رایگان بنفش ASP.NET MVC

کامل ترین و بهترین دوره رایگان Asp.Net MVC 5 شامل 44 قسمت - ASP.NET یک فریمورک وب رایگان برای ساخت وب سایت ها و برنامه های کاربردی وب بر روی دات نت فریم ورک با استفاده از HTML ، CSS و جاوا اسکریپت است. از این رو تیم تحقیقاتی تهران آی تی به این نتیجه رسید که دوره رایگان و کاربردی در خصوص ASP.NET MVC 5 منتشر کند. این دوره آموزشی رایگان با عشق و علاقه برای شما پژوهندگان علم تولید شده است.

ورود به دوره رایگان بنفش ASP.NET MVC

جــذاب های هفته

از پربازدیدترین مطالب تهران آی تی در هفته ای که گذشت دیدن فرمایید

باورکردنی نیست فقط با 300 هزار تومان

طراحی سایت شما + طراحی اپلیکیشن هدیه و رایگان
این یک حراج است در مدت زمان محدود - شرکت های زیادی سایت های ارزان طراحی میکنند اما آیا کیفیت لازم را دارا هستند؟ طراحی سایت ارزان به همراه اپلیکیشن رایگان هدیه برای اولین بار توسط تهران آی تی مخصوص سازمان ها و کسب و کار های کوچک و بزرگ و حتی جدید تیم طراحی سایت تهران آی تی در کنار شماست تا شناخته شوید - مشاوره رایگان 09121486770

مــشاوره و مشاهده نمونه کارها

پشتیبانی 24 ساعته

تیم تهران آی تی در هفت روز هفته و 24 ساعت روز آماده پاسخ گویی به سوالات کاربران و ارائه مشاره رایگان میباشد