مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی

تهران آی تی / مقاله / سیستم خبره / مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی
مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی

مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی

مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی ،  یکی از مقالات برتر در حوزه سیستم خبره میباشد که فایل اصلی آن ۲۸ صفحه بوده و فایل ترجمه آن به فارسی ۳۲ صفحه میباشد از مزایای این مقاله میتوان به دارا بودن دیتاست جهت دانشجویانی که قصد پیاده سازی این مقاله را دارند اشاره کرد.

عنوان مقاله به فارسی : یک معیار جدید اندازه گیری فاصله رشته ای در رتبه بندی پیشنهادات هجی کردن (درست نویسی) مجدد فارسی | عنوان مقاله به انگلیسی : A novel string distance metric for ranking Persian respelling suggestions | تعداد صفحات مقاله اصلی : ۲۸ | تعداد صفحات مقاله ترجمه : ۳۲ | فرمت : word , pdf , doc | قابلیت ویرایش : دارد

توجه : این مقاله در سال ۲۰۱۳ در ISI منتشر شده است و دارای فایل ترجمه با فرمت ورد میباشد.

چکیده

خطاهای هجّی کردن در اسناد دیجیتال اغلب ناشی از اشتباهات عملیاتی و شناختی ، یا محصول فقدان دانش کامل درباره زبان اسناد مکتوب می باشند. راه حلهایی با کمک کامپیوتر قادر به کشف و پیشنهاد جایگزینها می باشند. در این مقاله، ما یک معیار اندازه گیری برای فاصله رشته ای را در زبان فارسی به منظور رتبه بندی پیشنهادات مربوط به هجی کردن مجدد واژگان فارسی که غلط هجی شده اند را با در نظر گرفتن تاثیرات طرح بندی صفحه کلید روی خطاهای چاپی هجا کردن بعلاوه خصوصیات هم آوایی و تشابه خطاهای هجی کردن مربوط به املا معرفی می کنیم. همچنین خطاهای هجی کردن ناشی از تفکیک نادیده گرفته شده را نیز در نظر می گیریم. از آنجایی که معیار اندازه گیری پیشنهاد شده برای فاصله رشته ای خاص زبان فارسی طراحی شده است ، ما ویژگیهای هجی کردن زبان فارسی همچون واژگان متشابه، هم آواها، و تفکیک کننده ها را نشان می دهیم. پس از آن تحلیل آماری از مجموعه ای از ساختار بزرگ فارسی را برای شناسایی دلایل و انواع خطاهای هجی کردن زبان فارسی ارائه می کنیم. ما نشان می دهیم که معیار اندازه گیری فاصله رشته ای میانگین دقتی بالاتر و رتبه میانگین معکوس بالاتری در میان نمایندگان رتبه بندی هجی کردن مجدد غلطهای هجی کردن زبان فارسی در مقایسه با دیگر معیارهای اندازه گیری چون هامینگ (Hamming)، لونشتاین (Levenshtein)، دامرو – لونشتاین (Damerau–Levenshtein)، واگنر – فیشر (Wagner–Fischer)، و جارو – وینکلر دارد. حروف متشابه حروفی هستند که تلفظ یکسانی دارند و حروف هم آوا حروفی هستند که حقیقتا یکسان نیستند اما آن اندازه شبیه هستند که اشتباه گرفته شوند. ما برتری سیستم اندازه گیری فاصله رشته ای پیشنهادی خودمان را در غلطهای املایی فارسی با دیگر سیستمهای اندازه گیری فاصله رشته ای قابل توجه مقایسه کردیم. مابقی این مقاله به این ترتیب سازماندهی می شود. بخش ۲ مرتبط ترین اقدامات در زمینه بررسی هجا و سیستمهای اندازه گیری فاصله رشته ای را ارائه می کند. بخش ۳ مروری بر ویژگیهای زبان فارسی دارد. بخش ۴ الگوهای غلطهای هجی کردن مشتق از تحلیل ما از ساختار عظیم زبان فارسی را مطرح می کند. بخش ۵ سیستم اندازه گیری فاصله رشته ای پیشنهادی ما را تشریح می کند. بخش ۶ ارزیابی سیستم اندازه گیری فاصله رشته ای را ارائه می کند و بخش ۷ نتیجه گیری مقاله است.

توجه : این مقاله دارای فایل دیتاست آماده جهت پیاده سازی مقاله میباشد

مقدمه

خطا در هجی کلمات غیرقابل اجتناب است و به همین علت است که محققان روی غلطهای املایی در مضامینی مختلف در سطوحی گسترده مطالعه می کنند. غلطهای املایی را می توان به غلطهای املایی چاپی و املایی تقسیم کرد، یا به روشی دیگر آنها را به غلط املایی مرسوم یا پایدار تقسیم نمود. غلط املایی پایدار واژگان زمانی رخ می دهد که نویسنده هجای صحیح را نمی داند، درباره جایگزینهای محتمل واژه اطمینان ندارد، یا قانع شده است که املای صحیح واژه یک غلط املایی است. بالعکس، غلطهای املایی مرسوم واژگان زمانی رخ می دهد که نویسنده املای صحیح واژگان را می داند اما از روی عجله یا بی توجهی آنها را غلط می نویسد.

از سوی دیگر، خطاهای املایی، محصول خطاهای فرایند شناختی هستند زمانی که نویسنده املای صحیح کلمات را نمی داند. غلطهای املایی ممکن است بخشی (برحسب اصوات) که از لحاظ صداشناسی برابر هستند یا بسیار مشابه با هجای صحیح همانند استفاده از مخصوص بجای بخصوصهستند، ، یا غیر بخشی ، همچون تناوب بجای متناوبا باشد. برخلاف خطاهای املایی، خطاهای چاپی خطاهای حرکتی باشند که در حین تایپ رخ می دهند. برای مثال، یک حرف ممکن است اشتباها از کلمه ای حذف یا به کلمه ای وارد شود.

توجه : این مقاله با فرمت word و pdf میباشد و قابلیت ویرایش دارد

فاصله لونشتاین Levenshtein

فاصله لونشتاین بین دو رشته حداقل تعداد عملیاتهای مورد نیاز برای تبدیل یک رشته به رشته ای دیگر ، در جایی است که که عملیات یک الحاق، حذف یا جانشینی یک حرف واحد است. فاصله لونشتاین را می توان برای واژگانی که طول مختلف دارند استفاده کرد که یا از طریق الحاق یا حذف یک یا چند حرف ایجاد می شوند. برای مثال، فاصله لونشتاین بین زبان و زیان ۲ می باشد (یعنی ۱ حذف برای حرف «ب» و ۱ الحاق برای حرف «ی»). همانطوری که در الگوریتم ۱ می بینم، عملکرد fl (i, j) در ابتدا برای تمامی i ها و j ها صفر تنظیم می شود و پس از آن fl (i, j) برای تمامی حروف مورد بررسی محاسبه می شود (واژه مورد بررسی با q نشان داده می شود و حروف مورد بررسی با qi نشان داده می شوند) و کل حروف واژه لکیسکون (واژه لکسیکون با l نشان داده می شود و حروف واژه لکسیکون با lj نشان داده می شوند). فاصله لونشتاین بین q و l به شکل تکراری بوسیله حروف قابل مقایسه q و l محاسبه می شود، که هر الحاق، حذف یا جانشینی نمره ای معادل ۱ دریافت می کند که منتج به fl (|q|, |l|) می گردد که همان فاصله لونشتاین بین q و l می باشد.

تصاویر مقاله سیستم خبره ISI همراه با ترجمه و دیتاست درست نویسی فارسی

راهنمای خرید

خرید از تهران آی تی به صورت آنلاین بوده لینک دانلود به صورت خودکار برای شما ایمیل میشود بدیهی است که در هنگام خرید باید از ایمیل واقعی خود استفاده کنید. چنانچه نیاز به هرگونه سوال درباره محصول و یا مشاوره و کمک در خرید آنلاین داشتید از طریق ایمیل و یا شماره های تماس ارتباط برقرار کنید 09121486770 ahadian2@gmail.com

جستجو کنید

طراحی و پیاده سازی پروژه های طراحی سایت دانشجویی

انجام، اجرا و طراحی پروژه های طراحی سایت برای دانشجویان با HTML CSS PHP ASP.NET JAVA و ... با کمترین هزینه. برای مشاهده نمونه کارها و یا دریافت مشاوره رایگان از تیم طراحی سایت تهران آی تی با ما در تماس باشید. ما بهترین پروژه های طراحی سایت را با حداقل هزینه برای شما طراحی میکنیم - مشاوره رایگان 09121486770

مــشاوره و مشاهده نمونه کارها

مطالب مرتبط

لطفا از مطالب مرتبط با این پست دیدن فرمایید

دوره رایگان بنفش ASP.NET MVC

کامل ترین و بهترین دوره رایگان Asp.Net MVC 5 شامل 44 قسمت - ASP.NET یک فریمورک وب رایگان برای ساخت وب سایت ها و برنامه های کاربردی وب بر روی دات نت فریم ورک با استفاده از HTML ، CSS و جاوا اسکریپت است. از این رو تیم تحقیقاتی تهران آی تی به این نتیجه رسید که دوره رایگان و کاربردی در خصوص ASP.NET MVC 5 منتشر کند. این دوره آموزشی رایگان با عشق و علاقه برای شما پژوهندگان علم تولید شده است.

ورود به دوره رایگان بنفش ASP.NET MVC

جــذاب های هفته

از پربازدیدترین مطالب تهران آی تی در هفته ای که گذشت دیدن فرمایید

باورکردنی نیست فقط با 300 هزار تومان

طراحی سایت شما + طراحی اپلیکیشن هدیه و رایگان
این یک حراج است در مدت زمان محدود - شرکت های زیادی سایت های ارزان طراحی میکنند اما آیا کیفیت لازم را دارا هستند؟ طراحی سایت ارزان به همراه اپلیکیشن رایگان هدیه برای اولین بار توسط تهران آی تی مخصوص سازمان ها و کسب و کار های کوچک و بزرگ و حتی جدید تیم طراحی سایت تهران آی تی در کنار شماست تا شناخته شوید - مشاوره رایگان 09121486770

مــشاوره و مشاهده نمونه کارها

پشتیبانی 24 ساعته

تیم تهران آی تی در هفت روز هفته و 24 ساعت روز آماده پاسخ گویی به سوالات کاربران و ارائه مشاره رایگان میباشد