ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)

 ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)


 

1-شناسایی و تحلیل واژگان عمومی در منابع وب: رویکردی نو به بسط عبارات جستوجو با استفاده از زبان طبیعی در موتورهای کاوش (همایش انجمن کتابداری و اطلاع رسانی ایران)

چکیده: بازیابی اطلاعات دقیق و مرتبط همواره از اهمیت ویژه ای در پژوهش های حوزه بازیابی اطلاعات برخوردار بوده است. مقاله حاضر رویکردی جدید را در این زمینه معرفی و تجربه کرده است. بسط جستجو با استفاده از واژه های عمومی که همراه کلیدواژه های موضوعی در منابع و متون موجود در وب ظاهر میشوند می تواند موجب افزایش میزان دقت  و ربط د رنتایج بازیابی در موتور های کاوش شود. به این منظور پژوهشی در دو مرحله انجام گرفت. در مرحله نخست، تعداد 800 صفحه وب با استفاده از روش تحلیل محتوا مورد بررسی قرار گرفت و واژه های عمومی همراه هر کلید وازه موضوعی شناسایی شد (جمعا 4264 مورد). نتایج تحلیل آماری نشان داد که 14.5 % از واژه های عمومی میان دو حوزه مشترک هستند، یعنی عمومی مطلق به شمار می آیند، 85.5 % واژه های عمومی وابسته به وزه عمومی می باشند. 65 % واژه های عمومی پیش و 35% از آنها پس از کلیدوازه های موضوعی در متون ظاهر می شوند. همچین از نظر نوع واژه ها 62.4 % غیر موضوعی 37.6% نیمه موضوعی به شمار می آید.

کلید واژه ها: بسط جستوجو، بازیابی اطلاعات در وب، زبان جستوجو، واژگان عمومی، موتور های کاوش

 

2-تعیین احساس از روی متن فارسی

چکیده: در بسیاری از کاربرد های تبدیل متن به گفتار بیهتر است تا مشخصات گفتار تولید شده هر چه بیشتر شبیه انسان باشد.برای این کار باید متنی که توسط سیستم ادا میشود. از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگی های معنایی احساس حاکم بر متن است. در زمینه تعیین احساس از روی متن کار های مختلفی در زبان انگلیسی صورت گرفته است. اما کمتر کسی اقدام به کار بر روی پیکره های فارسی کرده است. در این مقاله پیکره ای شامل 3702 جملخ از 6 کلاس احساس خوشحالیف عصبانیت، خنثی، ناراحتی، تنفر و ترس تهییه شده است. و روش های گوناگونی جهت تعیین احساس از روی یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و دارای حداکثر دقت 78/85% و زمان بسیار کوتاه آموزش می باشد.

کلید واژه ها: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیری ماشین، complement naive bayes

 

3-نگرشی جدید به تحلیل عبارت های اسمی هم مرجع

چکیده: پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات ، خلاصه سازی متن، پرشس و پاسخ می باشد که  همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نماید. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت های اسمی هم مرجع را بررسی نماید . کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله سعی داریم تا به طور دقیق فرایند تحلیل مرجع مشترک را بررسی نماییم. در همین راستا نیز فرآیند مشابه دیگری تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ی شباهت ها و تفاوت ها ی آنها، به نگرشی جدید در مورد تحلیل عبارت های اسمی هم مرجع برسیم.

کلمات کلیدی: پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترک، تحلیل پیشایند

 

4- ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم

چکیده: زبان شناسی رایانه ای در سال های اخیر به یکی از دقدقه های اساسی محققان و پژوهشگران حوزه کامپیوتر و زبان شناسی تبدیل شده است. استفاده از رایانه و ابزار های هوشمند باعث شده است که بتوان بسیاری از کارهای مرتبط با پردازش متن را با سرعت بالا و دقت قابل توجهی انجام داد. پردازش زبان طبیعی در حوزه متن به پردازش پیکره های متنی در واقع نمادی از زبان هستند که با هدف خاصی تولید گردیده است می توان با تحلیل آنها به استخراج اجزا قواعد و ساز و کار زبان پی برد و در مرحله بعد با فناوری و غنی سازی متون  و یا بکار گیری فناوری های رایانه ای محیط پژوهشی مناسبی را در ارائه محتوای این متون به گونه ای کارآمد ایجاد نمود.

 

کلید وازه ها: پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF

 

5-بررسی روشهای متن کاوی درحوزه یادگیری الکترونیکی به منظور ارائه مدلی جهت استخراج اطلاعات

چکیده:متن کاوی آشکار کردن اطلاعات پنهان با استفاده از روشی است که در یک طرف توانایی مقابله با تعداد زیادی کلمات و ساختارهایی در زبان طبیعی را نشان می دهد و از طرف دیگر اجازه مدیرت ابهام و شک را میدهد. متن کاوی حوزهی مهم در پژوهش است که کشف طلاعات ناشناخته را،بهوسیله استخراج خودکار طلاعات از منابع مختلف متنی ممکن میسازد. مقدار بسیارزیاد اطلاعاتی که درمتونبهصورت ساختن یافته ذخیره شدهاست، برای امکان پردازش به وسیله متن کاوی، به صورت دنباله های سادهی رشتهای تبدیل میشوند.بنابراین،روشهاوالگوریتم های به خصوصی برای پردازش واستخراج الگوهای مفیدمورد نیاز است. علاوه بر این، متن کاوی عموماً به استخراج اطلاعات و دانش مورد نظر از متون ساخت نایافته میپردازد. روش تحقیق در اینکار بدین صورت است که ابتدا به بررسی پژوهش های انجام شده در حوزه متن کاوی با تأکید بر روش ها و کاربردهای آن در آموزش الکترونیکی پرداخته شد. درطی این مطالعات، پژوهش های مرتبط در حوزه آموزش الکترونیکی طبقه بندی گردیدند. پس از طبقه بندی پژوهش ها، مسائل و راهکارهای مرتبط با مسائل مطرح شده در آن کارها، استخراجشدند. در همین راستا، در این مقاله ابتدا به تعریف متنکاوی پرداخته می شود . سپس فرایند متن کاوی و حوزه های کاربرد متن کاوی در آموزش الکترونیکی مورد بررسی قرار میگیرند. در ادامه روشهای متنکاوی معرفی شده، و تک تک این روشها در حوزه آموزش الکترونیکی مطرح میگردد. در انتها ضمن استنتاج نکات مهم مطالعات انجام شده، مدلی جهت استخراج اطلاعات برای بهره برداری از روش های متن کاوی در یادگیری الکترونیکی پیشنهاد میشود. 6-ارزیابی سیستماتیک متون دانشجویان در کلاس های مجازی آنلاینچکیده: عدم تعاملات و ارتباط مستقیم اساتید و دانشجویان منجر به عدم تمرکز ایشان در کلاس های مجازی می شود .از آنجا که ارزیابی همواره ابزار مناسبی برای ایجاد تمرکز و مشارکت دانشجویان بوده است منطقی است که به دنبال ابزاری جهت برآورد میزان مشارکت دانشجویان در کلاس های آنلاینباشیم. در این مقاله سعی داریم با استفاده از روش های متن کاوی ، پردازش زبان طبیعی و ترجمه ماشینی به الگوریتمی جهت ارزیابی متون وارد شده از سوی دانشجویان و تخصیص امتیاز به هر متن دست یابیم و بتوانیم پس از پایان کلاس با محاسبه، ثبت و اعلام برآورد امتیازات هر دانشجو به یک ارزیابی از میزان مشارکت مفید دانشجو درکلاس های آنلاین دست یابیم. 7-مروری بر روش های خلاصه سازی خودکار متون چکیده : امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیرخلاصه سازهای خودکار ومترجم های ماشینی1،توجه زیادی را به خود جلب نموده اند .در زبان فارسی هم مانند سایرزبانهای دیگر دنیا تلاش هایی در زمینه ساخت ابزارهای خلاصه سازی صورت گرفته است .تمرکز محققان بر ارایه روشهایی متمرکز است که بتواند خلاصه هایی پر محتوا، سلیس و روان نسبت به روشهای خلاصه سازی پیشین ارایهدهند. خلاصه سازی یک مهارت نگارشی به شمار میرود، که هدف از ایجاد سیستم خلاصه سازاتوماتیک تقلید کلیه مراحل است.که توسط عامل انسانی انجام میشود، بدین صورت که متن به طور کامل خوانده و فهمیده شود و با تشخیص و تفکیک قسمتپ های مهم و غیرمهم متن، نسخه خلاصه شده متن اصلی تولید گردد .هدف از خلاصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسطیکبرنامهرایانه ای به نحوی که ویژگی ها و نکات اصلی سند اولیه حفظ شود . بنابر تعریف ارائه شده در استاندارد 212 ISO  خلاصه " یک بازگویی مختصر از سند " می باشد . روش های تولید خلاصه را با توجه به  انواع دیدگاه های مختلف خلاصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثال روش تولید خلاصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و  غیر مبتنی برتعامل با کاربر...یکن با توجه به اهمیت فاکتور خروجی تولید خلاصه در این مقاله به بررسی روش های تولید خلاصه گزینشی ( استخراجی )و چکیده ای (مفهومی) پرداخته می شود.  8-بررسی انواع منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی چکیده: دانش مهمترین بخش ابهام زدایی مفهوم کلمات است. این دانش ها می توانند در شکل های گوناگون و به صورت یک مجموعهاز متون باشند که در آن مفهوم کلمه برچسب گزاری شده است. پایگاه دانش یک مجموعه از متن، برچسب ها و توضیحات در جهت تشخیص مفهوم کلمه است. مانند فرهنگ لغت قابل خواندن توسط ماشین ، شبکه معنایی، اصطلاحنامه و آنتولوژی. تقریبا از تمام این منابع در ابهام زدایی مفهوم کلمات استفاده می شود. کلیه منابع به دو دسته منابع دارای ساختار و منابع بدون ساختار تقسیم می شوند. جمله ورودی، یک متن بدون ساختار از اطلاعات است. برای کسب مفهوم صحیح کلمات باید بر روی آن پیش پردازش های ی انجام شود تا بتوانیم بستری را فراهم نماییم که بتوان بهترین مفهوم را بدست آورد. در این مقاله،منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان ط بیعی را مورد بررسی قرار می دهیم که بر اساس بررسی های انجام شده، استفاده از وردنت پیشنهاد می شود که یک منبع ضروری برای ابهام زدایی مفهوم کلمات است و یک منبع دارای ساختار می باشد. کلمات کلیدی:اصطلاحنامه، فرهنگ لغت های قابل خواندن توسط ماشین، آنتولوژی، وردنت، Corpora 9-مروری برجدیدترین تکنیک های جست وجوی معنایی در قرآنچکیده: در دنیای اطلاعاتی امروز جست و جوی معنایی در قرآن، به عنوان یکی از غنی ترین پیکره های متنی از اهمیت ویژه ای برخودار است. این کتاب مقدس، راهنمای مسلمانان در حوزه های مختلف دانش مانند: طبیعت ، شریعت ، تاریخ می باشد. با توجه به سبک منحصر به فرد قرآن و پراکندگی موضوعات و به سبب آن پراکندگی مفاهیم، نیاز مند توجهی خاص جهت جست و جو ی مفاهیم و معانی در آیات آن است. امروزه مطالعات بسیاری در زمینه ی ایجاد ساختاری مناسب جهت بازیابی آیات قرآن و تسهیل کاربران در جست و جو ی معنایی در آن انجام شده است . از جمله تکنیک های جست و جو ی معنایی که در حوزه ی قرآن استفاده شده است، آنتولوژی، شبکه ی واژگان و متدهای بازیابی اطلاعات بین زبانی می باشند . هدف این مقاله بررسی تحقیقات انجام شده در این حوزه است . در این راستا ابتدا تکنیک های نامبرده شرح داده می شو ن د سپس پژوهش هایی که این متدها را ه کار بسته اند معرفی می گرد ن د و در نهایت مقایسه ای بین کارهای انجام شده ارائه خواهد شد. کلمات کلیدی: آنتولوژی، جست وجوی معنایی، گروه مترادف ها، بازیابی اطلاعات بین زبانی

خرید و دانلود  ده مقاله فارسی درباره پردازش زبان طبیعی (water mark)