کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر و مخابرات (19 نوابر 2017)
بررسی انواع منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی:
چکیده :
دانش مهمترین بخش ابهام زدایی مفهوم کلمات است. این دانشها میتوانند در شکل های گوناگون و به صورت یک مجموعه از متون باشند که در آن مفهوم کلمه برچسب گزاری شده است. پایگاه دانش یک مجموعه از متن، برچسب ها و توضیحات در جهت تشخیص مفهوم کلمه است. مانند فرهنگ لغت قابل خواندن توسط ماشین، شبکه معنایی، اصطالحنامه و آنتولوژی. تقریبا از تمام این منابع در ابهام زدایی مفهوم کلمات استفاده میشود. کلیه منابع به دو دسته منابع دارای ساختار و منابع بدون ساختار تقسیم میشوند. جمله ورودی، یک متن بدون ساختار از اطالعات است. برای کسب مفهوم صحیح کلمات باید بر روی آن پیش پردازشهایی انجام شود تا بتوانیم بستری را فراهم نماییم که بتوان بهترین مفهوم را بدست آورد. در این مقاله، منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی را مورد بررسی قرار می دهیم که بر اساس بررسی های انجام شده، استفاده از وردنت پیشنهاد می شود که یک منبع ضروری برای ابهام زدایی مفهوم کلمات است و یک منبع دارای ساختار می باشد.
کلمات کلیدی: اصطالحنامه، فرهنگ لغتهای قابل خواندن توسط ماشین، آنتولوژی، وردنت، Corpora
مروری بر روشهای خالصه سازی خودکار متون:
چکیده :
امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیر خالصهسازهای خودکار و مترجمهای 1 ماشینی ، توجه زیادی را به خود جلب نمودهاند. در زبان فارسی هم مانند سایر زبانهای دیگر دنیا تالشهایی در زمینه ساخت ابزارهای خالصه سازی صورت گرفته است. تمرکز محققان بر ارایه روشهایی متمرکز است که بتواند خالصه هایی پر محتوا، سلیس و روان نسبت به روشهای خالصه سازی پیشین ارایه دهند . خالصه سازی یک مهارت نگارشی به شمار می رود، که هدف از ایجاد سیستم خالصه ساز اتوماتیک تقلید کلیه مراحلی است که توسط عامل انسانی انجام می شود، بدین صورت کهمتن به طور کامل خواندهوفهمیده شودوبا تشخیصوتفکیک قسمت های مهم وغیرمهم متن، نسخه خالصه شده متن اصلی تولید گردد. هدف از خالصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسط یک برنامه رایانهای بهنحویکهویژگیهاونکاتاصلی سند اولیه حفظشود.بنابرتعریفارائه شدهدراستاندارد 212 ISO ،خالصه "یک بازگویی مختصر از سند" می باشد. روش های تولید خالصه را با توجه به انواع دیدگاه های مختلف خالصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثال روش تولید خالصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و غیر مبتنی بر تعامل با کاربر و... لیکن با توجه به اهمیت فاکتور خروجی در تولید خالصه در این مقاله به بررسی روش های تولید خالصه گزینشی)استخراجی( و چکیده ای)مفهومی( پرداخته می شود.
واژگان کلیدی:پردازش زبان طبیعی، خالصهسازهای ماشینی، روابط کالمی ، تشابه معنایی، شبکه واژگان
ارزیابی سیستماتیک متون دانشجویان در کلاس های مجازی آنالین
چکیده :
عدم تعامالت و ارتباطات مستقیم اساتید و دانشجویان منجر به عدم تمرکز ایشان در کالس های مجازی می شود . از آنجا که ارزیابی همواره ابزار مناسبی برای ایجاد تمرکز و مشارکت دانشجویان بوده است منطقی است که به دنبال ابزاری جهت برآورد میزان مشارکت دانشجویان در کالس های آنالین باشیم . در این مقاله سعی داریم با استفاده از روش های متن کاوی ، پردازش زبان طبیعی و ترجمه ماشینی به الگوریتمی جهت ارزیابی متون وارد شده از سوی دانشجویان و تخصیص امتیاز به هر متن دست یابیم و بتوانیم پس از پایان کالس با محاسبه ، ثبت و اعالم برآورد امتیازات هر دانشجو به یک ارزیابی از میزان مشارکت مفید دانشجو در کالس های آنالین دست یابیم . واژههای کلیدی متن کاوی ، پردازش زبان طبیعی ، ترجمه ماشینی ، پایگاه داده ها
ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم
چکیده شده است. تبدیل شناسی کامپیوتر و زبان حوزهو پژوهشگران محققان اساسی های یکی از دغدغهبه های اخیر در سال ایرایانهشناسی زبان یبا سرعت و دقت قابل توجه متن راپردازش که بتوان بسیاری از کارهای مرتبط با ستا و ابزارهای هوشمند باعث شده رایانهاستفاده از های پیکره پردازد. زبان می هایابزاری برای بیان ویژگیبه عنوان ی متن یهایکرهدر حوزه متن به پردازش پ یعیانجام داد. پردازش زبان طب واعد و ساز و کار زبان پی توان با تحلیل آنها به استخراج اجزا، قمتنی در واقع نمادی از زبان هستند که با هدف خاصی تولید گردیده، می ینا یمحتوا یرا در ارائه یمناسب یپژوهش یط، محیایانهرا هاییفناور یریمتون و با بکارگ یسازیو غن یفرآور بادر مرحله بعد، برد و .نمود یجادکارآمد ا یامتون به گونه ی و زیرساختی که تحت عنوان پیکرهپیکره متنی "فرقان" ای هوشـمند گیـری از سـامانه حاصـل بهـره د گردیده، تولیقرآن کریم برای ی اطلاعات قرآنی، آماری، متن و ترجمـه فارسـی و انگلیسـی آیـات و برچسـب کلیهحاوی مگابایت داده، 587 .این پیکره با بیش از است - و بسـیاری مـوارد دیگـر در قالـب ایابی کلمات آنهمتن عربی، فارسی و انگلیسی آیات، ریشهصرفی و نحوی گذاری RDF امکـان و سـت ا .استفاده و کاوش را برای هرگونه پژوهش و پردازش هوشمند ایجاد کرده است کلید واژه پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF.
نگرشی جدید به تحلیل عبارت های اسمی هم مرجع
چکیده:
پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصه سازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نمایند. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت های اسمی هم مرجع را بررسی نماید، کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله، سعی داریم تا به طور دقیق، فرآیند تحلیل مرجع مشترک را بررسی نمائیم. در همین راستا نیز فرآیند مشابه دیگری تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ی شباهت ها و تفاوت های آنها، به نگرشی جدید در مورد تحلیل عبارت های اسمی هم مرجع برسیم.
کلمات کلیدی :پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترک ، تحلیل پیشایند
تعیین احساس از روی متن فارسی
چکیده:
در بسیاری از کاربردهای تبدیل متن به گفتار بهتر است تا مشخصات گفتار تولید شده هرچه بیشتر شبیه به انسان باشد. برای این کار باید متنی که توسط سیستم ادا میشود، از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگیهای معنایی، احساس حاکم بر متن است. در زمینه تعیین احساس از روی متن، کارهای مختلفی در زبان انگلیسی صورت گرفته است؛ اما کمتر کسی اقدام به کار بر روی پیکرههای فارسی کرده است. در این مقاله، پیکره ای شامل 3702 جمله از 6 کلاس احساس خوشحالی، عصبانیت، خنثی، ناراحتی، تنفر و ترس تهیه شده است و روشهای گوناگونی جهت تعیین احساس از روی یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و دارای حداکثر دقت 85/78 %و زمان بسیار کوتاه آموزش میباشد.
واژههای کلیدی: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیری ماشین، Bayes Naïve Complement
کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر و مخابرات (19 نوابر 2017)
بررسی انواع منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی:
چکیده :
دانش مهمترین بخش ابهام زدایی مفهوم کلمات است. این دانشها میتوانند در شکل های گوناگون و به صورت یک مجموعه از متون باشند که در آن مفهوم کلمه برچسب گزاری شده است. پایگاه دانش یک مجموعه از متن، برچسب ها و توضیحات در جهت تشخیص مفهوم کلمه است. مانند فرهنگ لغت قابل خواندن توسط ماشین، شبکه معنایی، اصطالحنامه و آنتولوژی. تقریبا از تمام این منابع در ابهام زدایی مفهوم کلمات استفاده میشود. کلیه منابع به دو دسته منابع دارای ساختار و منابع بدون ساختار تقسیم میشوند. جمله ورودی، یک متن بدون ساختار از اطالعات است. برای کسب مفهوم صحیح کلمات باید بر روی آن پیش پردازشهایی انجام شود تا بتوانیم بستری را فراهم نماییم که بتوان بهترین مفهوم را بدست آورد. در این مقاله، منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی را مورد بررسی قرار می دهیم که بر اساس بررسی های انجام شده، استفاده از وردنت پیشنهاد می شود که یک منبع ضروری برای ابهام زدایی مفهوم کلمات است و یک منبع دارای ساختار می باشد.
کلمات کلیدی: اصطالحنامه، فرهنگ لغتهای قابل خواندن توسط ماشین، آنتولوژی، وردنت، Corpora
مروری بر روشهای خالصه سازی خودکار متون:
چکیده :
امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیر خالصهسازهای خودکار و مترجمهای 1 ماشینی ، توجه زیادی را به خود جلب نمودهاند. در زبان فارسی هم مانند سایر زبانهای دیگر دنیا تالشهایی در زمینه ساخت ابزارهای خالصه سازی صورت گرفته است. تمرکز محققان بر ارایه روشهایی متمرکز است که بتواند خالصه هایی پر محتوا، سلیس و روان نسبت به روشهای خالصه سازی پیشین ارایه دهند . خالصه سازی یک مهارت نگارشی به شمار می رود، که هدف از ایجاد سیستم خالصه ساز اتوماتیک تقلید کلیه مراحلی است که توسط عامل انسانی انجام می شود، بدین صورت کهمتن به طور کامل خواندهوفهمیده شودوبا تشخیصوتفکیک قسمت های مهم وغیرمهم متن، نسخه خالصه شده متن اصلی تولید گردد. هدف از خالصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسط یک برنامه رایانهای بهنحویکهویژگیهاونکاتاصلی سند اولیه حفظشود.بنابرتعریفارائه شدهدراستاندارد 212 ISO ،خالصه "یک بازگویی مختصر از سند" می باشد. روش های تولید خالصه را با توجه به انواع دیدگاه های مختلف خالصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثال روش تولید خالصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و غیر مبتنی بر تعامل با کاربر و... لیکن با توجه به اهمیت فاکتور خروجی در تولید خالصه در این مقاله به بررسی روش های تولید خالصه گزینشی)استخراجی( و چکیده ای)مفهومی( پرداخته می شود.
واژگان کلیدی:پردازش زبان طبیعی، خالصهسازهای ماشینی، روابط کالمی ، تشابه معنایی، شبکه واژگان
ارزیابی سیستماتیک متون دانشجویان در کلاس های مجازی آنالین
چکیده :
عدم تعامالت و ارتباطات مستقیم اساتید و دانشجویان منجر به عدم تمرکز ایشان در کالس های مجازی می شود . از آنجا که ارزیابی همواره ابزار مناسبی برای ایجاد تمرکز و مشارکت دانشجویان بوده است منطقی است که به دنبال ابزاری جهت برآورد میزان مشارکت دانشجویان در کالس های آنالین باشیم . در این مقاله سعی داریم با استفاده از روش های متن کاوی ، پردازش زبان طبیعی و ترجمه ماشینی به الگوریتمی جهت ارزیابی متون وارد شده از سوی دانشجویان و تخصیص امتیاز به هر متن دست یابیم و بتوانیم پس از پایان کالس با محاسبه ، ثبت و اعالم برآورد امتیازات هر دانشجو به یک ارزیابی از میزان مشارکت مفید دانشجو در کالس های آنالین دست یابیم . واژههای کلیدی متن کاوی ، پردازش زبان طبیعی ، ترجمه ماشینی ، پایگاه داده ها
ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم
چکیده شده است. تبدیل شناسی کامپیوتر و زبان حوزهو پژوهشگران محققان اساسی های یکی از دغدغهبه های اخیر در سال ایرایانهشناسی زبان یبا سرعت و دقت قابل توجه متن راپردازش که بتوان بسیاری از کارهای مرتبط با ستا و ابزارهای هوشمند باعث شده رایانهاستفاده از های پیکره پردازد. زبان می هایابزاری برای بیان ویژگیبه عنوان ی متن یهایکرهدر حوزه متن به پردازش پ یعیانجام داد. پردازش زبان طب واعد و ساز و کار زبان پی توان با تحلیل آنها به استخراج اجزا، قمتنی در واقع نمادی از زبان هستند که با هدف خاصی تولید گردیده، می ینا یمحتوا یرا در ارائه یمناسب یپژوهش یط، محیایانهرا هاییفناور یریمتون و با بکارگ یسازیو غن یفرآور بادر مرحله بعد، برد و .نمود یجادکارآمد ا یامتون به گونه ی و زیرساختی که تحت عنوان پیکرهپیکره متنی "فرقان" ای هوشـمند گیـری از سـامانه حاصـل بهـره د گردیده، تولیقرآن کریم برای ی اطلاعات قرآنی، آماری، متن و ترجمـه فارسـی و انگلیسـی آیـات و برچسـب کلیهحاوی مگابایت داده، 587 .این پیکره با بیش از است - و بسـیاری مـوارد دیگـر در قالـب ایابی کلمات آنهمتن عربی، فارسی و انگلیسی آیات، ریشهصرفی و نحوی گذاری RDF امکـان و سـت ا .استفاده و کاوش را برای هرگونه پژوهش و پردازش هوشمند ایجاد کرده است کلید واژه پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF.
نگرشی جدید به تحلیل عبارت های اسمی هم مرجع
چکیده:
پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصه سازی متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نمایند. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت های اسمی هم مرجع را بررسی نماید، کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله، سعی داریم تا به طور دقیق، فرآیند تحلیل مرجع مشترک را بررسی نمائیم. در همین راستا نیز فرآیند مشابه دیگری تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ی شباهت ها و تفاوت های آنها، به نگرشی جدید در مورد تحلیل عبارت های اسمی هم مرجع برسیم.
کلمات کلیدی :پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترک ، تحلیل پیشایند
تعیین احساس از روی متن فارسی
چکیده:
در بسیاری از کاربردهای تبدیل متن به گفتار بهتر است تا مشخصات گفتار تولید شده هرچه بیشتر شبیه به انسان باشد. برای این کار باید متنی که توسط سیستم ادا میشود، از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگیهای معنایی، احساس حاکم بر متن است. در زمینه تعیین احساس از روی متن، کارهای مختلفی در زبان انگلیسی صورت گرفته است؛ اما کمتر کسی اقدام به کار بر روی پیکرههای فارسی کرده است. در این مقاله، پیکره ای شامل 3702 جمله از 6 کلاس احساس خوشحالی، عصبانیت، خنثی، ناراحتی، تنفر و ترس تهیه شده است و روشهای گوناگونی جهت تعیین احساس از روی یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و دارای حداکثر دقت 85/78 %و زمان بسیار کوتاه آموزش میباشد.
واژههای کلیدی: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیری ماشین، Bayes Naïve Complement