آیا ترجمه های انسانی منسوخ می شود؟

آیا ترجمه های انسانی منسوخ می شود؟ به گزارش فیکس سرور، خراسان رضوی یک تحقیقی، کیفیت ترجمه های ادبی هوش مصنوعی را در مقایسه با ترجمه های انسانی ارزیابی کرد.



به نقل از تک اکسپلور، پیشرفت های اخیر در زمینه یادگیری ماشینی(ML) کیفیت ابزارهای ترجمه خودکار را تا حد زیادی بهبود بخشیده است.

در حال حاضر ابزار کنونی اغلب برای ترجمه جملات اساسی و همینطور متون کوتاه یا اسناد غیر رسمی استفاده می شود. متون ادبی مانند رمان یا داستان کوتاه هنوز به صورت کامل توسط مترجمان انسانی متخصص ترجمه می شود که در درک معانی انتزاعی و پیچیده و ترجمه آن به زبانی دیگر مجرب هستند. در حالیکه چند تحقیق توانایی مدلهای محاسباتی را برای ترجمه متون ادبی بررسی نموده اند اما یافته ها در این حوزه هنوز محدود است.

محققان دانشگاه ماساچوست امهرست آمریکا اخیرا مطالعه ای انجام داده اند که کیفیت ترجمه های متون ادبی ساخته شده توسط ماشین ها را با مقایسه آنها با ترجمه های متنی مشابه بوجود آمده توسط انسان بررسی و بعضی از نقصهای مدلهای محاسباتی موجود برای ترجمه متون خارجی به انگلیسی را برجسته کرد.

کاترین تای و همکارانش، از پژوهشگران این تحقیق، گفتند: ترجمه ماشینی(MT) دارای ظرفیت تکمیل کار مترجمان انسانی با بهبود روش های آموزشی و کارایی کلی آن هاست. ترجمه ادبی نسبت به تنظیمات سنتی ترجمه ماشینی محدودیت کمتری دارد چونکه مترجمان باید معادل سازی معنا، خوانایی و تفسیرپذیری انتقادی را در زبان مقصد متعادل کنند. این خصوصیت همراه با زمینه پیچیده در سطح گفتمان موجود در متون ادبی، ترجمه ماشینی ادبی را برای مدل سازی و ارزیابی محاسباتی هم چالش برانگیزتر می کند.

هدف اصلی کار اخیر تای و همکارانش درک بهتر روش هایی بود که ابزارهای پیشرفته ترجمه ماشینی در مقایسه با ترجمه های انسانی هنوز در ترجمه متون ادبی شکست می خورند. امید آنان این بود که این کار به شناسایی زمینه های خاصی که توسعه دهندگان باید روی بهبود عملکرد این مدلها تمرکز کنند، کمک نماید.

تای و همکارانش توضیح دادند: ما یک مجموعه داده(PAR۳) از رمان های غیرانگلیسی زبان را در حوزه عمومی جمع آوری می نماییم که هر کدام در سطح پاراگراف با ترجمه های انسانی و خودکار انگلیسی تراز شده اند.

مجموعه داده جدیدی که توسط محققان برای دامنه تحقیق خود گردآوری شده است، شامل ۱۲۱ هزار پاراگراف استخراج شده از ۱۱۸ رمان است که در اصل به زبان های مختلف به جز انگلیسی نوشته شده اند. برای هر یک از این پاراگراف ها مجموعه داده شامل چندین ترجمه انسانی مختلف همینطور ترجمه ای است که توسط ترجمه گوگل(Google translate) تولید شد.

محققان با استفاده از معیارهای رایج برای ارزیابی ابزارهای ترجمه ماشینی، کیفیت ترجمه های انسانی این پاراگراف های ادبی را با ترجمه های مترجم گوگل مقایسه کردند. همزمان آنان از مترجمان انسانی متخصص پرسیدند که کدام ترجمه ها را ترجیح می دهند؛ در حالیکه آنان را ترغیب کردند تا مواردی را با کمترین ترجیح ترجمه خود شناسایی کنند.

تای و همکارانش اظهار کردند: با استفاده از مجموعه داده(PAR۳) متوجه شدیم که مترجمان ادبی خبره ترجمه های انسانی مرجع را به پاراگراف های ترجمه شده ماشینی به میزان ۸۴ درصد ترجیح می دهند؛ در حالیکه معیارهای پیشرفته ترجمه ماشینی خودکار با این اولویت ها مرتبط نیست. کارشناسان خاطرنشان می کنند خروجی های ترجمه ماشینی نه تنها حاوی ترجمه های نادرست بلکه خطاهای مخل گفتمان و تناقضات سبکی است.

به طور کلی یافته های جمع آوری شده توسط تای و همکارانش نشان داده است معیارهای ارزیابی ترجمه ماشینی(به عنوان مثال BLEU، BLEURT و BLONDE) امکان دارد موثر نباشد چونکه مترجمان انسانی با پیشبینی های آنها موافق نبودند.

قابل توجه اینست بازخوردی که آنان از مترجمان انسانی جمع آوری کردند، به محققان این امکان را داد که موارد خاصی را با ترجمه های بوجود آمده توسط ترجمه گوگل شناسایی کنند.

این گروه تحقیقاتی با استفاده از بازخورد متخصصان انسانی بعنوان یک راهنما در نهایت یک مدل خودکار بعد از ویرایش بر مبنای GPT-۳، یک رویکرد یادگیری عمیق که بوسیله ی یک گروه تحقیقاتی در شرکت هوش مصنوعی OpenAI عرضه شد، ایجاد کنند. آنان دریافتند که مترجمان انسانی متخصص ترجمه های ادبی ساخته شده توسط این مدل را به میزان ۶۹ درصد ترجیح می دهند.

در آینده یافته های این تحقیق می تواند به تحقیقات جدید در مورد استفاده از ابزار ترجمه ماشینی برای ترجمه متون ادبی کمک نماید.

علاوه بر این مجموعه داده PAR۳ که توسط تای و همکارانش گردآوری شده، می تواند توسط گروههای دیگر برای آموزش یا ارزیابی مدلهای زبان خود استفاده گردد.

محققان نتیجه گرفتند: به صورت کلی کار ما چالش های جدیدی را برای پیشرفت در ترجمه ماشینی ادبی آشکار می کند و ما امیدواریم که انتشار عمومی مجموعه داده PAR۳ محققان را تشویق کند تا با آنها مقابله کنند.

یافته های این تحقیق در مجله arXiv انتشار یافته است.





منبع:

1401/08/20
14:03:58
0.0 / 5
304
تگهای خبر: آموزش , پژوهش , دانش , دانشگاه
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۳ بعلاوه ۵
تعمیر سرور فیکس سرور

fixserver.ir - حقوق مادی و معنوی سایت فیكس سرور محفوظ است

فیكس سرور

سرور و هاست و دامین