چکیده
برای دههها، تأثیرگذاری مجلات علمی منطقهای- از جمله تلاشهای راهبردی مجلات ایرانی در حوزه سلامت- توسط یک گلوگاه بازدارنده محدود شده است: حکمرانی زبان انگلیسی. این فرضیه که فناوری سرانجام این انحصار زبانی را در هم خواهد شکست،۱ اکنون با پیشرفتهای پرشتاب هوش مصنوعی مولد در حال تحقق است. اگرچه آمار نشان میدهد که همچنان بیش از ۹۰ درصد مجلات علمی برتر جهان به زبان انگلیسی منتشر میشوند،۲ اما این کمیت دیگر لزوماً به معنای حکمرانی مطلق در آینده نیست. اکنون پرسش کلیدی این است: در عصری که ماشین معنا را میفهمد، آیا همچنان باید تفکر علمی را در قالب گرامر زبان دوم حبس کنیم؟متون علمی غیرانگلیسیزبان سالهاست با قفسی نامرئی دستوپنجه نرم میکنند: نابرابری در دیده شدن. مقالات انگلیسیزبان استناد بیشتری نسبت به متون غیرانگلیسی دریافت میکنند،۲ و این نابرابری نهتنها در استنادات، بلکه در شاخصهای همرسانی در شبکههای اجتماعی (Altmetrics) نیز مشهود است؛ مقالات انگلیسی بیشتر دیده و نقل میشوند.۳ این یعنی دیده شدن مطلب علمی میتواند قربانی زبان آن شود. اما اکنون ورق در حال برگشتن است. بررسیها نشان میدهند که ابزارهای نوین ترجمه مبتنی بر هوش مصنوعی، متون علمی را با دقتی بیش از ۹۵ درصد به هر زبانی بازآفرینی میکنند.۴ برای یک مدل هوش مصنوعی، توصیف دقیق، موشکافانه و عمیق یک پدیده بهزبان فارسی شیوا، دادهای بسیار ارزشمندتر از توصیف همان پدیده با یک انگلیسی دستوپاشکسته است که در آن ظرافتهای علمی، قربانی محدودیت واژگان پدیدآورنده شده است.با این حال، فروپاشی دیوار زبان به معنای هموار شدن کامل مسیر نیست. اکنون چالش از زبان محتوا به دسترسپذیری ساختار محتوا تغییر ماهیت داده است. حتی با فرض اینکه هوش مصنوعی بتواند مرزهای زبانی را برای مقالات فارسی از میان بردارد، این اتفاق تنها زمانی رخ میدهد که ماشین بتواند آن مقاله را بخواند. متأسفانه بخش بزرگی از دانش بومی ما در قالب منجمد PDF حبس شده است؛ قالبی که برای چاپگرها و چشم انسان طراحی شده، نه برای الگوریتمها. در مقابل، ناشران پیشرو در سطح جهان سالهاست از استانداردهای خوانا برای ماشین نظیر HTML و XML بهره میبرند. قالب XML دادهها را ساختاریافته کرده و برای هوش مصنوعی قابل کاوش میسازد. تنها با چنین ساختاری است که موتورهای جستجوی علمی نوین مبتنی بر هوش مصنوعی (نظیر Consensus یا Elicit) میتوانند این مقالات را، فارغ از زبان اصلی انتشارشان، در سطح جهانی بازیابی کرده و به پژوهشگران پیشنهاد دهند. استاندارد JATS 1.4 با پشتیبانی از مقالات چندزبانه، ساختاری برای فراداده و متن کامل به چندین زبان فراهم میآورد و روابط دقیق بین نسخههای زبانی معادل را بدون نیاز به تغییر تعاریف تکزبانه پیشین حفظ میکند.۵ نیازی به تأکید نیست که بدون پیادهسازی چنین استانداردهایی، حتی بهترین مقاله فارسی برای هوش مصنوعی حکم یک تصویر گنگ- و نه یک داده قابل استفاده- را خواهد داشت.
کلید واژه ها: ترجمه, زبان, مجلات علمی, موانع ارتباطی, نشر, هوش مصنوعی