زبان‌شناسی رایانشی

زبان‌شناسی رایانشی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که می‌کوشد با بهره‌گیری از روش‌های آماری و قاعده‌بنیاد (rule-based)، به مدل‌سازی زبان طبیعی بپردازد. به شکل سنتی زبان‌شناسی رایانشی در قلمرو کاری دانشمندان کامپیوتری قرار داشت که در حوزه‌ی پردازش یک زبان خاص توسط کامپیوتر تخصص لازم را کسب کرده بودند. امروزه زبان‌شناسان رایانشی به عنوان اعضای گروه‌های میان‌رشته‌ای به فعالیت می‌پردازند، که اعضای این تیم‌ها می‌توانند شامل زبان‌شناسان (به شکل خاص در زمینه‌ی زبان‌شناسی همگانی تخصص دارند)، کارشناسان زبان (افرادی با پیش‌زمینه و تا حدی دارای مهارت‌های عملی مرتبط با پروژه‌ی مورد نظر)، و دانشمندان علم کامپیوتر باشند. به‌طور کلی، زبان‌شناسی رایانشی از همکاری دانشمندان و کارشناسان رشته‌های زبان‌شناسی، علوم رایانه‌ای، متخصصین زمینه‌ی هوش مصنوعی، ریاضی، منطق، علوم شناختی، روان‌شناسی شناختی، روان-زبان‌شناسی، مردم‌شناسی، عصب‌شناسی و برخی دیگر از رشته‌ها استفاده می‌کند.

زبان‌شناسی رایانشی دارای زیر شاخه‌های نظری و کاربردی است. زبان‌شناسی رایانشی نظری به بررسی و مطالعه زبان‌شناسی نظری با در نظر داشتن علوم شناختی می‌پردازد و زبانشناسی رایانشیِ کاربردی نتایج کاربردی مدل‌سازی برای زبان را مد نظر قرار می‌دهد.^[۱]

خاستگاه

پیدایش حوزه زبان‌شناسی رایانشی به عنوان یک حوزه علمی و مطالعاتی، به قبل از پیدایش هوش مصنوعی (حوزه‌ای که زبان‌شناسی رایانشی اغلب زیر شاخه‌ای از آن محسوب می‌شود) بازمی‌گردد. زمینۀ شکل‌گیریِ زبان‌شناسی رایانشی را باید در تلاش‌های ایالات متحده در دهه ۱۹۵۰ جستجو کرد، یعنی زمانی که آن‌ها در تلاش بودند تا بتوانند با استفاده از رایانه به شکل خودکار متون زبان‌های بیگانه، به خصوص منابع علمی به زبان روسی، را به انگلیسی ترجمه کنند.^[۲] از آنجا که سیستم‌های رایانه‌ای، پردازش‌های ریاضیاتی را بسیار سریع تر از انسان‌ها انجام می‌دهند در ابتدا چنین تصور شد که مسایل تکنیکی ترجمه ماشینی به سرعت حل خواهند شد و آن‌ها قادر خواهند بود تا ماشین‌های ترجمه با توانایی‌های مشابه انسان بسازند.^[۳]

ترجمه ماشینیِ (نام دیگر: ترجمه مکانیکی) ابتدایی، که بر اساس دانش و فناوریِ آن دوران طراحی شده بود، چندان در ترجمۀ «درست» متن‌های گفناری ونوشتاری کامیاب نبود؛ از پسِ مشاهده و تحلیلِ مصداق‌های پرشمار ترجمه‌های ماشینیِ غلط یا نارسا بود که پژوهشگران این حوزه دریافتند که پردازش زبانی از آنچه پیشتر تصور می‌کردند، پیچیده‌تر است. به‌این‌ترتیب، «زبان‌شناسی رایانشی» به عنوان شاخه‌ای جدید از علوم متولد شد؛ حوزه‌ای در علم و فناوری که به تولید الگوریتم‌ها و نرم‌افزارهای بررسی هوشمند داده‌های زبانی می‌پردازد. از دهۀ 1960 میلادی، که زبان‌شناسی رایانشی پا به عرصه گذاشت، به عنوان زیر شاخه‌ای از هوش مصنوعی در نظر گرفته شد؛ شاخه‌ای که مشخصاً به بررسی، فهم و تولید زبان در سطح هوشی انسانی می‌پردازد.

پس از بررسی نحوه انجام ترجمه صحیح توسط انسان‌ها چنین مشاهده شد که فرد مترجم می‌بایست به دستور، تکواژشناسی و همچنین قواعد نحوی هر دو زبان آگاهی داشته باشد. مبانی آگاهی از نحو نیز، داشتن دانش معناشناسی، واژگان و همچنین کاربردشناسی شناسایی شدند؛ بنابراین تلاش در جهت تحقق ترجمهٔ ماشینی به شاخه‌ای پیچیده از علوم برای توصیف، نمایش و پردازش ماشینی زبان‌های انسانی تبدیل شد.^[۴]

موارد کاربرد

در مورد استفاده از آن از جمله می‌توان به کاربردهای زیر اشاره کرد:

فرایافت concept و تجزیه زبانهای برنامه‌نویسی

نوآم چامسکی توانست تشابه زبانهای طبیعی و زبان های برنامه‌نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان میابد.

ترجمه ماشینی

مقالهٔ اصلی: ترجمه ماشینی (خودکار)

این شاخه از زبان‌شناسی رایانه‌ای زمان درازی کم‌اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته است. پس از مرحلهٔ شکافت واژه‌ها و نحو می‌باید تجزیهٔ مفهوم و سپس پراگماتیک را نیز افزود. در واقع این دو کوشش بر شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

پرسش و پاسخ با زبانهای طبیعی

این ایده مدتی به‌عنوان پاسخی قانع‌کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبهٔ گسترده‌تری از دستور زایشی چامسکی است.

صرف محاسباتی

مقالهٔ اصلی: صرف محاسباتی

به مطالعات مربوط به ساختارهای^[۵] درونی واژه ها صرف گفته می‌شود. اغلب دست‌آوردها و نتایج پژوهشهای صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سامانه های پردازش زبان‌های طبیعی انسانی فراهم آمده‌است.

پانویس

↑ Hans Uszkoreit. What Is Computational Linguistics? [۱] Department of Computational Linguistics and Phonetics of Saarland University
↑ John Hutchins: Retrospect and prospect in computer-based translation. بایگانی‌شده در ۱۴ آوریل ۲۰۰۸ توسط Wayback Machine Proceedings of MT Summit VII, 1999, pp. 30–44.
↑ Arnold B. Barach: Translating Machine 1975: And the Changes To Come.
↑ Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel
↑ Structures

منابع

Crystal D. , The Cambridge Encyclopedia of Language, 2nd edition, Cambridge University Press, 1996. ISBN 0-521-55967-7
Manning, C. D. , and Schutze, H. , Foundations of Statistical Natural Language Processing, 5th edition, The MIT Press, 2002. ISBN 0-262-13360-1
Linguistique informatique, Wikipedia
O'Grady, W. , Dobrovolsky, M. , and aronoff, M. , Contemporary Linguistics, An Introduction, 2nd edition, St. Martin' Press, Inc. , 1993. ISBN 0-312-06780-1

پیوند به بیرون

منظور از زبان‌شناسی محاسباتی چیست؟ (انگلیسی)
انجمن زبان‌شناسی محاسباتی (انگلیسی)
مرکز مطالعات زبان‌ها و اطلاعات، مؤسسه تحقیقات عالی پیرامون برخوردهای انسان‌ها با علوم و فناوری، دانشگاه استانفورد (انگلیسی)
مرجع دادگان زبان فارسی پیکره‌های فارسی مورد استفاده در پردازش رایانه‌ای زبان و مطالعات زبان‌شناختی

[1] Hans Uszkoreit. What Is Computational Linguistics? [۱] Department of Computational Linguistics and Phonetics of Saarland University

[2] John Hutchins: Retrospect and prospect in computer-based translation. بایگانی‌شده در ۱۴ آوریل ۲۰۰۸ توسط Wayback Machine Proceedings of MT Summit VII, 1999, pp. 30–44.

[3] Arnold B. Barach: Translating Machine 1975: And the Changes To Come.

[4] Natural Language Processing by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel

[5] Structures

[۱]

[۲]

[۳]

[۴]

[۵]

ن ب و علوم رایانه
Note: This template roughly follows the 2012 ACM Computing Classification System.
سخت‌افزار	برد مدار چاپی دستگاه جانبی مدار مجتمع یکپارچه‌سازی کلان‌مقیاس سامانه روی یک تراشه رایانش سبز خودکارسازی طراحی الکترونیکی شتاب‌دهنده سخت‌افزاری
سازمان سامانه‌های رایانه	معماری رایانه سامانه نهفته رایانش بی‌درنگ اطمینان‌پذیری
شبکه رایانه‌ای	معماری شبکه پروتکل ارتباطات سخت‌افزار شبکه برنامه‌ریز شبکه کارایی شبکه رایانه‌ای سرویس شبکه‌ای
سازمان نرم‌افزار	مفسر میان‌افزار ماشین مجازی سیستم‌عامل کیفیت نرم‌افزار
نظریه زبان‌های برنامه‌نویسی و ابزار توسعه نرم‌افزار	الگو برنامه‌نویسی زبان برنامه‌نویسی کامپایلر زبان خاص دامنه زبان مدل‌سازی چارچوب نرم‌افزاری محیط یکپارچه توسعه نرم‌افزار مدیریت پیکربندی نرم‌افزار کتابخانه (رایانه) مخزن نرم‌افزاری
توسعه نرم‌افزار	فرایند توسعه نرم‌افزار تحلیل نیازمندی‌ها طراحی نرم‌افزار ساخت نرم‌افزار استقرار نرم‌افزار تعمیر و نگهداری نرم‌افزار تیم برنامه‌نویسی نرم‌افزار متن‌باز برنامه‌نویسی آزمون نرم‌افزار
نظریه محاسبات	مدل محاسبه زبان صوری نظریه اتوماتا نظریه رایانش‌پذیری نظریه پیچیدگی محاسباتی منطق در علوم کامپیوتر معنی‌شناسی (علوم رایانه)
الگوریتمها	الگوریتم تحلیل الگوریتم‌ها کارایی الگوریتمی الگوریتم‌های تصادفی هندسه محاسباتی
ریاضیات رایانه	ریاضیات گسسته احتمالات آمار نرم‌افزار ریاضی نظریه اطلاعات آنالیز ریاضی آنالیز عددی
سامانه اطلاعاتی	پایگاه داده ذخیره‌سازی داده رایانه سامانه اطلاعات سازمانی نرم‌افزار اجتماعی سامانه اطلاعات جغرافیایی سامانه پشتیبانی تصمیم کنترل فرایند پایگاه داده چند رسانه‌ای داده‌کاوی کتابخانه دیجیتال سکوی رایانش بازاریابی اینترنتی وب جهان‌گستر بازیابی اطلاعات مستندسازی فنی
امنیت رایانه	رمزنگاری روش‌های صوری خدمات امنیتی سامانه تشخیص نفوذ خرابی سخت‌افزار امنیت شبکه امنیت اطلاعات امنیت برنامه
تعامل انسان و رایانه	طراحی تعاملی رایانش اجتماعی رایانش فراگیر مصورسازی دسترس‌پذیری رایانه واسط‌های کاربر رایانش پوشیدنی
همروندی	رایانش همزمان رایانش موازی رایانش توزیع‌شده چندریسمانی چندپردازشی
هوش مصنوعی	پردازش زبان‌های طبیعی بازنمود دانش بینایی رایانه‌ای برنامه‌ریزی خودکار بهینه‌سازی نظریه کنترل فلسفه هوش مصنوعی هوش مصنوعی توزیع شده استدلال خودکار زبان‌شناسی رایانشی یادگیری ماشین
یادگیری ماشین	یادگیری با نظارت یادگیری بی‌نظارت یادگیری تقویتی یادگیری چند-وظیفه‌ای روش اعتبارسنجی متقابل
گرافیک رایانه‌ای	پویانمایی رایانه‌ای رندرینگ (گرافیک رایانه‌ای) روتوش واحد پردازش گرافیکی واقعیت ترکیبی واقعیت مجازی فشرده‌سازی تصویر مدلسازی جامد
رایانش کاربردی	تجارت الکترونیک نرم‌افزار سازمانی ریاضیات محاسباتی فیزیک محاسباتی شیمی محاسباتی زیست‌شناسی محاسباتی علوم اجتماعی محاسباتی مهندسی و علم محاسبه انفورماتیک پزشکی هنر دیجیتال نشر الکترونیک جنگ مجازی رأی‌گیری الکترونیکی بازی ویدئویی واژه‌پرداز تحقیق در عملیات فناوری آموزشی سامانه مدیریت اسناد
توجه: بنا بر سامانه رده‌بندی رایانش ای‌سی‌ام علم رایانه همچنین می‌تواند به موضوع‌ها یا زمینه‌های گوناگون تقسیم شود. کتاب:علوم رایانه رده:علوم رایانه طرح کلی علوم رایانه ویکی‌پدیا:ویکی‌پروژه علوم رایانه ویکی‌انبار