برنامه نویسی سیستم های ترجمه ماشینی

آشنایی با زبان ماشین و کاربردهای آن زبان‌های سطح پایین️ باگتو

در چنین شرایطی، کاربرانی که دارایی‌های خود را از اتریوم به سونیک منتقل کرده‌اند، می‌توانند دارایی‌های خود را دوباره روی شبکه اتریوم بازیابی کنند. این مکانیزم کاملاً غیرقابل تغییر است و تضمین می‌کند که کاربران هنگام انتقال دارایی به سونیک، کنترل دارایی‌های خود را روی شبکه اصلی (اتریوم) حفظ کنند. این تغییر با هدف ارتقای سرعت، مقیاس‌پذیری و تجربه کاربری انجام شده است. زبان وریلاگ (Verilog)، یک زبان توصیف سخت افزاری است که برای مدل سازی و شبیه سازی سیستم‌های دیجیتالی استفاده می‌شود. وریلاگ در لایه‌های چندگانه ای از انتزاع، در قالب‌های متنی استاندارد، برای گونه‌های مختلفی از ابزارهای (IEEE95) به طور موثر و قابل درک و به سهولت قابل طراحی است. با توجه به تجربه‌ای طولانی در عرصه برنامه‌نویسی و مواجهه با چالش‌های گوناگون، به این نکته پی بردیم که نبود منابع آموزشی کاربردی و عمیق در سطح حرفه‌ای، یکی از موانع اصلی رشد برنامه‌نویسان در کشورمان است.

RWS همچنین یک نسخه آزمایشی رایگان را برای کاربران علاقه‌مند فراهم می‌کند و مشتریان بالقوه را تشویق می‌کند تا برای بررسی جزئیات پیشنهادات خود، از نسخه آزمایشی استفاده کنند. بعد، a را اجرا می کنیم for حلقه تعداد چرخه های اجرا برای for حلقه برابر است با طول طولانی ترین جمله در خروجی. در داخل حلقه، در اولین تکرار، the decoder_model خروجی و حالت های مخفی و سلولی را با استفاده از حالت مخفی و سلولی رمزگذار و رمز ورودی، یعنی . در چرخه حلقه بعدی، حالت های مخفی و سلولی به روز شده، همراه با شاخص کلمه پیش بینی شده قبلی، برای پیش بینی های جدید استفاده می شود. حلقه تا رسیدن به حداکثر طول دنباله خروجی ادامه می یابد نشانه مواجه می شود.

پردازنده‌های جدید اغلب همه این دستورالعمل‌ها را کپی می‌کنند، به عبارت دیگر، پردازنده‌هایی که سعی می‌کنند شبیه به پردازنده‌های اصلی باشند، می‌توانند تمام دستورات آن‌ها را نیز کپی کنند. در زمان طراحی سخت افزار رایانه، زبانی منحصر به فرد و مختص همان رایانه تعریف می‌شود، که به آن زبان ماشین می‌گویند. زبان ماشین شامل دستورالعمل‌هایی است، که به طور مستقیم توسط رایانه قابل اجرا هستند. این زبان عموما شامل رشته ای از اعداد است که موجب می‌شود، رایانه عملیات اصلی که در ارتباط با خود است را در هر بار راه اندازی اجرا نماید. این برنامه، نسخه نصبی پلتفرم گوگل ترنسلیت است و همان قابلیت‌ها را به همراه چند مورد دیگر ارائه می‌دهد. هم‌چنین باید اضافه کرد می‌توان ترجمه را به صورت آفلاین نیز انجام داد.

برخی از زبان‌های برنامه نویسی هم مفسری و هم کامپایلری هستند و در ادامه به بررسی این نوع از زبان‌ها پرداخته شده است. برنامه‌های زبان ماشین با استفاده از یک سری برنامه با الگو دودویی برای مثال مانند «110110» ایجاد می‌شوند و این الگو نشان‌دهنده عملیات ساده‌ای است که باید توسط کامپیوتر انجام شود. برنامه‌های زبان ماشین به صورت مستقیم قابل اجرا هستند و کدهای ماشین همین برنامه‌ها را نشان می‌دهند. در ادامه مطلب «تفاوت کامپایلر و مفسر چیست» به بررسی و تعریف اصطلاح کد شی می‌پردازیم. کدهای فایل کامپایلر فقط در ماشین هدف خاص خود استفاده می‌شوند و قابل انتقال نیستند. زبان‌های برنامه نویسی C و ++C محبوب‌ترین و پرکاربردترین زبان‌هایی هستند که از کامپایلر استفاده می‌کنند.

به عبارتی، این زبان پایه‌ای‌ترین شکل از زبان‌های برنامه‌نویسی است که به طور مستقیم با واحد پردازشی مرکزی (CPU) صحبت می‌کند. هر دستور زبان ماشین دقیقاً برای یک عملیات مشخص روی پردازنده طراحی شده است، مانند ذخیره‌سازی یک مقدار در حافظه یا انجام عملیات ریاضی ساده. زبان‌های برنامه نویسی تفسیری برای پیاده‌سازی برنامه‌های خود از مفسر استفاده می‌کنند و کدهای منبع را قبل از اجرا به کدهای ماشین تبدیل نمی‌کنند. می‌توان گفت در این زبان‌ها مترجم به‌جای ترجمه یک‌جای کل برنامه، به صورت خط به خط و در زمان اجرا برنامه را ترجمه می‌کند. با این حال، مفسرهای امروزی، بیشتر از یک نمایش میانی استفاده می‌کنند که در اکثر زبان‌های تفسیری «بایت‌کد» (Bytecode) نامیده می‌شود. دستورات برنامه که شامل کدهای منبع، کدهای از پیش کامپایل شده و اسکریپت‌ها هستند با استفاده از مفسر به کدهای ماشین تبدیل می‌شوند.

همانند پیکره کانادایی هانسارد(Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا. این موضوع که موفقیت ترجمه ماشینی پیش از هر چیز نیازمند حل مسئله فهم زبان طبیعی است، اغلب مورد بحث است. به‌طور عام روش‌های قانون مند،[۱] متن را با استفاده از ساختن واسطی سمبلیک -که نهایتاً متن زبان مقصد از آن ایجاد می‌شود- تجزیه می‌کنند. در ترجمهٔ ماشینی ویژگی‌هایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه اقتصادی و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند. به عنوان مثال، در مقر سازمان ناتو در بروکسل و جامعه اروپا علی‌رغم آنکه حدود ۱۲۰۰ مترجم ورزیده به کار اشتغال دارند، در حال حاضر از ترجمه ماشینی نیز استفاده می‌شود. میزان کاری که مترجمی ورزیده در خلال چندین روز انجام می‌دهد، توسط کامپیوتر در عرض چند دقیقه انجام می‌شود.

را معماری seq2seq نوعی مدل‌سازی توالی چند به چند است و معمولاً برای کارهای مختلفی مانند خلاصه‌سازی متن، توسعه ربات‌های گفتگو، مدل‌سازی مکالمه و ترجمه ماشین عصبی و غیره استفاده می‌شود. Fortran یکی از قدیمی‌ترین زبان‌های برنامه‌نویسی کامپایلری است که برای توسعه برنامه‌های علمی و محاسبات عددی، به‌ویژه در حوزه مهندسی و علوم ریاضی، استفاده می‌شود. در مقابل، در زبان‌های برنامه‌نویسی مفسری، کد منبع توسط یک مفسر (interpreter) به‌صورت تفسیری خط‌به‌خط خوانده و اجرا می‌شود. به‌عبارت دیگر، کد برنامه به‌صورت تدریجی توسط مفسر خوانده و اجرا می‌شود، بدون ایجاد فایل اجرایی جداگانه. ترجمه ماشینی می‌تواند از روشی مبتنی بر داده‌های فرهنگ لغت استفاده کند و این بدان معنی است که کلمات به همان گونه‌ای که در فرهنگ لغات موجودند، ترجمه می‌شوند. ترجمه گوگل و مترجم گوگل هرگز نمی‌تواند جای ترجمه ی حرفه‌ای انسانی را بگیرد و با عباراتی که کاملاً صحیح باشند، متنی سلیس و روان ایجاد نماید.

اسمبلر مترجمی است که کدهای اسمبلی را به عنوان ورودی دریافت می‌کند و در خروجی کدهای زبان ماشین را ارائه می‌دهد. این موضوع به این مفهوم است که کامپیوترها زبان‌های برنامه نویسی سطح میانی را درک نمی‌کنند و به یک مترجم برای تبدیل کدهای آن‌ها به زبان سطح پایین یا همان زبان ماشین نیاز دارند. در بخش بعدی از مقاله «زبان ماشین چیست» به بررسی و شرح تعریف زبان‌های برنامه نویسی سطح بالا پرداخته شده است. هنگامی که یک وظیفه خاص، حتی کوچکترین برنامه و فرایندی در کامپیوتر ایجاد می‌شود، پردازنده ماشین آن را به زبان ماشین تبدیل می‌کند. کامپیوترها به دلیل اینکه دستگاه‌هایی دیجیتالی هستند، تنها داده‌های دودویی یا همان باینری را درک می‌کنند. در کامپیوتر، تمام داده‌ها از جمله داده‌های فیلم‌ها، برنامه‌ها و تصاویر به صورت باینری نمایش داده می‌شوند.

این پلتفرم برای کسب‌وکارهایی طراحی شده است که نیاز به ترجمه حجم بالایی از محتوا به چندین زبان دارند. این پلتفرم به ویژه برای شرکت‌هایی که در صنایع جهانی فعالیت می‌کنند و نیاز به ترجمه محتوا به چندین زبان دارند، مفید است. همچنین برای موسساتی که خدمات ترجمه ارائه می‌دهند، دانشگاهها و فریلنسرها مفید است. این مترجم هوش مصنوعی یک ابزار آنلاین قدرتمند است که از هوش مصنوعی برای بهبود کیفیت نوشته‌ها استفاده می‌کند. این ابزار با ارائه پیشنهادات دقیق در زمینه گرامر، واژگان، سبک نگارش و ساختار جمله، به شما کمک می‌کند تا نوشته‌های خود را به سطح حرفه‌ای برسانید. کوییل بات یک ربات هوش مصنوعی است که کارهای مختلفی از جمله خلاصه کردن متون، توضیح و تفسیر متون و ترجمه متون انجام می‌دهد.

Output_sentences() فهرست به طور مشابه، نشانه که مخفف “شروع جمله” است، در ابتدای جمله ترجمه شده الحاق می شود و نتیجه به عبارت اضافه می شود. Output_sentences_inputs() فهرست حلقه خاتمه می یابد اگر تعداد جملات اضافه شده به لیست ها بیشتر از عدد باشد NUM_SENTENCES متغیر یعنی 20000. Ruby یک زبان برنامه‌نویسی دینامیک است که برای توسعه وب، برنامه‌نویسی سیستم، اسکریپت‌نویسی و برنامه‌نویسی چندرشته‌ای (Multi-threading) استفاده می‌شود. JavaScript یکی دیگر از زبان‌های مفسری است که برای برنامه‌نویسی وب و توسعه صفحات وب پویا (Dynamic Web Pages) استفاده می‌شود. پیش از بررسی بیشتر تفاوت کامپایلر و مفسر بهتر است با زبان‌های کامپایلری آشنا شوید.

زبان‌های سطح پایین به زبان ماشین نزدیک‌تر هستند و به سخت‌افزار کامپیوتر دسترسی مستقیم دارند، مانند زبان اسمبلی. این زبان‌ها برای نوشتن برنامه‌هایی استفاده می‌شوند که نیاز به دسترسی مستقیم به منابع سخت‌افزاری دارند و به دلیل پیچیدگی و دشواری کار با آن‌ها، کمتر برای پروژه‌های بزرگ استفاده می‌شوند. فناوری موجود در پس سرویس ترجمه‌گر ماشینی ساخته شده با یادگیری عمیق، «یادگیری دنباله به دنباله» (sequence-to-sequence learning) نام دارد. از آنجا که توانمندی این روش در ترجمه ماشینی بسیار بالا است، هدف این مطلب استفاده از آن برای نوشتن ربات‌های چت هوش مصنوعی محسوب می‌شود. همچنین، در ادامه همین مطلب به منظور آشنایی با دیگر توانایی‌های روش مذکور مدلی برای شرح تصاویر (عنوان‌گذاری برای تصویر) ارائه خواهد شد.

فرترن را شرکت IBM بین سالهای ۱۹۵۴ و ۱۹۵۷ ایجاد کرد و در کاربردهای علمی و مهندسی که نیاز به محاسبات پیچیده ی ریاضی دارند به کار گرفت.زبان فرترن هنوز هم به صورت گسترده ای مخصوصا در کاربردهای مهندسی استفاده می شود. اکنون، کلیه ترکیب‌های ممکن از ترجمه تکه‌ها جهت ساخت کلیه ترجمه‌های ممکن برای جمله تولید می‌شوند. می‌توان با استفاده از ترجمه تکه‌هایی که در گام دوم لیست شده‌اند و ترکیب آن‌ها، نزدیک به ۲٬۵۰۰ ترجمه گوناگون ساخت. برخی از ترجمه‌های موجود برای هر یک از تکه‌ها، بیش از سایر آن‌ها استفاده می‌شوند. بر اساس تعداد تکرارهایی که برای هر ترجمه در داده‌های آموزش وجود دارد، می‌توان به آن‌ها امتیاز داد. برای مثال، معمولا اگر فردی بگوید «Quiero»، معنای متداول آن «I want» و نه «I try» است.

نسخه رایگان این ابزار به کاربران اجازه می‌دهد تا با محدودیت‌های استفاده بخصوصی به خدمات ترجمه آن دسترسی داشته باشند. DeepL همچنین یک طرح حق بیمه مبتنی بر اشتراک به نام DeepL Pro ارائه می‌دهد که مزایای بیشتری دارد، از جمله سرعت بالاتر در ترجمه، استفاده نامحدود و امکان ادغام سرویس در سایر برنامه‌ها. این ابزار یک ردیف رایگان دارد که به کاربران اجازه می‌دهد با محدودیت‌های خاصی به خدمات ترجمه اولیه دسترسی داشته باشند. مایکروسافت همچنین برنامه‌های پولی را برای حجم بالاتر و ویژگی‌های پیشرفته ارائه می‌دهد. قیمت‌گذاری معمولاً بر اساس تعداد کاراکترهای ترجمه‌شده یا تعداد درخواست‌های API انجام شده است. سیستم‌های SMT می‌توانند با بررسی حجم عظیمی از داده‌ها، پیش‌فرض‌هایی درباره ترجمه ایده‌آل برای یک ورودی خاص ایجاد کنند.

در مقاله «ابزار ترجمه مبتنی بر هوش مصنوعی» در رمزآگاه، درباره انواع سیستم‌های مبتنی بر هوش مصنوعی و نحوه کارکرد آنها توضیح دادیم. در بخش‌های پیشین از مجموعه مطالب «آموزش یادگیری ماشین با مثال‌های کاربردی»، مبانی و مفاهیم هوش مصنوعی و یادگیری ماشین، شبکه‌های عصبی، یادگیری عمیق، شبکه‌های عصبی پیچشی، بینایی ماشین و تشخیص چهره مورد بررسی قرار گرفت. در این بخش، به شبکه‌های عصبی بازگشتی و مدل‌های دنباله به دنباله پرداخته خواهد شد. برنامه نویسی با رویکرد «تعیین نوع به صورت پویا» یا «نوع‌دهی پویا» (Dynamic Typing) برای زبان‌های برنامه نویسی کامپایلری دشوار است، زیرا آن‌ها نمی‌توانند پیش‌بینی کنند که در هر بخش از پیاده‌سازی چه اتفاقی رخ خواهد داد. اما زبان‌‌های مفسری از قابلیت تعیین نوع به صورت پویا به طور کامل پشتیبانی می‌کنند. چندین ابزار هوش مصنوعی برای ترجمه وجود دارد که از تکنیک‌های یادگیری ماشینی و پردازش زبان طبیعی استفاده می‌کنند.

در واقع همان‌طور که از نام آن پیدا است، زبان ماشین، زبانی مخصوص ماشین یا همان سیستم‌های کامپیوتری به حساب می‌آید. همچنین این زبان با نام‌های «کد ماشین» (Machine Code) یا «کد شی» (Object Code) نیز شناخته می‌شود و درک آن برای انسان بسیار دشوار است. به طور کلی می‌توان گفت، تنها زبانی که سیستم‌های کامپیوتری، آن را درک می‌کنند، زبان ماشین به حساب می‌آید. همه برنامه‌ها و زبان‌های برنامه نویسی از جمله «سوئیفت» (Swift)، ++C و سایر زبان‌ها، قبل از پیاده‌سازی به زبان ماشین تبدیل می‌شوند. در زبان اسمبلی از کلماتی استفاده شده است که از پیش تعریف شده‌اند و با نام «Mnemonic» (نماد) شناخته می‌شوند. در این زبان برنامه نویسی دستورالعمل‌های کدهای باینری که در یک زبان سطح پایین وجود داشتند، با نمادها و «عملوندها» (Operand) در زبان‌های سطح میانی جابه‌جا می‌شوند.

یک مثال قابل توجه زبان جاوا اسکریپت است که بسته به نوع پیاده‌سازی می‌تواند برنامه را به طور کامل تفسیر کند. این ویژگی در جاوا اسکریپت بسیار مفید است؛ زیرا کدها به راحتی از طریق شبکه ارسال می‌شوند و در مرورگر کاربر اجرا خواهند شد. اگرچه یافتن زبان محبوب در دسته زبان‌های کاملاً تفسیری بسیار سخت شده است، اما به راحتی می‌توان تعداد زیادی از آن‌ها را معرفی کرد که از روش ایجاد بایت‌کد و تفسیر آن استفاده می‌کنند. کامپایلر کل یک برنامه را به عنوان ورودی دریافت و مفسر، یک خط یا عبارتی از کدها را به عنوان ورودی دریافت می‌کند. در کامپایلر به عنوان خروجی، کدهای شی ایجاد می‌شوند، اما مفسر کدهای ماشین میانی تولید می‌کند.

این تقریباً ۵۰ برابر سریع‌تر از زنجیره اپرا در فانتوم و ۵۰۰ برابر سریع‌تر از بلاک چین اتریوم است. به عنوان یك مثال ساده می‌توان به نرم‌افزار Macromedia Authorware اشاره كرد. البته با استفاده از مجموعه‌ای از این فرامین ساده می‌توان برای انجام هر كاری توسط رایانه‌ها برنامه‌های مناسبی به زبان ماشین تهیه نمود ولی این كار بسیار مشكل وطاقت‌فرسا بوده و نیازمند دانش فنی زیادی در خصوص عملكرد رایانه‌هاست. این قسمت، شاید جالب‌ترین و تعجب‌آورترین همراهی تکنولوژی و ترجمه تاکنون باشد. نرم‌افزارهای سیستم عامل‌های موبایل قادر هستند تابلوها، علائم یا متون انگلیسی را در لحظه برای شما ترجمه کنند.

طبق اطلاعیه پروژه، سونیک گیت‌وی با تأکید بر انعطاف‌پذیری، سرعت، صرفه اقتصادی و امنیت ساخته شده است. بنابراین یک پردازنده intel زبان ماشین و اسمبلی پردازنده powerPc را نمی‌فهمند و بالعکس. اما برخی از پردازنده‌ها هم هستند که با سایر پردازنده‌ها تعامل خوبی دارند، مثل پردازنده‌های AMD که با پردازنده‌های اینتل سازگارند. یک پردازنده از میلیونها سوییچ بسیار کوچک تشکیل شده است که می‌توانند خاموش و روشن شوند. اگر برخی از این سوییچ‌های خاص را خاموش و روش کنیم، می‌توانیم از پردازنده بخواهیم تا کار مورد نظر ما را انجام دهد.

همچنین این امکان نیز وجود دارد که یک تصویر به مدل دنباله‌ای تبدیل شود که می‌تواند آن تصویر را به متن مبدل کند. یک تیم دیگر در گوگل این کار را با جایگزینی اولین شبکه عصبی بازگشتی (RNN) با یک شبکه عصبی پیچشی (مانند آنچه در بخش سوم بیان شد) انجام دادند. این کار امکان دریافت تصویر به عنوان ورودی به جای جمله را فراهم می‌کند. در نتیجه، برنامه‌های کامپایل شده فقط روی کامپیوترهایی اجرا می‌شوند که معماری مشابه به کامپیوتری داشته باشند که کامپایل برنامه در آن انجام شده است. در ادامه به صورت خلاصه تعاریفی از کامپایلر و مفسر را یاد می‌گیریم.

اسمبلی از کدهای کوتاه (mnemonic) برای دستورالعملها استفاده می‌کند. بسیاری از برنامه نویسان از زبان اسمبلی در جاهایی که نیاز به سرعت و اثر بخشی بالا دارد، استفاده می‌کنند. اما زبان اسمبلی از کلمات و نمادهای ساده استفاده می‌کند که نوشتن و خواندنش راحت‌تر است. با زبان اسمبلی می‌توان برنامه‌ها را به صورت خواناتری نوشت و درک آن برای برنامه‌نویسان ساده‌تر از زبان ماشین است. در مقابل، زبان ماشین حتی خواناترین دستورهای اسمبلی را به کدهای باینری ترجمه می‌کند که مستقیماً قابل اجرا روی پردازنده هستند.

تایا تحویل به موقع ترجمه‌های عالی را با امتیاز رضایت مشتری 99.4 درصد تضمین می‌کند. این شرکت همچنین برای افرادی که بیش از یک ترجمه می خواهند، خدمات طولانی مدت ارائه می‌دهد. ریورسو یک نرم افزار هوش مصنوعی برای ترجمه است که از 25 زبان پشتیبانی می‌کند. ریورسو نیز مثل دو مورد قبل یک ابزار هوش مصنوعی رایگان برای ترجمه است که هم می‌توان محتوای متنی و هم صوتی برای ترجمه به آن داد. برای تسهیل مشکلات تمام این افراد، هوش مصنوعی راه حلی برای ارائه دارد.

باید گفت حتی مترجمین و ویراستاران نیز به نرم‌افزارهای ترجمه احتیاج دارند. مدیریت یک ترجمه تیمی، کاری است که علاوه بر آشنایی با اصول و اساس کارکردهای زبانی، تسلط به برنامه‌ریزی زمانی، نیروی کار و مشاهده پیشرفت کار را نیز می‌طلبد. Taia تایا یک پلتفرم ترجمه مدرن است که از هوش مصنوعی برای ارائه ترجمه‌های دقیق و با کیفیت بالا استفاده می‌کند. این پلتفرم با هدف ساده‌سازی فرآیند محلی‌سازی و ارائه خدمات ترجمه حرفه‌ای به کاربران طراحی شده است. لایبرترنسلیت LibreTranslate یک ابزار ترجمه متن باز و رایگان است که به شما امکان می‌دهد یک سرور ترجمه شخصی خود را راه‌اندازی کنید.

ابزارهای هوش مصنوعی برای ترجمه با تنوع بالا و کارایی متفاوت وجود دارند. در این مقاله قصد داریم شما را با بهترین ابزارهای هوش مصنوعی برای ترجمه آشنا کنیم که شامل نسخه‌های رایگان و پولی می‌شوند. سیستم‌های ترجمه ماشینی آماری در صورت داشتن حجم مناسبی از داده‌های آموزش، نسبت به سیستم‌های مبتنی بر قاعده عملکرد بهتری دارند. «فرانز جوزف آک» (Franz Josef Och)، این ایده را توسعه داد و در اوایل سال ۲۰۰۰ از آن برای ساخت ترجمه‌گر گوگل استفاده کرد. فناوری نهفته در پس ترجمه‌گر گوگل را «ترجمه ماشینی» (Machine Translation) می‌نامند. این سرویس امکان برقراری ارتباط به زبان‌های گوناگون را برای افراد در شرایط مختلف فراهم و اینگونه جهان را دستخوش تغییر کرده.

این امر به گردآوری روش‌های گوناگون کاربرد یک کلمه در متن کمک می‌کند. اگر می خواهید سیستم ترجمه خود را بسازید، یک نسخه نمایشی کارآمد وجود دارد که در تنسورفلو ارائه شده است و میان انگلیسی و فرانسوی ترجمه خواهد کرد. اگرچه، برای مواردی مثل ضعف قلب و یا بودجه های محدود، مناسب نیست، این تکنولوژی هنوز هم جدید و بسیار فشرده است. حتی اگر شما یک کامپیوتر پرسرعت با یک کارت گرافیک سطح بالا داشته باشید، حدود یک ماه زمان جهت پردازش مداوم طول خواهد کشید تا سیستم ترجمه زبان خودتان را آموزش دهید. ساخت یک سیستم ترجمه که بر پایه آمار استوار است، تعداد زیادی داده آموزشی نیاز دارد که یک متن کاملا یکسان به حداقل دو زبان ترجمه شده باشد. این متن که دوبار ( به دو زبان مختلف ) ترجمه شده، Parallel Corpora نام دارد.


برنامه نویسی زیمنس