MAKİNE ÇEVİRİ YÖNTEMLERİ VE MAKİNE ÇEVİRİSİNİN BUGÜNKÜ DURUMU
(MACHINE TRANSLATION METHODS AND CURRENT STATE OF MACHINE TRANSLATION
)
Author
|
:
Taşpolot SADIKOV
- Kerim SARIGÜL
|
|
Type |
:
Copyright
|
Printing Year |
:
2021
|
Number |
:
10/1
|
Page |
:
192-205
|
Doi Number |
:
http://dx.doi.org/10.7884/teke.5195
|
Özet
Bu çalışmada makine çevirisinin ortaya çıkışı, gelişimi ve bugün geldiği nokta değerlendirilmekte, popüler makine çeviri sistemleri (Google Çeviri, Microsoft Bing Çeviri, Yandex Çeviri) üzerinden günümüzde yaygın kullanılan makine çevirisi yöntemlerine değinilmektedir.
20 milyar kelime içeren Birleşmiş Milletler belgeleri üzerinde eğitilen Google Çeviri; ilk yıllarda “Kural Tabanlı Makine Çevirisi” yöntemini ve “İstatistiksel Makine Çevirisi” yöntemini kullanmış, son yıllarda ise insan çevirisine daha yakın olan “Sinirsel Makine Çevirisi” yöntemini kullanmaya başlamıştır. Bu yöntemi İngilizce, Fransızca, Almanca, İspanyolca, Portekizce, Çince, Japonca, Korece ve Türkçe olmak üzere 9 dilde kullanmaktadır.
95’ten fazla dilde çeviri hizmeti sunan Yandex Çeviri ise; önceden öğretilmiş dil kurallarına göre değil, üzerinde çalıştığı dilleri istatistiki yöntemlerle analiz ederek çeviri yapmaktadır. Yandex bu yöntemi son yıllarda geliştirerek hibrit bir model (istatistiksel makine çevirisi ve sinirsel makine çevirisini birlikte) kullanmaya başlamıştır.
Microsoft Bing Çeviri ise 70’tan fazla dilde metin çeviri hizmeti vermekte, bunlardan 60’ında Sinirsel Makine Çevirisi yöntemini, 10 dilde ise istatistiksel makine çevirisi yöntemini kullanmaktadır.
Makalede istatistiksel makine çevirisi Türkçe-Kırgızca, sinirsel makine çevirisi ise İngilizce-Türkçe örnekler üzerinden değerlendirilmektedir.
Anahtar Kelimeler
Makine çevirisi, kural tabanlı makine çevirisi, istatistiksel makine çevirisi, sinirsel makine çevirisi.
Abstract
In this study, machine translation’s emergence, development and the point which it stands today are evaluated, the commonly used machine translation methods in our present day are addressed over the popular machine translation systems (Google Translation, Microsoft Bing Translation, Yandex Translation).
Google Translation which was instructed over documents of United Nations containing 20 billion of words has used the method of “Rule-Based Machine Translation” and the method of “Statistical Machine Translation” in the early years, it has started to use the method of “Neural Machine Translation” that is closer to the human translation in the recent years. It uses this method in 9 languages as English, French, Deutsch, Spanish, Portuguese, Chinese, Japanese, Korean and Turkish.
Yandex Translation which provides translation service in more than 95 languages makes translation by analyzing the languages it works on by statistical methods, not by the language rules which have been already instructed. Yandex has developed this method in recent years and started to use a hybrid model (in combination of statistical machine translation and neural machine translation).
Microsoft Bing Translation offers text translation service in more than 70 languages, it uses the method of Neural Machine Translation in 60 languages and the method of statistical machine translation in 10 languages.
In this article, the statistical machine translation will be evaluated over Turkish-Kyrgyz examples, the neural machine translation will be evaluated over English-Turkish examples.
Keywords
Machine translation, rule-based machine translation, statistical machine translation, neural machine