Преводачът на Google разшири базата си данни с още 110 нови езика.
AI помага на Google Translate да се разшири със 110 нови езика, което е най-голямата му актуализация досега.
Google обяви в публикация в блог, че това огромно разширяване включва езици, говорени от над 614 милиона души по света, или около 8% от световното население.
Разнообразието е огромно – от езиците, говорени от повече от 100 милиона души, до ценни диалекти на местните общности.
Включени са дори езици без текуща националност, което демонстрира ангажимента на Google за запазване на застрашените езици.
В допълнение към тази впечатляваща актуализация, Google се фокусира върху африканските езици, които представляват около една четвърт от новите допълнения. Езици като „фон“, „киконго“, „лу“, „га“, „суати“, „венда“ и уолоф вече са част от Google Translate, отбелязвайки най-значимия напредък в добавянето на африканските езици досега.
Google признава, че преводът на езици не е лесен поради регионални вариации, диалекти и разлики в правописа.
Някои езици, като ромския, с неговите много диалекти, нямат една стандартна форма, което прави превода сложен.
Големият езиков модел PalM 2 на Google беше полезен при разширяването на Translate. Той научава сродни езици, което позволява добавянето на подобни на хинди езици като авадхи и марвади, както и френски креолски езици като сейшелски и мавритански.
Добавянето на широко използвани езици като кантонски идва със собствени предизвикателства поради споделените писмени знаци с мандарин.
Въпреки тези пречки ангажиментът на Google към езиковото многообразие е ясен. Пример е включването на мански, келтски език от остров Ман, който почти изчезна през 1974 г.
Благодарение на усилията за съживяване, броят на говорещите свободно нарасна до хиляди.
Това разширение включва и пенджаби, написан на шрифта Shahmukhi, персийско-арабски вариант, използван в Пакистан, където е най-разпространеният език.
Преди това разширение най-голямата актуализация на Google Translate беше през май 2022 г. с въвеждането на Zero-Shot машинен превод.
Тази технология позволява на модела да учи нови езици, без да има нужда от съществуващи преведени примери.
Това беше голям напредък в машинния превод, който помогна на Google да преодолее допълнително езиковите бариери.
Това разширение е голяма стъпка към инициативата на Google за 1000 езика, която има за цел да използва модели на изкуствен интелект за поддръжка на 1000 от най-важните езици в света.