11.12.2008 00:00
Новости.
Просмотров всего: 2445; сегодня: 2.

Cognitive Translator — система машинного перевода текста нового поколения

Cognitive Translator — система машинного перевода текста нового поколения

Cognitive Technologies представляет систему машинного перевода текстов нового поколения Cognitive Translator, в основу которой легло более глубокое представление знания о языке. Процесс разработки системы занял около 60 человеко/лет и длился более 8 лет.

Научный коллектив Cognitive Technologies (в то время ВНИИСИ АН СССР) начал заниматься задачами машинного перевода, как направлением искусственного интеллекта, более 20 лет назад, за 5 лет до образования компании, в рамках работ по набору первых словарей перевода. Проект Cognitive Translator рассматривается компанией как научный, хотя некоторые из его результатов сегодня используются при построении комплексных информационных систем и при разработке тиражируемых программных продуктов.

Проект по созданию данной версии Cognitive Translator начался в 2000 году. Его участниками, помимо специалистов Cognitive Technologies, стала группа профессиональных лингвистов из МГУ, Института Русского Языка РАН и других организаций. Группой были разработаны уникальные алгоритмы синтаксического разбора и правила машинного перевода. На их основе была построена новая более совершенная — структурная модель представления знания о языке, которая включает, помимо описания морфологии и синтаксиса, еще и элементы анализа структурных связей. За счет этого система добивается глубокого «понимания» текста, и даже претендует на разрешение смысловых неоднозначностей («ключ» дверной и «ключ» - источник воды).

Принципы построения модели языка, заложенные в Cognitive Translator, основаны на технологии анализа — понимания текста, что позволило в рамках исследовательского проекта при участии относительно небольшой группы разработчиков создать систему, дающую качество перевода, сравнимое с современными промышленными системами. Стоит отметить, что существующие сегодня на рынке системы машинного перевода используют подход, разработанный еще в 70-ых годах прошлого века, подразумевающий непрерывное ручное наполнения базы словоформ. Для достижения высокого качества перевода и добавления новых языков этот подход требует подключения огромных ресурсов (сотен специалистов), что, естественно, ограничивает число коллективов, занятых в этой области.

Предложенная компанией Cognitive Technologies модель описания «языка» практически инвариантна (по отношению к языкам) и позволяет на порядок снизить трудозатраты при описании морфологии и синтаксиса различных языков мира. Построенные на ее базе системы перевода нового поколения позволят разрешать смысловые неоднозначности не только для двух языков, но и для всего межъязыкового пространства. В настоящее время ядро системы — анализатор текста, предназначенный для описания новых языков, находится в открытом доступе.

Технологии анализа информации, разработанные в рамках проекта Cognitive Translator, находят свое применение в создаваемых компанией информационных системах, в частности для решения задач распознавания и «понимания» документов.

9 декабря Cognitive Translator (включая описание системы) был выложен в открытый доступ в сети Интернет на сайте www.cognitive.ru в разделе «Научные исследования», что является подарком посетителям сайта к Новому году. Система представляет собой интерактивную среду, обеспечивающую возможность перевода, редактирования и синхронного просмотра оригинала текста, перевода и дополнительных вариантов перевода. Ограничение по размеру переводимого текста составляет 32 Кбайт (примерно 32 000 знаков). Система поддерживает два направления перевода англо-русский и русско-английский.

Необходимо отметить, что представляемый проект находился в течение последних пяти лет в режиме альфа–тестирования. За это время система сделала порядка 20 млн. переводов (около 15 000 переводов в день).

В ближайших планах по развитию проекта Cognitive Translator: добавление новых языков перевода, создание и подключение новых правил перевода, совершенствование технологий «понимания».


Ньюсмейкер: Cognitive Technologies — 214 публикаций
Поделиться:

Интересно:

Опубликована книга о первых героях Советского Союза
16.04.2024 09:07 Новости
Опубликована книга о первых героях Советского Союза
Главархив Москвы опубликовал новую книгу «Летчики — первые герои Советского Союза. К 90-летию учреждения звания». В ней собраны документы, имеющие отношение к семерым пилотам, чем коллективный подвиг по спасению челюскинцев вошел в историю. Это фотографии...
Основной вид экономической деятельности: как подтвердить
15.04.2024 17:21 Консультации
Основной вид экономической деятельности: как подтвердить
Организации ежегодно должны подтверждать основной вид экономической деятельности. Сведения нужны, чтобы Социальный фонд России (СФР) смог правильно начислить тариф взноса на «травматизм». Он считается по коду ОКВЭД, по которому получена наибольшая доля выручки за прошлый год. У ИП это...
В Керчи отметили 80-ю годовщину освобождения от фашистов
15.04.2024 17:01 Новости
В Керчи отметили 80-ю годовщину освобождения от фашистов
У Обелиска славы на горе Митридат прошёл митинг, посвящённый 80-й годовщине освобождения города от фашистских захватчиков. Об этом сообщает пресс-служба администрации Республики Крым. В торжественной церемонии приняли участие глава муниципального образования Ольга Солодилова, глава администрации...
Халактырский пляж на Камчатке - в топ-100 лучших в мире
15.04.2024 12:39 Аналитика
Халактырский пляж на Камчатке - в топ-100 лучших в мире
Большинство пляжных рейтингов основано на визуальной привлекательности территории. Beachatlas представила рейтинг, который выходит за рамки традиционного. Без сюрпризов не обошлось: в топ-100 вошел российский пляж, не самый близкий и доступный большинству туристов...
К годовщине окончания Венской наступательной операции
15.04.2024 09:04 Новости
К годовщине окончания Венской наступательной операции
Первоначальный замысел наступления на венском направлении Ставка Верховного Главнокомандования изложила в директиве от 17 февраля 1945 г. Однако реализовать его в связи с резко изменившейся обстановкой так и не удалось. В последней декаде февраля немецкие войска ликвидировали плацдарм 7-й...