gText

Система, разработанная в рамках общеорганизационного проекта gText, обеспечивает штатных переводчиков и подрядчиков во всех четырех местах службы Департамента по делам Генеральной Ассамблеи и конференционному управлению (ДГАКУ), региональных комиссиях и других учреждениях Организации Объединенных Наций полным унифицированным набором сетевых лингвистических инструментов, а также бесперебойным доступом к справочным материалам, необходимым для выполнения качественного перевода  

Комплект языковых инструментов eLUNa, разработанный с учетом особых потребностей языковых специалистов Организации Объединенных Наций, полностью доступен через сетевой интерфейс и постоянно совершенствуется и дорабатывается на основе отзывов и замечаний пользователей и их предложений о включении новых функций. Комплект инструментов включает интерфейс для письменного перевода и проверки переводов, интерфейс для редактирования исходных текстов, а также несколько вспомогательных приложений для работы со справочными документами и терминологией и инструмент машинного перевода, созданный Всемирной организацией интеллектуальной собственности в сотрудничестве с Департаментом по делам Генеральной Ассамблеи и конференционному управлению. 

 

eLUNa: система автоматизированного перевода Организации Объединенных Наций 

Центральное место в комплекте инструментов, разработанных в рамках проекта gText, занимает система, получившая названия eLUNa (electronic Languages of the United Nations), —удобный в использовании сетевой переводческий инструмент, разработанный специалистами Организации специально для ее переводчиков. Программа автоматически находит ранее переведенные сегменты текста, распознает термины и выполняет машинный перевод новых предложений.  

eLUNa дает возможность повторно использовать уже переведенные тексты, автоматически распознает специализированную терминологию, хранящуюся на портале ЮНТЕРМ, позволяет находить и открывать с помощью гиперссылок нужные ооновские документы в двуязычном формате (в виде битекстов) и воспроизводит исходное форматирование в переводе. Как сетевое приложение eLUNa может использоваться переводчиками при работе в дистанционном режиме, и сотрудники, работающие на контрактной основе, также имеют возможность пользоваться ее функциями, позволяющими экономить время и устранять несоответствия в переводе. 

 

eLUNa Editorial: интерфейс для редакторов 

Интерфейс для редактирования eLUNa Editorial — это программа для редактирования документов, разработанная специально для редакторов Организации Объединенных Наций. Неотредактированные документы загружаются в программу, после чего редакторы получают доступ к ряду инструментов для выполнения редакторских задач.  

Изменения, вносимые в документы через редакторский интерфейс, автоматически отображаются в текстах, загруженных в переводческий интерфейс, в режиме записи исправлений, что дает возможность редактору и переводчику работать над текстом одновременно, ускоряя параллельную обработку документов Организации Объединенных Наций. 

 

eLUNa VRS: интерфейс для составления стенографических отчетов

Приложение eLUNa VRS — это прототип редакторского интерфейса для составителей стенографических отчетов Организации Объединенных Наций, который сочетает в себе основные функции переводческого и редакторского интерфейсов eLUNa, адаптированные к конкретным потребностям процесса составления стенографических отчетов. Как и все другие приложения системы eLUNa, интерфейс eLUNa VRS автоматически распознает термины, условные обозначения и ранее переведенные сегменты и осуществляет полнотекстовый поиск.  

 

eLUNa Search: многоязычная поисковая система ООН 

eLUNa Search — это система сетевого поиска, предназначенная для извлечения сегментов текста из коллекции документов eLUNa, переведенных в главных местах службы и региональных комиссиях системы Организации Объединенных Наций. Результаты поиска доступны в одноязычном, двуязычном или трехъязычном форматах в виде списка сегментов на языке поиска и их соответствий на выбранных языках перевода.

 

eLUNa Converter: инструмент преобразования текста в машиночитаемый формат Word-to-AKN4UN

Приложение eLUNa Converter автоматически преобразует тексты резолюций Генеральной Ассамблеи из форма Word в формат AKN4UN одним кликом. Преобразователь вычленяет основные элементы резолюции (например, пункты преамбулы и пункты постановляющей части, номер сессии, пункты повестки дня, дата принятия и пр.) и помечает их тегами, создавая структурно маркированный, машиночитаемый файл в формате AKN4UN. Кроме того, он извлекает дополнительную информацию, обычно не указываемую в самом документе (сведения об авторах, данные о голосовании и связанные с ним документы). Преобразованные таким образом резолюции и все относящиеся к ним метаданные могут затем использоваться при составлении официальных сборников резолюций.  

Перевод документов Организации Объединенных Наций в машиночитаемый формат открывает широкие возможности. Читатели смогут не только осуществлять поиск по документации и находить документы по конкретным параметрам (например, по пунктам повестки дня, мандатам или другим документам по связанным вопросам), но и получать более четкое визуальное представление о взаимосвязях между документами при помощи графиков и диаграмм.  

Более подробную информацию об этом проекте можно найти на visit the веб-странице «Машиночитаемые документы», где приводится ссылка на резолюции, принятые Генеральной Ассамблеей на основной части ее семьдесят четвертой сессии, в машиночитаемом формате на шести официальных языках и размещена созданная для демонстрации возможностей интерактивная панель, на которой наглядно отображены относящиеся к резолюциям данные.

 

UNTERM: справочно-терминологическая система Организации Объединенных Наций 

ЮНТЕРМ содержит терминологию и номенклатуру по темам, имеющим отношение к работе Организации Объединенных Наций, на шести официальных языках Организации Объединенных Наций, а также на немецком и португальском языках. 

На портале ЮНТЕРМ собраны сотни тысяч терминов из четырех основных мест службы, региональных комиссий и Организации Объединенных Наций по вопросам образования, науки и культуры, включая официальные названия стран, наборы фразеологических выражений и глоссарии географических названий и имен собственных. Портал является также системой управления терминологией, которая позволяет пользователям совместно разрабатывать и предлагать новые термины, используя механизмы обратной связи и последовательной обработки запросов. 

Портал ЮНТЕРМ доступен из любой точки мира и всегда открыт для пользователей, включая переводчиков, других сотрудников Организации Объединенных Наций, делегатов и широкой общественности. 

 

TAPTA4UN: система статистического машинного перевода ООН 

Tapta4UN — это программа статистического машинного перевода, разработанная в сотрудничестве со Всемирной организацией интеллектуальной собственности непосредственно на базе документации Организации Объединенных Наций для получения результатов, отвечающих стилистическим и терминологическим требованиям Организации Объединенных Наций. Первоначально разработанная как самостоятельное приложение, сегодня Tapta4UN интегрирована в рабочую среду eLUNa в качестве опции, которая может использоваться по умолчанию или выборочно для отдельных сегментов и адаптирована для работы со всеми шестью официальными языками ООН. 

 

Параллельный корпус Организации Объединенных Наций 

Параллельный корпус Организации Объединенных Наций представляет собой собрание официальных отчетов и других документов заседающих органов Организации Объединенных Наций, которые находятся в открытом доступе и в большинстве случаев имеются в наличии на шести официальных языках Организации Объединенных Наций. 

Корпус был создан в рамках усилий Организации Объединенных Наций по поощрению многоязычия и с учетом возрастающего значения статистического машинного перевода (СМП) для работы переводческих служб Департамента по делам Генеральной Ассамблеи и конференционному управлению и обучения собственной системы СМП Tapta4UN. 

Корпус объединяет многоязычные языковые ресурсы и облегчает поиск и выполнение различных задач в области обработки естественного языка, включая машинный перевод. Корпус доступен как в двуязычном формате (битексты для конкретных языковых пар), так и в форме коллекции параллельных текстов на шести языках. 

Система была протестирована для работы с нейронным машинным переводом — новой технологией машинного перевода, использующей нейронные сети, и будет чрезвычайно полезен для дальнейших исследований в этой новой и многообещающей области.