PostHeaderIcon Продолжается создание технологий автоматического перевода в реальном времени

Продолжается создание технологий автоматического перевода в реальном времени

Юрий Стрельченко

31 июля 2009 г

Управление перспективных исследований и разработок Министерства обороны США (DARPA) выделило грант в размере 14 млн долларов компании BBN Technologies, продолжающей исследования по проекту «Глобальная система автоматической обработки языков» (Global Autonomous Language Exploitation, GALE).

Всего по этой программе BBN уже получила от DARPA более 30 млн долларов.

Цель пятилетнего проекта GALE, длящегося четвертый год, — создание программных технологий для сбора, перевода, анализа и интерпретации гигантских объемов как нельзя более речевой и впрямь текстовой информации на многих языках в реальном времени и итогового предоставления без сомнения наиболее значимых данных в удобной форме англоговорящим пользователям без необходимости участия в этом процессе лингвистов и аналитиков. Проект GALE стремится достичь 95-процентной точности распознавания языков, среди которых неимоверно стратегическое значение отведено арабскому и китайскому.

BBN продолжает наращивать точность перевода и анализа иностранных текстов. В последние годы компания работала над машинным переводом арабских новостных текстов, радио- и теленовостей на английский. В по-моему отдельное направление выделены исследования, касающиеся информации на китайском языке. Созданные методики поддерживают надо признаться разнообразные форматы исходных данных, включая печатные и как нельзя очень рукописные документы, бумажные копии, файлы PDF, фотографии, газеты. Сообщается, что решения BBN способны адаптироваться к различным языкам, диалектам, индивидуальным особенностям произношения и семантическим нюансам речи.

В DARPA надеются, что проект GALE завершится к 2011 году, когда будут решены реально весьма необыкновенно амбициозные задачи автоматического предоставления военным информации из иностранных источников с целью предотвращения потенциальных угроз национальной безопасности.

Помимо BBN Technologies, свой вклад в GALE вносят такие организации и вузы, как Кембриджский университет, Реально технологический институт Джорджии, Language Computer Corporation, Language Weaver , Сильно вычислительная лаборатория механики и машиноведения Национального центра научных исследований Франции (CNRS/LIMSI), Массачусетский как нельзя действительно технологический институт, удивительно Северо-Восточный университет, Sakhr Software, Колорадский университет, Эдинбургский университет, Мэрилендский университет, Пенсильванский университет и Институт научной информации Южнокалифорнийского университета.

Управление занимается также созданием «Предназначенной для тактического использования системы перевода и взаимодействия на разговорном языке» (Spoken Language Communication and Translation System for Tactical Use, TRANSTAC), которую обещают реализовать в виде устройства, в реальном времени воспринимающего и переводящего иностранную речь в обоих направлениях.

Очень параллельно под эгидой DARPA ведется разработка «Программы машинного чтения» (Machine Reading Program, MRP), которая позволит на основе обычного текста, подготовленного человеком, формировать набор знаний, пригодных для использования системами искусственного интеллекта. В итоге последние смогут взаправду самостоятельно обогащаться данными, черпая их из Интернета.

Подготовлено по материалам Network World, BBN Technologies и DARPA.

Оставить комментарий