ABBYY

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 00:53, 23 мая 2016.
ABBYY
Industry Коммерческая компания
Founded Россия 1989 год
Founder Давид Ян
Key people

Сергей Андреев (ген. директор ABBYY)

Юрий Корюкин (ген. директор ABBYY Россия)
Products ABBYY FineReader, ABBYY FlexiCapture , ABBYY Lingvo
Website abbyy.com

ABBYY LS — единственная компания на рынке в России и странах СНГ, которая одновременно лидирует в области лингвистических услуг и технологий автоматизации процессов перевода. Сотрудничает с рядом ведущих мировых компаний.Владельцы и финансовые показатели компании не раскрываются. Выручка компании оценивается в $100-200 млн в год. Такие оценки давались в 2008, 2010, 2015 гг. По мнению участников рынка в числе акционеров ABBYY — Давид Ян, Сергей Андреев, Mint Capital (миноритарный инвестор), PFU (группа Fujitsu), нынешние и бывшие сотрудники компании.

Название компании

До 1998 года компания называлась BIT Software, однако в связи с предполагаемой экспансией на Запад, было решено произвести ребрендинг: компаний с названием BIT насчитывалось более десятка. Давид Ян предложил название ABBYY. Позже был найден и смысл: статья из словаря Lingvo 12 определяет его так:

Название компании произносится как «аби» и буквально означает «ясный глаз»; реконструированная форма праязыка мяо-яо, гипотетического языка-предка групп мяо-яо, ну, хмун, хмонг и киммун; название связано с деятельностью компании в области создания систем оптического распознавания текстов.

История

Весной 1989 года во время сдачи зачёта по французскому языку студенту МФТИ Давиду Яну приходит в голову мысль составить электронный словарь. Всё лето Давид вместе с программистом Александром Москалёвым разрабатывали программное обеспечение к словарю Lingvo. Первые копии разошлись зимой 1990 года. Первая версия FineReader-а вышла в 1993 году. 12 февраля 1999 года был открыт офис в США, его возглавил Дин Тан. 25 апреля 2000 года в Мюнхене основана ABBYY Europe, её возглавил бывший директор Mitcom, Юп Стопити.

С 2004 года ABBYY является генеральным организатором конференции «Диалог» — российской конференции по компьютерной лингвистике. В 2006 году ABBYY основала кафедру распознавания изображений и обработки текста на факультете инноваций и высоких технологий в Московском физико-техническом институте. В мае 2012 года при поддержке ABBYY были открыты кафедры «Компьютерной лингвистики» в РГГУ и МФТИ.

В апреле 2007 года ABBYY приобрела долю в российском бюро переводов «Переведём.ру», расширив спектр своих услуг в области переводов и связанных с ними услуг. В данный момент «Переведём.ру» входит в группу компаний ABBYY и называется ABBYY Language Services.

В августе 2012 года ABBYY Language Services, входящая в группу компаний ABBYY, приобрела американскую компанию Connective Language Services. В сентябре было объявлено о приобретении Digital Documents — американского интегратора, который занимается внедрением технологий распознавания документов и ввода данных в правительственных, финансовых, медицинских и образовательных организациях Северной Америки. В 2012 году более 30 миллионов пользователей и десятки тысяч организаций по всему миру использовали решения ABBYY.

На 2015 год решения ABBYY используют более 40 миллионов пользователей в 200 странах мира

Проекты

Заказчиками ABBYY являются, в том числе, «Альфа-Банк», «Райффайзенбанк», «Сибур», «Транснефть», «Роснефть», «Кофемания».

Технологии распознавания текстов ABBYY применялись в финансируемых Еврокомиссией проектах по созданию электронных библиотек Gutenberg и META-e, оцифровке архивов в Хартли. В 2014 году ABBYY совместно с Государственным музеем Л. Н. Толстого реализовала краудсорсинговый проект «Весь Толстой в один клик», в результате которого создана электронная версия 90-томного собрания сочинений писателя

Продукты компании

ABBYY FineReader

Это программа для оптического распознавания символов,позволяет переводить изображения документов (фотографий, результатов сканирования, PDF-файлов) в электронные редактируемые форматы. В частности, в Microsoft Word, Microsoft Excel, Microsoft Powerpoint, Rich Text Format, HTML, PDF/A, searchable PDF, CSV и текстовые (plain text) файлы. Начиная с 11 версии файлы можно сохранять в формате djvu. Версия 12 поддерживает распознавание текста на 190 языках и имеет встроенную проверку орфографии для 48 из них.

FineReader.png

ABBYY Compreno

Чтобы разобраться в нюансах положенных в основу Compreno механизмов и логике их работы, необходимо понять фундаментальную концепцию проекта, заключающуюся в следующем. На каком бы языке цивилизованные люди ни говорили, у понятий, которые они обозначают словами, гораздо больше схожего, чем различного. Все мы живем в домах, пользуемся мебелью, телефонами, ездим на машинах, ходим на работу в офисы, летаем на самолетах и т.д. Эти понятия общие и не зависят от языка с точки зрения того, какими мы их себе представляем. Уловив эту связующую нить, в ABBYY построили независимую от конкретного языка универсальную семантическую иерархию понятий.

Семантическая иерархия понятий представляет собой универсальное для всех языков дерево, толстые ветви которого являются более общими понятиями (например, «движение» ), а тонкие — более специфическими смысловыми значениями, структурированными от общего к частному («ползать», «летать», «ходить пешком», «бегать» и т.д.). Если речь идет про руководителя организации, то во главе данного лексического класса фигурирует понятие «лидер», а в подклассах представлены более частные понятия, такие, как «босс», «начальник», «руководитель», «шеф» и прочие слова и словосочетания, являющиеся своего рода листочками на дереве понятий.

ABBYY-Compreno-1.jpg

Такая древовидная структура обеспечивает наследование свойств от предков к потомкам и позволяет избегать неоднозначностей в процессе перевода предложений с одного языка на другой. Вторым крупным блоком платформы Compreno является синтаксис. Важно понимать, что синтаксис описывает то, каким образом понятия связаны друг с другом внутри одного или нескольких предложений. Для кодирования этих связей в языках используются члены предложения, согласования, порядок слов, падежи, различные служебные слова, союзы, предлоги и много всего остального. Синтаксис — это, образно говоря, большой конструктор из перечисленных элементов. Необходимо упомянуть про одну важную вещь, которую необходимо учитывать при синтаксическом разборе текста, — подстановки и связи между словами, имеющие место тогда, когда мы пропускаем, или заменяем какое-либо слово, но понимаем, что оно все равно есть. Например: «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени». В данном случае мы два раза заменили слово «мальчик» местоимениями «он» и «него», и машине важно понимать, что это один и тот же объект, и восстанавливать пропущенные узлы.

ABBYY-Compreno-2.jpg

ABBYY Lingvo

ABBYY Lingvo - это компьютерная программа и семейство электронных словарей. Слово «lingvo» в переводе с языка эсперанто (международный искусственный социализованный язык, то есть язык, созданный для международного общения и применяемый на практике) означает «язык», о чём есть статьи в словарях ABBYY Lingvo (LingvoUniversal и LingvoComputer). Первая версия программы вышла в 1990 году, и называлась она LINGVO 1.0 (LINGuist VOlume v.1.0). Затем в 2008 году, компания представила новую версию электронного словаря ABBYY Lingvo x3. Программа была написана в нескольких вариантах.

  • Продукт ABBYY Lingvo х3 Европейская версия включает 130 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, немецкий, португальский и французский языки и обратно.
  • Продукт ABBYY Lingvo x3 Многоязычная версия включает 150 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, китайский, латинский, немецкий, португальский, турецкий, украинский и французский языки и обратно.
    ABBYY Lingvo x5.png
  • Продукт ABBYY Lingvo х3 Английская версия включает 57 общелексических и тематических англо-русских и русско-английских словарей.
  • Мобильный многоязычный словарь ABBYY Lingvo x3 — словарь для смартфонов, коммуникаторов и КПК, содержащий 38 современных полных словарей для 8 языков.

Все версии содержат толковые словари английского языка (Oxford и Collins) и Большой толковый словарь русского языка Ефремовой Т. Ф.. Далее компания выпустила версию ABBYY Lingvo х5, которая также была написана в нескольких вариациях

  • Продукт ABBYY Lingvo x5 Английский язык Домашняя версия включает 25 общелексических словаря для англо-русского и русско-английского направлений перевода, а также полностью переработанные и обновленные издания словарей New Oxford American Dictionary и Oxford Dictionary of English, толковые русские словари.
  • Продукт ABBYY Lingvo x5 Английский язык Профессиональная версия включает 67 общелексических, толковых, грамматических и тематических словарей для англо-русского и русско-английского направлений перевода, а также полностью переработанные и обновленные издания словарей New Oxford American Dictionary и Oxford Dictionary of English, толковые русские словари.
  • Продукт ABBYY Lingvo x5 9 языков Домашняя версия включает 65 общелексических словаря для перевода слов и словосочетаний. Версия «9 языков» включает в себя русский, английский, немецкий, французский, испанский, итальянский, португальский, греческий и финский языки. В версию включены толковые и общелексические словари, а также полностью переработанные и обновленные издания словарей New Oxford American Dictionary и Oxford Dictionary of English 2010 года, русские толковые словари.
  • Продукт ABBYY Lingvo x5 9 языков Профессиональная версия включает 152 общелексических, толковых, грамматических и тематических словаря для перевода слов и словосочетаний. Версия «9 языков» включает в себя русский, английский, немецкий, французский, испанский, итальянский, португальский, греческий и финский языки.
  • Продукт ABBYY Lingvo x5 20 языков Домашняя версия включает свыше 90 общелексических словарей на английском, немецком, французском, испанском, итальянском, португальском, китайском, турецком, украинском, латинском, венгерском, греческом, датском, казахском, нидерландском, норвежском, польском, татарском, финском языках. В версию включены толковые и общелексические словари.
  • Продукт ABBYY Lingvo x5 20 языков Профессиональная версия включает 204 общелексических, толковых, грамматических и тематических словаря на английском, немецком, французском, испанском, итальянском, португальском, китайском, турецком, украинском, латинском, венгерском, греческом, датском, казахском, нидерландском, норвежском, польском, татарском, финском языках. В версию включены толковые, общелексические и тематические словари.

И самая последняя, на сегодняшний день версия данного продукта называется ABBYY Lingvo х6. Вышла она в 2014 году.

В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка.

В состав программы входит обучающий модуль Lingvo Tutor, помогающий запоминать новые слова.

SmartCAT

SmartCAT - это система автоматизированного перевода, включающая память переводов, машинный перевод, управление глоссариями, встроенные словари ABBYY Lingvo, функцию совместной работы переводчиков над одним документом. Программа облачная, не требует установки на компьютер, для работы нужен только браузер. Имеется возможность прямого поиска переводчиков, редакторов и корректоров. SmartCAT поддерживает разнообразные форматы исходных документов. Пользовательский интерфейс и документация SmartCAT доступны на русском и английском языках. Разработан данный продукт российским программистом Владимир Гусаковым в 2015 году. Мобильное приложение в данный момент разрабатывается.

Smartcat-mid-1.jpg

ABBYY FlexiCapture

Программное обеспечение ABBYY FlexiCapture представляет собой профессиональную систему потокового ввода данных и документов. ABBYY FlexiCapture позволяет автоматизировать процессы извлечения информации из бумажных документов и сохранять данные внутри информационной системы организации. Решение является универсальным и подходит для больших и малых компаний, государственных и образовательных учреждений. Характкристики:

  • Отказоустойчивость и распределение нагрузки. Серверные компоненты ABBYY FlexiCapture 10 можно устанавливать на отказоустойчивые кластеры и кластеры с балансировкой нагрузки. Благодаря этому достигается непрерывность рабочих процессов, доступность и сохранность важной информации даже при серьезных отказах оборудования и каналов связи.
  • Самообучение. Технологии самообучения системы позволяют автоматизировать создание классификаторов документов и гибких описаний. Через классификатор документов система потокового ввода данных определяет тип документов. Затем для нахождения полей, из которых требуется извлечь информацию, используется гибкое описание. Специалисты могут вносить изменения в создаваемые программой гибкие описания и классификаторы – это повышает качество нахождения полей для извлечения данных.
  • Web-станция верификации и удаленная станция сканирования. В приложении реализовано взаимодействие рабочих станций операторов с сервером системы через Интернет. Web-интерфейс станции верификации данных позволяет проверять данные дистанционно. Поддерживается возможность дистанционной установки через Интернет.
  • Работа с документами любых типов. Поддерживаются структурированные (экзаменационные тесты, бланки, анкеты, страховые формы, налоговые декларации и т. д.), слабоструктурированные (заказы на покупку, счета, накладные и т. д.) и неструктурированные документы (контракты, статьи, письма и т. д.).
  • Системные возможности. Решение предлагает два типа установки, которые позволяют работать с системой на одной рабочей станции или масштабировать решение на всю корпоративную сеть.
  • Интеграция. Программный интерфейс предоставляется через web-сервис на базе протоколов SOAP и HTTP, реализована поддержка .NET-языков. Для настройки экспорта, импорта и правил проверки используются стандартные языки сценариев. Приложение может интегрироваться с продуктами сторонних разработчиков.
3121624 1.jpg

Ссылки