Российский стартап создал платформу для распознавания естественного языка
Стартап «Мивар» создал программную платформу Tel!Mi для распознавания текстовых сообщений, написанных на естественном языке. Об этом сообщает корреспондент «Ленты.ру» с мероприятия компании.
По утверждению генерального директора «Мивара» Олега Варламова, на данный момент система способна распознавать не только отдельные слова, но и сложные предложения, сформулированные в естественной разговорной форме, но без двусмысленностей или шуток.
Она предназначена для создания совместно с партнерами систем реферирования и анализа текстов. Например, стартап GAMP Tech готовит для международного рынка продукт «Мобильный репетитор Teach!Mi». Также совместно с крупным российским банком готовится пилотный проект по созданию автоматизированного ответчика справочной системы.
Для распознавания текстов сначала проводится обучение искусственного интеллекта миварным методом: слова сортируются по признакам вещь — свойство — отношение и представляются виде многомерного графа (схема, где слова являются вершинами и соединены связями, показывающими их взаимоотношение). Например, словарь Ожегова из 150 тысяч понятий представляется в виде 17-мерного вектора. Обучение Tel!Mi этим понятиям сейчас занимает 83 минуты.
По утверждению Варламова технология «Минвара» не имеет аналогов сейчас. Например, она позволяет проводить обучение быстрее чем Compreno компании ABBYY, которая также выстраивает семантические связи в виде графа. Варламов также объяснил, что в IBM Watson анализ текста производится только по установленным шаблонам, а прохождение теста Тьюринга в этом году он объяснил глупостью людей, определяющих компьютер.
Однако, Татьяна Даниэлян, заместитель директора по разработке технологий компании ABBYY, не подтвердила слов Варламова: «Мы не проводили тестирования этой [Tel!Mi] технологии, а на базе описаний в материалах компании сделать выводы невозможно». В свободном доступе Compreno на рынке нет.
Создание систем распознавания текста и речи, изложенных естественным языком, сейчас является одной из мировых тенденций. Кроме вышеперечисленных систем они активно используются, например, в голосовых помощниках мобильных устройств: Microsoft Cortana, Apple Siri и Google Now.