Hakia

Hakia

За последние несколько недель в сети замечены дискуссии о том что компания Microsoft рассматривает вопрос о приобретении поисковой компании Powerset.
К выгоде от этой сделки я отношусь несколько скептически потому что никто особо не интересовался этой компанией покуда она не заявила что Microsoft является их потенциальным покупателем.

От скептика к пользователю.
Powerset является единственным конкурентом Hakia.

Hakia привлекла мое внимание первоначально в силу того что является Нью-Йоркской компанией.
Я был зантригован, поскольку я воспользовался их поисковой системой и она превзошла все мои ожидания.
Я был просто ошеломлен результатом поскольку всегда настроен скептически в отношении всех вещей, касающихся искусственного интеллекта, распознавания речи, обработки естественного языка и других нечетких технологий подобных этим.

Hakia изменила мое мнение по крайней мере в области распознавания естественного языка.
По сути, эту поисковую систему я стал использовать когда Google дает не удовлетворительную выдачу.

Hakia и Powerset являются основным сегментом естественного языкового поиска.
Идея обоих служб заключена в том что вы действительно сможете задавать конкретные вопросы и получать на них ответы.
Но есть и огромные различия в реализации сервиса этих компаний.

И эти различия привели меня обратно к моему скептицизму относительно приобретения Powerset компанией Microsoft.
Powerset индексирует в 750 раз медленнее чем Hakia!

У меня нет опыта в вопросе обработки естественного языка или семантическом поиске как и в любом другом полнотекстовом поиске.

Но я могу сказать что Hakia на голову превосходит технологии Powerset.
Почему я это говорю?

Ну, во-первых, как я уже говорил эта система работает.
Это реальная живая поисковая система.
Я ее использую.

Но я не могу сказать то же самое про Powerset.
Поскольку Powerset не выдает мне ничего кроме поиска по Wikipedia.

По большей части Powerset проигрывает потому что не в состоянии предложить реальную поисковую систему.
Согласно их собственной информации на индексацию страницы уходить до 25 секунд при средних 25 запросах на одну страницу.

Hakia же тратит 1/30 секунды на индексацию страницы.

Думаю данные говорят сами за себя:)

Если предположить что Powerset делает это медленнее потому что подходит к этому серьезнее, превосходно индексируя своим магическим способом, что делает его более ценным чем Hakia…
Но, увы, это не соответствует действительности.

Hakia действительно умеет читать.
Эта поисковая система делает нечто под названием «онтологическая семантика».
Hakia на протяжении последних 4х лет разрабатывала онтологию для человеческого выражения.

Это означает что когда Hakia индексирует страницы то пытается взглянуть на каждое предложение и соотнести вопросы с ответами.
Любой вопрос предполагает несколько ответов.
Эти вопросы кодируются и называются в Hakia — Qdex — или индекс вопроса.

Для того чтобы иметь возможность выяснить какие релевантные вопросы соответствуют поисковому запросу приходиться буквально читать запрос.
Под чтением я подразумеваю понимание актуального семантического смысла предложения.
А это большое дело.

Powerset использует статистику и синтаксис но не может реально читать.
Итак, в то время как Hakia сосредоточена на распознавании, Powerset фактически не пытается понять какие запросы имеются ввиду.
Он использует систему, которая разбирает синтаксис предложения и предположения относительно совпадений основанные на статистике.

Но этот подход означает, что для вопросов, которые не соответствуют ранее возникшим синтаксическим структурам, система не сможет найти ответы, даже если эти ответы есть на самом деле в базе данных.

Powerset получил своего рода временную выгоду от Силиконовой Долины.
Если на данный момент вы предположите что это правда, или даже возможность что Hakia это супер сервис или технология, или даже предположите что Hakia эквивалентна Powerset, почему Powerset все это время праздновал победу в то время пока Hakia находилась в тени?

Единственный ответ который я могу дать заключается в том, что западное побережье Силиконовой Долины такое место, куда редко попадают слухи как и выходят.
Это должно быть шокирующим, когда Нью-Йоркская компания разрабатывает такую технологию, что пугает кого то из Силиконовой Долины.
Просто мысли.

В любом случае думаю стоит отметить что на данный момент мы имеем дело с явным лидером в области обработки естественного языка и технологии поиска.

Основано на: Media Darling Powerset vs. Non-Media Darling Hakia
Автор: Hank Williams
в моей вольной интерпретации.

Реклама

2 responses to “Hakia

  1. Уведомление: Hakia+PubMed « Дэйтинг бизнес для русскоговорящих

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s