11 марта 2009 г.
Стивен Вольфрам, ученый, разработавший популярную программу компьютерной алгебры Mathematica, в мае запустит сервис, который перевернет представления о поиске информации в интернете. Ресурс Wolfram Alpha будет вычислять ответы на вопросы, заданные на естественном языке.
Что значит вычислять? Обычный поисковик ищет ответы на запрос в уже существующей информации. Если никто раньше на этот вопрос, заданный в схожей форме, не отвечал, пользователь уйдет, несолоно хлебавши.
В основе Wolfram Alpha лежит "движок" Mathematica. В него встроен мощный логический механизм, который может делать выводы, имея данные и математическую модель. Этот подход распространен на области, слабо связанные с математикой, в частности, географию, бизнес и кулинарные рецепты.
Wolfram Alpha может, например, не только отвечать на вопросы вроде ?Где находится Египет?? (простые поисковики с таким научились справляться), но и ?Где завтра в полдень будет находиться МКС??. Для того чтобы ответить на последний вопрос, нужно понять, когда наступит завтра, а также иметь математическую модель движения МКС или рассчитать ее, исходя из имеющихся о станции данных. Обычные поисковики этим не занимаются. Wolfram Alpha для этого создан.
Хотя идея Вольфрама в своем роде уникальна, нельзя сказать, что до него исследователи, ученые и программисты не пытались запускать схожие сервисы.
Так, например, британская компания True Knowledge уже открыла одноименный поисковик фактов, распознающий вопросы, заданные на английском языке. Он может ответить на вопросы вроде ?Сколько лет Стиву Джобсу??, ?Каково население Соединенных Штатов?? и ?Который сейчас час в Москве??. На более сложные, вроде просьбы узнать, сколько получится, если население США поделить надвое, True Knowledge отвечать не умеет. По словам основателя True Knowledge, именно они являются ближайшим аналогом Wolfram Alpha.
Создатели другого поисковика, PowerSet, попытались формализовать утверждения, находящиеся в энциклопедии Wikipedia и базе данных фактов FreeBase. Как таковых ответов PowerSet не дает, но предоставляет в меру сил выдержки из энциклопедических источников. Другими словами, ни о каком вычислении ответов речи не идет.
Таинственный Вольфрам
Новый проект разрабатывался в строгом секрете командой из сотни человек. Про него до сих пор толком ничего не известно, однако после анонса стали появляться люди, которые видели систему в действии, а также люди, которые видели тех, кто видел систему.
Первым очевидцем стал Нова Спивак (Nova Spivack), один из основоположников концепции семантического веба, которому Вольфрам продемонстрировал систему. Спивак изложил свои впечатления в восторженной статье. Он сравнивает Wolfram Alpha с электронным мозгом, успокаивает читателей, говоря, что система не похожа на компьютер HAL из ?Одиссеи 2001 года?, и утверждает, что не нашел изъянов в механизме обработки запросов на естественном языке.
Гораздо более объективно свои впечатления изложил Даг Ленат (Doug Lenat), основатель проекта искусственного интеллекта Cyc, призванного упорядочить повседневные знания и обучить программу отвечать на соответствующие вопросы, рассуждая, как человек. Ленат потратил на изучение Wolfram Alpha два часа, беседовал с Вольфрамом и выяснил несколько интересных подробностей о системе.
Во-первых, поисковиком Wolfram Alpha можно назвать с большой натяжкой. Он в крайне редких случаях обращается к внешним источникам данных. Команда Стивена Вольфрама потратила несколько лет на создание базы данных фактов, а также большого числа математических моделей. Когда пользователь задает вопрос, данные для ответа будут браться именно из этой базы.
Во-вторых, речь не идет о запросах на естественном языке, хотя сам язык запросов очень похож на английский. В то же время система понимает краткие запросы, схожие с теми, к которым привыкли пользователи обычных поисковиков.
В-третьих, ответ выводится в виде диаграмм, таблиц и графиков. Например, если ввести ?gdp? (ВВП), то на экране появится график изменения ВВП страны, где находится пользователь, за последние тридцать лет. Если ввести ?gdp France / Germany?, будет выведен график соотношения французского ВВП к немецкому за тот же срок.
В-четвертых, универсальный вычислитель ответов вычисляет далеко не все, и не вполне дружит с логикой. Ленат приводит следующий пример: на вопрос ?с какой скоростью растут волосы?? Wolfram Alpha не ответит, но при запросе ?10 сантиметров в год? выведет длинный список вещей и явлений, так или иначе связанных с этой скоростью. В этом списке есть и скорость волос, но сопоставить ее с заданным вопросом Wolfram Alpha не может. Другой пример - Wolfram Alpha может указать поголовье скота в Чикаго, но не число млекопитающих.
Особо ехидные наблюдатели уже заготовили списки своих вопросов для майского тестирования, вроде ?Кто был папой римским в 1066 году??, ?Сколько голов забил Пеле?? и ?Сколько раз Мадонна выходила замуж??. True Knowledge, по крайней мере, не смог ответить ни на один.
Трудно сказать, какие перспективы ждут новый проект. Очень часто разработка математиков в конечном итоге оказывается полезна только математикам. Кроме того, неясно, как Стивен Вольфрам сотоварищи собираются проверять накопленные системой факты. А главное, им предстоит научить пользователей правильно задавать вопросы.
Александр Амзин