04.07.2019

№219.017.a4c3

Результат интеллектуальной деятельности: СПОСОБЫ И СИСТЕМЫ ДЛЯ СОЗДАНИЯ ЗАМЕНЯЮЩЕГО ЗАПРОСА ДЛЯ ВВЕДЕННОГО ПОЛЬЗОВАТЕЛЕМ ЗАПРОСА

Вид РИД

Изобретение

Юридическая информация Юридическая информация Свернуть Развернуть

Авторы

Губанов Сергей Дмитриевич

Правообладатели

№ охранного документа

0002693328

Дата охранного документа

02.07.2019

Краткое описание РИД Краткое описание РИД Свернуть Развернуть

Аннотация: Изобретение относится к способу и серверу для создания заменяющего запроса для введенного пользователем запроса. Технический результат заключается в автоматизации создания заменяющего запроса. Сервер обеспечивает выбор набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов, для набора заменяющих запросов-кандидатов извлечение указания на данные о взаимозависимости прошлых запросов, выбор приближенного запроса из набора заменяющих запросов-кандидатов на основе сходства строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов и частоты использования каждого из набора заменяющих запросов-кандидатов, для каждой пары, состоящей из приближенного запроса и данного одного из набора заменяющих запросов-кандидатов, создание соответствующего вектора свойств, представляющего предыдущие преобразования между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов, создание соответствующего параметра ранжирования для каждого приближенного вектора свойств, определение заменяющего запроса для введенного пользователем запроса среди набора заменяющих запросов-кандидатов на основе соответствующих параметров ранжирования. 2 н. и 18 з.п. ф-лы, 9 ил.

Реферат Реферат Свернуть Развернуть

ОБЛАСТЬ ТЕХНИКИ

[1] Настоящая технология относится к осуществляемой на компьютере обработке запроса и, конкретнее, к способам и системам для создания заменяющего запроса для введенного пользователем запроса.

УРОВЕНЬ ТЕХНИКИ

[2] Орфографические ошибки в запросах, конкретнее, орфографические ошибки в поисковых запросах, которые вводятся в обычные поисковые системы, часто усложняют проведение качественного поиска и предоставление релевантных поисковых результатов в ответ на них.

[3] В некоторых случаях, написанные с ошибкой запросы сложнее исправить с помощью обычных подходов с использованием словаря, чем написанные с ошибкой слова в обычном написанном тексте. Это возникает из-за того, что поисковые запросы часто включают в себя слова, которые не являются устоявшимися в данном языке в отличие от обычных существительных или имен. Кроме того, в отличие от устоявшихся слов в языке, новые запросы появляются постоянно.

[4] Для того чтобы справляться с подобными трудностями, было проведено исследование для разработки программ-корректоров правописания запросов, которые были бы сфокусированы на использовании поисковых логов, а не на составленных людьми словарях, для получения знаний о правописании и использовании слов в поисковых запросах.

[5] В общем случае, обычные программы-корректоры правописания запросов, которые используют поисковые логи, разработаны на основе того принципа, что для неправильно написанного запроса в поисковых логах доступна прошлая информация, касающаяся этого неправильно написанного запроса, прошлая информация, касающаяся этого неправильно написанного запроса, может указывать на предыдущие преобразования между данным неправильно написанным запросом и его потенциальными исправлениями. Подобная прошлая информация может быть явной: пользователь явно выполнил новый поиск в соответствии с новым запросом, который по существу был аналогичен неправильно написанному запросу сразу после выполнения поиска в соответствии с этим неправильно написанным запросом. Подобная информация так может быть неявной: пользователь выполнил поиск в соответствии с неправильно написанным запросом, но поисковая система обнаружила потенциальную ошибку и предоставила пользователю поисковые результаты, которые отвечали на исправленный запрос, и с которыми пользователь достаточно много взаимодействовал (и при этом пользователь не вводил явно новый поисковый запрос).

[6] Тем не менее, как было указано ранее, поскольку новые запросы появляются постоянно, в поисковых логах может быть недостаточно данных или прошлой информации о преобразованиях, связанных с этими новыми запросами. То же самое применимо к редким ошибками в правописании поисковых запросов. Таким образом, в случае когда новый поисковый запрос написан неправильно или введен пользователем с ошибкой, обычные программы-корректоры правописания запросов, которые используют поисковые логи, плохо подходят для предоставления потенциальных исправлений для этих потенциально введенных с ошибкой новых запросов.

[7] По вышеизложенным причинам существует необходимость в новых способах и системах для создания заменяющих запросов для новых введенных пользователем запросов, которые были потенциально введены с ошибкой.

РАСКРЫТИЕ ТЕХНОЛОГИИ

[8] Варианты осуществления настоящей технологии были разработаны на основе предположений разработчиков о том, что, несмотря на то, что поисковые логи используются корректорами правописания запросов для исправления неправильно написанных запросов, обычные корректоры правописания запросов, использующие поисковые логи, плохо подходят для исправления введенных запросов, которые были потенциально введены с ошибкой, поскольку введенные с ошибкой запросы могут быть введены в поисковую системы в первый раз и, следовательно, в поисковых логах может отсутствовать информация о подобных новых запросах, введенных с ошибкой. Варианты осуществления настоящего технического решения были разработаны с учетом определения разработчиками по меньшей мере одного технического недостатка, связанного с известным уровнем техники. Следовательно, разработчики разработали способы и системы для создания заменяющего запроса для введенного пользователем запроса, которые могут использоваться даже в тех случаях, когда введенный пользователем запрос ранее никогда не использовался данным сервисом, и когда введенный пользователем запроса потенциально введен с ошибкой. Другими словами, варианты осуществления настоящей технологии могут использоваться для исправления введенного с ошибкой запроса даже когда в системе отсутствуют данные о неправильно введенном запросе по той причине, что он редкий, или потому, что подобная ошибка в правописании никогда ранее не вводилась в систему.

[9] Первым объектом настоящей технологии является способ создания заменяющего запроса для введенного пользователем запроса. Введенным пользователем запрос был получен в связи с исполняемым на компьютере сервисом, который предоставляется сервером. Введенный пользователем запрос никогда ранее не использовался в исполняемом на компьютере сервисе. Введенный пользователем запрос потенциально был введен с ошибкой. Способ выполняется сервером. Способ включает в себя выбор сервером набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов, использованных в исполняемом на компьютере сервисе, на основе сходства строк между введенным пользователем запросом и каждым из множества прошлых запросов. Способ также включает в себя, для набора заменяющих запросов-кандидатов, извлечение сервером указания на данные о взаимозависимости прошлых запросов. Данные о взаимозависимости прошлых запросов указывают на предыдущие преобразования между каждой парой заменяющих запросов-кандидатов в наборе заменяющих запросов-кандидатов. Введенный пользователем запрос не включен в набор заменяющих запросов-кандидатов. Данные о взаимозависимости прошлых запросов не указывают на какие-либо предыдущие преобразования между введенным пользователем запросом и каким-либо запросом из набора заменяющих запросов-кандидатов. Способ также включает в себя выбор сервером приближенного запроса из набора заменяющих запросов-кандидатов на основе: (i) сходства строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов; и (ii) частоты использования каждого из набора заменяющих запросов-кандидатов, причем пользовательская частота основана на прошлых пользовательских взаимодействиях с исполняемым на компьютере сервисом. Способ также включает в себя, для каждой пары, состоящей из приближенного запроса и данного одного из набора заменяющих запросов-кандидатов, создание сервером соответствующего вектора свойств на основе данных о взаимозависимости прошлых запросов между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Данный вектор свойств представляет собой предыдущие преобразования между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Соответствующий вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Способ также включает в себя создание сервером соответствующего параметра ранжирования для каждого приближенного вектора свойств. Параметр ранжирования данного приближенного вектора свойств указывает на вероятность того, что соответствующий один из набора заменяющих запросов-кандидатов является заменяющим запросом для введенного пользователем запроса. Способ также включает в себя определение сервером заменяющего запроса для введенного пользователем запроса среди набора заменяющих запросов-кандидатов на основе соответствующих параметров ранжирования.

[10] В некоторых вариантах осуществления способа, выбор приближенного запроса из набора заменяющих запросов-кандидатов включает в себя выбор сервером более одного приближенного запроса из набора заменяющих запросов-кандидатов. Для каждой пары, состоящей из одного из более чем одного приближенного запроса и данного одного из набора заменяющих запросов-кандидатов, создание соответствующего вектора свойств включает в себя создание сервером соответствующего вектора свойств на основе данных о взаимозависимости прошлых запросов между данным одним из более чем одного приближенного запроса и соответствующим данным одним из набора заменяющих запросов-кандидатов. Данный вектор свойств представляет собой предыдущие преобразования между данным одним из более чем одного приближенного запроса и соответствующим одним из набора заменяющих запросов-кандидатов. Способ далее включает в себя объединение сервером более одного вектора свойств, которые представляют предыдущие преобразования между каждым из более чем одного приближенного запроса и данным одним из набора заменяющих запросов-кандидатов, в соответствующий объединенный вектор свойств. Соответствующий объединенный вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов.

[11] В некоторых вариантах осуществления способа, выбор набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов, использованных в исполняемом на компьютере сервисе, на основе сходства строк между введенным пользователем запросом и каждым из множества прошлых запросов, включает в себя вычисление сервером редакционного расстояния между введенным пользователем запросом и каждым из множества прошлых запросов.

[12] В некоторых вариантах осуществления способа, редакционное расстояние является расстоянием Левенштейна.

[13] В некоторых вариантах осуществления способа, множество прошлых запросов ранжируется на основе соответствующих связанных с ними расстояний Левенштейна, и выбор набора заменяющих запросов-кандидатов включает в себя выбор сервером заранее определенного числа наиболее высоко ранжированных прошлых запросов из множества прошлых запросов.

[14] В некоторых вариантах осуществления способа, выбор более чем одного приближенного запроса из набора заменяющих запросов-кандидатов включает в себя размещение сервером каждого из набора заменяющих запросов-кандидатов на основе (i) сходства строк с введенным пользователем запросом и (ii) частоты использования. Выбор более чем одного приближенного запроса из набора заменяющих запросов-кандидатов также включает в себя выбор сервером всех заменяющих запросов-кандидатов из набора заменяющих запросов-кандидатов, которые размещены в области допустимого приближения гипотезы, как более чем одного приближенного запроса. Область допустимого приближения гипотезы ограничена пороговой линией частоты использования и пороговой линией сходства строк.

[15] В некоторых вариантах осуществления способа, пороговая линия частоты использования совпадает с пороговым значением частоты использования. Все значения частоты использования, которые меньше или равны пороговому значению частоты использования, являются допустимыми значениями частоты использования для характеристики частоты использования, относящейся к приближению гипотезы. Пороговая линия сходства строк совпадает с пороговой линией сходства строк. Все значения сходства строк, которые меньше или равны пороговому значению сходства строк, являются допустимыми значениями сходства строк для характеристики сходства строк, относящейся к приближению гипотезы.

[16] В некоторых вариантах осуществления способа, объединение более чем одного вектора свойства в соответствующий объединенный вектор свойств включает в себя по меньшей мере одно из (i) вычисление сервером усредненного вектора на основе более чем одного вектора свойств и (ii) вычисление сервером среднего вектора на основе более чем одного вектора свойств.

[17] В некоторых вариантах осуществления способа, создание соответствующего параметра ранжирования для каждого приближенного вектора свойств выполняется с помощью алгоритма машинного обучения (MLA).

[18] В некоторых вариантах осуществления способа, алгоритм машинного обучения представляет собой линейное ранжирование.

[19] Еще одним объектом настоящей технологии является сервер для создания заменяющего запроса для введенного пользователем запроса. Введенным пользователем запрос был получен в связи с исполняемым на компьютере сервисом, который предоставляется сервером. Введенный пользователем запрос никогда ранее не использовался в исполняемом на компьютере сервисе. Введенным пользователем запрос потенциально был введен с ошибкой. Сервер выполнен с возможностью осуществлять выбор набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов, использованных в исполняемом на компьютере сервисе, на основе сходства строк между введенным пользователем запросом и каждым из множества прошлых запросов. Сервер также выполнен с возможностью, для набора заменяющих запросов-кандидатов, осуществлять извлечение указания на данные о взаимозависимости прошлых запросов. Данные о взаимозависимости прошлых запросов указывают на предыдущие преобразования между каждой парой заменяющих запросов-кандидатов в наборе заменяющих запросов-кандидатов. Введенный пользователем запрос не включен в набор заменяющих запросов-кандидатов. Данные о взаимозависимости прошлых запросов не указывают на какие-либо предыдущие преобразования между введенным пользователем запросом и каким-либо запросом из набора заменяющих запросов-кандидатов. Сервер также выполнен с возможностью выбирать приближенный запрос из набора заменяющих запросов-кандидатов на основе (i) сходства строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов и (ii) частоты использования каждого из набора заменяющих запросов-кандидатов. Пользовательская частота основана на прошлых пользовательских взаимодействиях с исполняемым на компьютере сервисом. Сервер также выполнен с возможностью, для каждой пары приближенного запроса и одного из набора заменяющих запросов-кандидатов, осуществлять создание соответствующего вектора свойств на основе данных о взаимозависимости прошлых запросов между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Данный вектор свойств представляет собой предыдущие преобразования между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Соответствующий вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов. Сервер также выполнен с возможностью осуществлять создание соответствующего параметра ранжирования для каждого приближенного вектора свойств. Параметр ранжирования данного приближенного вектора свойств указывает на вероятность того, что соответствующий один из набора заменяющих запросов-кандидатов является заменяющим запросом для введенного пользователем запроса. Сервер также выполнен с возможностью осуществлять определение заменяющего запроса для введенного пользователем запроса среди набора заменяющих запросов-кандидатов на основе соответствующих параметров ранжирования.

[20] В некоторых вариантах осуществления сервера, сервер выполнен с возможностью осуществлять выбор приближенного запроса из набора заменяющих запросов-кандидатов включает в себя сервер, выполненный с возможностью осуществлять выбор сервером более одного приближенного запроса из набора заменяющих запросов-кандидатов. Для каждой пары, состоящей из одного из более чем одного приближенного запроса и данного одного из набора заменяющих запросов-кандидатов, сервер выполнен с возможностью осуществлять создание соответствующего вектора свойств включает в себя сервер, выполненный с возможностью осуществлять создание соответствующего вектора свойств на основе данных о взаимозависимости прошлых запросов между данным одним из более чем одного приближенного запроса и соответствующим данным одним из набора заменяющих запросов-кандидатов. Данный вектор свойств представляет собой предыдущие преобразования между данным одним из более чем одного приближенного запроса и соответствующим одним из набора заменяющих запросов-кандидатов. Сервер выполнен с возможностью осуществлять объединение сервером более одного вектора свойств, которые представляют предыдущие преобразования между каждым из более одного приближенного запроса и данным одним из набора заменяющих запросов-кандидатов, в соответствующий объединенный вектор свойств. Соответствующий объединенный вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов.

[21] В некоторых вариантах осуществления сервера, сервер выполнен с возможностью осуществлять выбор набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов, использованных в исполняемом на компьютере сервисе, на основе сходства строк между введенным пользователем запросом и каждым из множества прошлых запросов, включает в себя сервер, который выполнен с возможностью осуществлять вычисление сервером редакционного расстояния между введенным пользователем запросом и каждым из множества прошлых запросов.

[22] В некоторых вариантах осуществления сервера, редакционное расстояние является расстоянием Левенштейна.

[23] В некоторых вариантах осуществления сервера, множество прошлых запросов ранжировано на основе соответствующих связанных с ними расстояний Левенштейна. Сервер выполнен с возможностью осуществлять выбор набора заменяющих запросов-кандидатов включает в себя сервер, который выполнен с возможностью выбирать заранее определенное число наиболее высоко ранжированных прошлых запросов из множества прошлых запросов.

[24] В некоторых вариантах осуществления сервера, сервер выполнен с возможностью осуществлять выбор более чем одного приближенного запроса из набора заменяющих запросов-кандидатов включает в себя сервер, выполненный с возможностью осуществлять размещение сервером каждого из набора заменяющих запросов-кандидатов на основе (i) сходства строк с введенным пользователем запросом и (ii) частоты использования. Также включает в себя сервер, выполненный с возможностью осуществлять выбор всех заменяющих запросов-кандидатов из набора заменяющих запросов-кандидатов, которые размещены в области допустимого приближения гипотезы, как более чем одного приближенного запроса. Область допустимого приближения гипотезы ограничена пороговой линией частоты использования и пороговой линией сходства строк.

[25] В некоторых вариантах осуществления сервера, пороговая линия частоты использования совпадает с пороговым значением частоты использования. Все значения частоты использования, которые меньше или равны пороговому значению частоты использования, являются допустимыми значениями частоты использования для характеристики частоты использования, относящейся к приближению гипотезы. Пороговая линия сходства строк совпадает с пороговой линией сходства строк. Все значения сходства строк, которые меньше или равны пороговому значению сходства строк, являются допустимыми значениями сходства строк для характеристики сходства строк, относящейся к приближению гипотезы.

[26] В некоторых вариантах осуществления сервера, сервер выполнен с возможностью осуществлять объединение более чем одного вектора свойства в соответствующий объединенный вектор свойств включает в себя сервер, который выполнен с возможностью осуществлять, по меньшей мере одно из (i) вычисление сервером усредненного вектора на основе более чем одного вектора свойств и (ii) вычисление сервером среднего вектора на основе более чем одного вектора свойств.

[27] В некоторых вариантах осуществления сервера, сервер выполнен с возможностью осуществлять создание соответствующего параметра ранжирования для каждого приближенного вектора свойств с помощью алгоритма машинного обучения (MLA).

[28] В некоторых вариантах осуществления сервера, алгоритм машинного обучения представляет собой линейное ранжирование.

[29] В контексте настоящего описания «сервер» подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один компьютер или одну компьютерную систему, однако ни то, ни другое не является обязательным в отношении предлагаемой технологии. В контексте настоящей технологии, использование выражения «сервер» не означает, что каждая задача (например, полученные команды или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

[30] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. В контексте настоящего описания, термин "электронное устройство" указывает на то, что устройство может функционировать как сервер для других электронным устройств и электронных устройство, хотя это не является необходимым для настоящей технологии. Таким образом, примерами электронных устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Важно иметь в виду, что в контексте настоящего описания факт того, что устройство функционирует как электронное устройство не означает того, что оно не может функционировать как сервер для других электронных устройств. Использование выражения «электронное устройство» не исключает возможности использования множества электронных устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного метода.

[31] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. В контексте настоящего описания в общем случае «клиентское устройство» связано с пользователем клиентского устройства. Таким образом, некоторые (неограничивающие) варианты осуществления клиентских устройств включают в себя персональные компьютеры (настольные, ноутбуки, нетбуки и так далее), смартфоны и планшеты, а также сетевое оборудование, например, маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, функционирующее как клиентское устройство в настоящем контексте может функционировать как сервер для других клиентских устройств. Использование выражения «клиентское устройство» не исключает возможности использования множества клиентских устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного способа.

[32] В контексте настоящего описания термин «информация» включает в себя информацию любую информацию, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

[33] В контексте настоящего описания, «программный компонент» подразумевает под собой программное обеспечение (соответствующее конкретному аппаратному контексту), которое является необходимым и достаточным для выполнения конкретной(ых) указанной(ых) функции(й).

[34] В контексте настоящего описания, «носитель компьютерной информации» (также упоминаемый как носитель информации) подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д. Множество компонентов может быть объединено в носитель компьютерной информации, включая два или более мультимедийных компонента одного типа и/или два или более компонента разных типов.

[35] В контексте настоящего описания, «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. База данных может находиться на том же оборудовании, выполняющем процесс, на котором хранится или используется информация, хранящаяся в базе данных, или же база данных может находиться на отдельном оборудовании, например, выделенном сервере или множестве серверов.

[36] В контексте настоящего описания слова «первый», «второй», «третий» и и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной взаимосвязи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первая база данных" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, «первый» сервер и «второй» сервер могут являться одним и тем же программным и/или компонентами аппаратного обеспечения, а в других случаях они могут являться разными компонентами программного и/или аппаратного обеспечения.

[37] Каждый вариант осуществления настоящей технологии преследует по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

[38] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[39] Эти и другие аспекты, свойства и преимущества настоящей технологии будут лучше понятны с учетом следующего описания, прилагаемой формулы изобретения и чертежей, где:

[40] На Фиг. 1 изображена схема примера компьютерной системы для осуществления определенных вариантов системы и/или способов настоящей технологии;

[41] На Фиг. 2 представлена схема сетевой вычислительной среды, подходящей для использования совместно с некоторыми вариантами осуществления настоящей технологии;

[42] На Фиг. 3 схематически представлено множество прошлых запросов, введенных или иным образом используемых исполняемым на компьютере сервисом сервера из сетевой вычислительной среды, показанной на Фиг. 2;

[43] На Фиг. 4 представлено схематическое графическое представление области допустимого приближения гипотезы для выбора приближенного запроса из набора замещающих запросов-кандидатов, которые были выбраны из прошлых запросов, показанных на Фиг. 3, в соответствии с первым сценарием и некоторыми вариантами осуществления настоящей технологии;

[44] На Фиг. 5 схематически представлено множество пар запросов и соответствующих созданных свойств векторов в соответствии с первым сценарием и некоторыми вариантами осуществления настоящей технологии;

[45] На Фиг. 6 представлено схематическое графическое представление области допустимого приближения гипотезы для выбора более одного приближенного запроса из набора замещающих запросов-кандидатов, которые были выбраны из прошлых запросов, показанных на Фиг. 3, в соответствии со вторым сценарием и некоторыми вариантами осуществления настоящей технологии;

[46] На Фиг. 7 схематически представлено множество пар запросов и соответствующих созданных свойств векторов в соответствии со вторым сценарием и некоторыми вариантами осуществления настоящей технологии;

[47] На Фиг. 8 схематически представлена процедура объединения множества векторов свойств, показанных на Фиг. 7, в соответствии со вторым сценарием и некоторыми вариантами осуществления настоящей технологии; и

[48] На Фиг. 9 представлена блок-схема способа создания заменяющего запроса для введенного пользователем запроса в соответствии с некоторыми вариантами осуществления настоящей технологии.

ОСУЩЕСТВЛЕНИЕ

[49] Все примеры и используемые здесь условные конструкции предназначены, главным образом, для того, чтобы помочь читателю понять принципы настоящей технологии, а не для установления границ ее объема. Следует также отметить, что специалисты в данной области техники могут разработать различные схемы, отдельно не описанные и не показанные здесь, но которые, тем не менее, воплощают собой принципы настоящей технологии и находятся в границах ее объема.

[50] Кроме того, для ясности в понимании, следующее описание касается достаточно упрощенных вариантов осуществления настоящей технологии. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.

[51] Некоторые полезные примеры модификаций настоящей технологии также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящей технологии. Эти модификации не представляют собой исчерпывающего списка, и специалисты в данной области техники могут создавать другие модификации, остающиеся в границах объема настоящей технологии. Кроме того, те случаи, где не были представлены примеры модификаций, не должны интерпретироваться как то, что никакие модификации невозможны, и/или что то, что было описано, является единственным вариантом осуществления этого элемента настоящей технологии.

[52] Более того, все заявленные здесь принципы, аспекты и варианты осуществления технологии, равно как и конкретные их примеры, предназначены для обозначения их структурных и функциональных основ, вне зависимости оттого, известны ли они на данный момент или будут разработаны в будущем. Таким образом, например, специалистами в данной области техники будет очевидно, что представленные здесь блок-схемы представляют собой концептуальные иллюстративные схемы, отражающие принципы настоящей технологии. Аналогично, любые блок-схемы, диаграммы, псевдокоды и т.п. представляют собой различные процессы, которые могут быть представлены на машиночитаемом носителе и, таким образом, использоваться компьютером или процессором, вне зависимости от того, показан явно подобный компьютер или процессор, или нет.

[53] Функции различных элементов, показанных на фигурах, включая функциональный блок, обозначенный как «процессор», могут быть обеспечены с помощью специализированного аппаратного обеспечения или же аппаратного обеспечения, способного использовать подходящее программное обеспечение. Когда речь идет о процессоре, функции могут обеспечиваться одним специализированным процессором, одним общим процессором или множеством индивидуальных процессоров, причем некоторые из них могут являться общими. Более того, использование термина «процессор» или «контроллер» не должно подразумевать исключительно аппаратное обеспечение, способное поддерживать работу программного обеспечения, и может включать в себя, без установления ограничений, цифровой сигнальный процессор (DSP), сетевой процессор, интегральную схему специального назначения (ASIC), программируемую пользователем вентильную матрицу (FPGA), постоянное запоминающее устройство (ПЗУ) для хранения программного обеспечения, оперативное запоминающее устройство (ОЗУ) и энергонезависимое запоминающее устройство. Также в это может быть включено другое аппаратное обеспечение, обычное и/или специальное.

[54] Программные модули или простые модули, представляющие собой программное обеспечение, могут быть использованы здесь в комбинации с элементами блок-схемы или другими элементами, которые указывают на выполнение этапов процесса и/или текстовое описание. Подобные модели могут быть выполнены на аппаратном обеспечении, показанном напрямую или косвенно.

[55] С учетом этих примечаний, далее будут рассмотрены некоторые не ограничивающие варианты осуществления аспектов настоящей технологии.

[56] На Фиг. 1 представлена компьютерная система 100, которая подходит для некоторых вариантов осуществления настоящей технологии, причем компьютерная система 100 включает в себя различные аппаратные компоненты, включая один или несколько одно- или многоядерных процессоров, которые представлены процессором 110, твердотельный накопитель 120, память 130, которая может быть ОЗУ, сетевой модуль 140 и дисплей 150. Связь между различными компонентами компьютерной системы 100 может осуществляться с помощью одной или нескольких внутренних и/или внешних шин (не показано) (например, шины PCI, универсальной последовательной шины, высокоскоростной шины IEEE 1394, шины SCSI, шины Serial ATA и так далее), с которыми электронными средствами соединены различные аппаратные компоненты. В соответствии с вариантами осуществления настоящей технологии твердотельный накопитель 120 хранит программные инструкции, подходящие для загрузки в память 130, и использующиеся процессором 110 для отображения информации пользователю компьютерной системы 100, как будет описано далее более подробно. Например, программные инструкции могут представлять собой часть браузерного приложения 250 (см. Фиг. 2), выполняемого процессором 110. Сетевой модуль 140 никак конкретно не ограничен, и, в общем случае, позволяет устанавливать связь между различными компьютерными системами, серверами и/или иными устройствам.

[57] На Фиг. 2 показана сетевая компьютерная среда 200, подходящая для использования с некоторыми вариантами осуществления систем и/или способов настоящей технологии. Сетевая вычислительная среда 200 включает в себя электронное устройство 210, связанное с пользователем 211 (который может взаимодействовать с электронным устройством 210) и сервером 230, связанные с возможностью передачи данных с электронным устройством 210 через сеть 240 передачи данных (например, Интернет или подобное, как будет описано более подробно далее).

[58] Реализация электронного устройства 210 никак конкретно не ограничивается, но, в качестве примера, электронное устройство 210 может быть выполнено как беспроводное устройство передачи данных, например, как мобильный телефон (смартфон или радиотелефон), планшет, персональный компьютер и так далее. Тем не менее, на Фиг. 2 электронное устройство 210 представлено как смартфон.

[59] Электронное устройство 210 может включать в себя некоторые или все компоненты компьютерной системы 100, изображенной на Фиг. 1. В некоторых вариантах осуществления настоящей технологии, электронное устройство 210 включает в себя сетевой модуль 140 для связи с сервером 230 через сеть 240 передачи данных, процессор 110, память 130 и дисплей 150 например, сенсорный экран. Электронное устройство включает в себя аппаратное и/или прикладное программное, и/или системное программное обеспечение или их комбинация, для создания и передачи начального пакета 280 данных серверу 230 через сеть 240 передачи данных. То как электронное устройство 210 выполнено с возможностью создавать и передавать исходный пакет 280 данных, а также содержимое исходного пакета 280 данных - будет далее описано более подробно.

[60] Следует отметить, что тот факт, что электронное устройство 210 связано с пользователем 211, не подразумевает какого-либо конкретного режима работы, равно как и необходимости входа в систему, быть зарегистрированным, или чего-либо подобного. Другими словами, связь между пользователем 211 и электронный устройством 210 обозначает предположение о том, что пользователь 211 обладает электронным устройством 210 и может с ним взаимодействовать.

[61] В некоторых вариантах осуществления настоящей технологии сеть 240 передачи данных может представлять собой Интернет. В альтернативных вариантах осуществления технологии, не ограничивающих ее объем, сеть передачи данных может быть реализована как любая подходящая локальная сеть передачи данных (LAN), глобальная сеть передачи данных (WAN), частная сеть передачи данных и тому подобное. Важно иметь в виду, что варианты реализации сети передачи данных даны исключительно для наглядности. Реализация линии передачи данных (отдельно не пронумерована) между электронным устройством 210 и сетью 240 передачи данных будет зависеть среди прочего от того, как именно реализовано электронное устройство 210.

[62] Исключительно в качестве примера, а не ограничения, в тех вариантах осуществления настоящей технологией, где электронное устройство 210 реализовано как беспроводное устройство связи (например, смартфон), линия передачи данных может быть реализована как беспроводная линия передачи данных. Примеры беспроводных линий передачи данных включают в себя, без введения ограничений, линию передачи данных 3G, линию передачи данных 4G, и тому подобное. Сеть 240 передачи данных может также использовать беспроводное соединение с сервером 230.

[63] В некоторых вариантах осуществления настоящей технологии сервер 230 реализован как обычный компьютерный сервер. В одном варианте осуществления технологии, не ограничивающем ее объем, сервер 230 представляет собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™, но он может быть реализован с помощью любого другого подходящего аппаратного, программного и/или системного обеспечения, или их комбинации. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, сервер является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих ее объем, (не показаны) функциональность сервера 230 может быть разделена и может выполняться с помощью нескольких серверов.

[64] В некоторых вариантах осуществления настоящей технологии, на сервере 230 может быть размещен один или несколько исполняемых на компьютере сервисов, например, поисковая система. Другими словами, сервер 230 может находиться под контролем и/или управлением поставщика поисковой системы (не показан), такого, например, как оператор поисковой системы Яндекс™. Таким образом, сервер 230 может быть выполнен с возможностью выполнять один или несколько поисков в ответ на поисковые запросы, введенные пользователями поисковой системы. Сервер 230 может быть выполнен с возможностью осуществлять создание и передачу электронному устройству 210 ответного пакета 290 данных через сеть 240 передачи данных. То как сервер 210 выполнен с возможностью создавать и передавать ответный пакет 290 данных, а также содержимое ответного пакета 290 данных - будет далее описано более подробно.

[65] Сервер 230 соединен с возможностью передачи данных с базой 275 данных словаря и базой 270 данных журнала запросов. На Фиг. 2, база 275 данных словаря и база 270 данных журнала запросов представлены как напрямую связанные с сервером 230, тем не менее, в некоторых вариантах осуществления технологии, база 275 данных словаря и база 270 данных журнала запросов могут быть связаны с возможностью передачи данных с сервером 230 через сеть 240 передачи данных. Несмотря на то, что базы 275 и 270 данных словаря и журнала запросов представлены на Фиг. 2 как отдельные элементы, в некоторых вариантах осуществления настоящей технологии, как база 275 данных словаря так и база 270 данных журнала запросов может быть реализована как часть одного элемента (т.е. единой базы данных, содержащей информацию, которая хранится в базах 275 и 270 данных словаря и журнала запросов).

[66] В общем случае, сервер 230, где расположены один или несколько исполняемых на компьютере сервисов, например, поисковые системы, может использовать лексическую информацию, собранную или иным образом полученную из внешних источников (не показано), которая далее сохраняется в базе 275 данных словаря, и которая касается одной или нескольких коллекций устоявшихся слов в различных языках. База 275 данных словаря может быть доступна серверу 230 через двусторонний путь передачи данных (не показано). Лексическая информация может извлекаться, сохраняться и обрабатываться и далее использоваться сервером 230.

[67] Можно сказать, что база 275 данных словаря может быть использована сервером 230 для расчета свойств элемента в отношении различных слов. Другими словами, база 275 данных словаря может быть использована сервером 230 для расчета того, допустимо ли вообще связывать данное слово с известным элементом. Например, сервер 230 может быть выполнен с возможностью использовать базу 275 данных словаря для проверки того, может ли данное слово быть подходящим существительным, связанным с известным элементом. Также можно сказать, что база 275 данных словаря может быть использована сервером 230 для оценки свойств словаря в отношении различных слов. Другими словами, база 275 данных словаря может быть использована сервером 230 для оценки того, классифицировано ли данное слово. Например, сервер 230 может быть выполнен с возможностью использовать базу 275 данных словаря для проверки того, записано ли данное слово в одном или нескольких составленных людьми словарях.

[68] Лексическая информация, хранящаяся в базе 275 данных словаря, может также содержать лексемы, а также соответствующие связанные парадигмы словоизменения. В общем случае, из-за грамматических правил различных языков, данная лексема может быть связана с набором данных словоизменительных парадигм. Например, если данная лексема представляет собой "ride", то набор словоизменительных парадигм может включать в себя данные словоизменительные парадигмы: "riding", "ridden", "rode" и так далее. В другом примере, если данная лексема представляет собой "sing", то набор словоизменительных парадигм может включат в себя данные словоизменительные парадигмы: "singing", "sang", "sung" и так далее. База 275 данных словаря может быть выполнена с возможностью сохранять данные, связанные с тысячами лексем и тысячами соответствующих словоизменительных парадигм, собранных или иным образом полученных от внешних источников, таких как словари или документы.

[69] Следует отметить, что для примера и для простоты понимания были использованы данные лексемы и соответственно связанные словоизменительные парадигмы английской грамматики, но лексемы и соответственно связанные словоизменительные парадигмы других грамматик (например, русской, французской, немецкой, испанской и так далее) также могут быть представлены в некоторых вариантах, не выходя на границы настоящего технического решения.

[70] В общем случае, сервер 230, где размещены один или несколько исполняемых на компьютере сервисов, например, поисковые системы, может использовать информацию из истории, собранную из большого количества ранее использованных запросов, которые были введены в систему, и могут храниться в базе 270 данных журнала запросов. База 270 данных журнала запросов может быть доступна серверу 230 через двусторонний путь передачи данных (не показано). Из каждого прошлого запроса различная информация может извлекаться, сохраняться, обрабатываться и далее использоваться сервером 230.

[71] В некоторых вариантах осуществления настоящей технологии, база 270 данных журнала запросов может содержать одну или несколько коллекций данных, относящихся к запросам, которые пользователи ранее ввели в сервер 230. Другими словами, сервер 230 может быть выполнен с возможностью заполнять базу 270 данных журнала запросов на основе пользовательских взаимодействий с исполняемыми на компьютере сервисами, которые расположены на нем. В некоторых вариантах осуществления технологии, тем не менее, сервер 230 может быть выполнен с возможностью связываться и использовать внешние ресурсы, чтобы продолжить заполнение базы 270 данных журнала запросов.

[72] В некоторых вариантах осуществления настоящей технологии, база 270 данных журнала запросов может быть выполнена с возможностью сохранять "данные, связанные с прошлыми запросами", связанные с каждым прошлым запросом, введенным в поисковую систему сервера 230. Например, данные, связанные с прошлыми запросами могут включать в себя данные о кликах из прошлых запросов, введенных в поисковую систему сервера 230. Эти данные о кликах могут храниться в форме записей, указывающих на то, что на данные документы был совершен "клик" пользователями поисковой системы, когда они просматривали результаты поиска для их соответствующих прошлых запросов.

[73] Дополнительно, данные, связанные с прошлыми запросами, могут включать в себя дополнительные статистические данные, связанные с прошлыми запросами, введенными в поисковую систему сервера 230. Например, частота использования данного прошлого запроса, которая указывает на то, как часто данный прошлый запрос был введен в сервер 230, может храниться на сервере 230 в связи с данным прошлым запросом.

[74] Можно сказать, что база 270 данных журнала запросов может быть использована сервером 230 для оценки свойств частоты в отношении различных слов. Например, сервер 230 может быть выполнен с возможностью использоваться базу 270 данных журнала запросов для проверки того, находится ли частота использования или частота любого другого заранее определенного типа в отношении данного слова выше заранее определенных соответствующих порогом и/или в пределах заранее определенных пороговых интервалов.

[75] Можно также сказать, что база 270 данных журнала запросов может быть использована сервером 230 для расчета свойств сходства фонетических форм между различными словами. Например, сервер 230 может быть выполнен с возможностью использовать базу 270 данных журнала запросов для проверки того, являются ли два слова фонетически сходными или, другими словами, являются ли эти два слова репрезентативными для звуков, которые обладают общими фонетическими свойствами и часто являются вариантами одного фонологического элемента в данном языке. С этой целью, сервер 230 может выполнять известные способы фонетического анализа для того, чтобы выполнять оценку свойств сходства фонетических форму между различными словами, например, словами, которые формируют запросы, сохраненные в базе 270 данных журнала запросов.

[76] Можно также сказать, что база 270 данных журнала запросов может быть использована сервером 230 для расчета свойств сходства внешних форм между различными словами. Например, сервер 230 выполнен с возможностью использовать базу 270 данных журнала запросов для проверки того, отличаются ли два слова в шаблонах символов, например, может ли первое из двух слов быть получено из второго из двух слов путем добавления апострофа и/или добавления символа и/или удаления символа и так далее.

[77] В дополнительных вариантах осуществления настоящей технологии, база 270 данных журнала запросов может быть выполнена с возможностью сохранять "данные о взаимозависимости прошлых запросов", которые указывают на предыдущие преобразования между парой прошлых запросов, введенных в поисковую систему сервера 230. Данные о взаимозависимости прошлых запросов могут извлекаться из данных поисковой сессии, связанных с прошлыми поисковыми сессиями, которые осуществлялись пользователями поисковой системы.

[78] Данные поисковой сессии могут содержать информацию, связанную со множеством подмножеств прошлых запросов, которые были введены пользователями во время различных поисковых сессий. Данные о поисковой сессии могут предоставлять релевантную информацию в отношении данного подмножества прошлых запросов в виде последовательности прошлых запросов, введенных данных пользователем в данной прошлой поисковой сессии, был ли данный прошлый запрос в данной прошлой поисковой сессии явно исправлен пользователем (например, путем ввода последующего прошлого поискового запроса, по сути аналогичного данному предыдущему запросу), был ли данный прошлый запрос в данной прошлой поисковой сессии неявно исправлен (например, когда поисковая система предоставила поисковые результаты данному пользователю в ответ на исправленный прошлый поисковый запрос вместо того, чтобы предоставить их в ответ на данный прошлый поисковый запрос, и данный пользователь существенно взаимодействовал с этими поисковыми результатами) и так далее.

[79] Другими словами, данные о взаимозависимости прошлых запросов для данного прошлого запроса могут указывать на предыдущие преобразования, которые могут быть извлечены сервером 230 из базы 270 данных журнала запросов, между данных прошлым поисковым запросом, введенным в поисковую систему, и другим прошлым поисковым запросом, введенным в поисковую систему. Таким образом, данные о взаимозависимости прошлых запросов для данной пары прошлых запросов могут указывать на предыдущие преобразования, которые могут быть извлечены сервером 230 из базы 270 данных журнала запросов, между первым прошлым запросом в данной паре прошлых запросов, введенных в поисковую систему, и вторым прошлым запросом в данной паре прошлых запросов, введенных в поисковую систему.

[80] Как уже ранее упоминалось, информация, хранящаяся в базе 275 данных словаря и базе 270 данных журнала запросов, и также их соответствующие функции, могут быть реализованы с помощью единой общей базы данных, не выходя за рамки настоящей технологии.

[81] Дополнительно или альтернативно, следует также отметить, что, в некоторых вариантах осуществления настоящей технологии, сервер 230 может использовать комбинацию базы 275 данных словаря и базы 270 данных журнала запросов для вычисления любого из свойств сходства внешних форм, свойств сходства фонетических форм, свойств элемента, словарных свойств и частотных свойств различных слов или прошлых запросов, не выходя за границы настоящей технологии.

[82] В некоторых вариантах осуществления настоящей технологии, электронное устройство 210 может быть выполнено с возможностью исполнять браузерное приложение 250. В общем случае, целью браузерного приложения 250 является предоставление пользователю 211 возможности получать доступ к одному или нескольким исполняемым на компьютере сервисам, предоставляемым сервером 230 через сеть 240 передачи данных. Браузерное приложение 250 в общем случае включает в себя командный интерфейс (не показано) и браузерный интерфейс (не показан), который позволяет пользователю 211 вводить пользовательские запросы и ретранслировать эти введенные пользователем запросы в поисковую систему, предоставляемую сервером 230.

[83] В общем случае, данный введенный пользователем запрос может быть текстовой строкой символов, образованной одним или несколькими словами, которые вводит пользователь 211 с помощью дисплея 150 электронного устройства 210. Например, данный введенный пользователем запрос может представлять собой: "motorcycle" ("мотоцикл"), "Canada" ("Канада"), "Asia" ("Азия"), "patent" ("патент") и так далее. Тем не менее, пользователь 211 может ввести запрос с опечаткой, орфографической ошибкой или какой-либо иной ошибкой по меньшей мере в одном слове из данного введенного пользователем запроса во время ввода его с помощью дисплея 150. Пользователь 211 может ошибочно ввести данный пользовательский поисковый запрос по множеству причин, таких как: быстрый ввод или ввод данного пользовательского запроса с помощью дисплея 150, близость клавиш на виртуальной (или физической) клавиатуре, непоследовательные грамматические правила, неоднозначные разбиения слов и так далее.

[84] Например, вместо ввода пользовательского запроса "motorcycle", пользователь 211 мог ввести "motorclye", "mtorcycle" или "motorcyle" и так далее. Следовательно, подразумевается, что в некоторых вариантах осуществления настоящей технологии, введенный пользователем запрос мог быть потенциально введен с ошибкой пользователем 211 в браузерное приложение 250 с помощью дисплея 150 электронного устройства 210.

[85] Следует отметить, что, несмотря на то, что некоторые браузерные приложения осуществляют функцию исправления орфографических ошибок, браузерное приложение 250, в некоторых случаях, может не быть выполнено с возможностью исправлять потенциально введенный с ошибкой пользовательский запрос и/или может не уметь распознавать, что данный введенный пользователем запрос был введен с ошибкой. В результате, браузерное приложение 250 может быть выполнено с возможностью инициировать создание электронным устройством 210 исходного пакета 280 данных, содержащего информацию, которая указывает на введенный пользователем запрос в браузерное приложение 250 пользователем 211, даже если этот введенный пользователем запрос может быть потенциально введен с ошибкой.

[86] Предполагается, что пользователь 211 взаимодействует с дисплеем 150 и вводит пользовательский запрос "oligopsony" ("олигопсония") в браузерное приложение 250. В результате, электронное устройство 210 может быть выполнено с возможностью создавать исходный пакет 280 данных, содержащий информацию в отношении введенного пользователем запроса "oligopsony", и может передавать исходный пакет 280 данных серверу 230 через сеть 240 передачи данных. Этот введенный пользователем запрос может далее быть получен поисковой системой, которая предоставляется сервером 230.

[87] В некоторых вариантах осуществления технологии, сервер 230 может быть выполнен с возможностью осуществлять поиск по базе 275 данных словаря для проверки того, включает ли лексическая информация в себя введенный пользователем запрос. Если лексическая информация включает в себя введенный пользователем запрос, сервер 230 может устанавливать, что введенный пользователем запрос является частью устоявшихся слов в данном языке (т.е. в данном случае - устоявшимся словом в английском языке). Если лексическая информация не содержит введенного пользователем запроса, сервер 230 может определять, в некоторых случаях, что введенный пользователем запрос потенциально введен с ошибкой.

[88] Сервер 230 может быть выполнен с возможностью осуществлять поиск по базе 270 данных журнала запросов для того, чтобы идентифицировать, был ли введенный пользователем запрос раннее введен в предоставляемую поисковую систему (т.е. является ли данный прошлый поисковый запрос идентичным введенному пользователем запросу). Если база 270 данных журнала запросов не содержит введенного пользователем запроса, сервер 230 может определять, в некоторых случаях, что введенный пользователем запрос потенциально введен с ошибкой.

[89] На Фиг. 3 представлено множество прошлых запросов 300, которые хранятся в базе 270 данных журнала запросов. Сервер 230 может быть выполнен с возможностью получать доступ к базе 270 данных журнала запросов и извлекать из нее указание на множество прошлых запросов 300. Как уже ранее упоминалось, база 270 данных журнала запросов может хранить информацию, относящуюся к прошлым запросам, которые пользователи ранее ввели в сервер 230. Таким образом, множество прошлых запросов 300 включает в себя предыдущие запросы, которые пользователи ранее ввели в сервер 230.

[90] Сервер 230 может быть выполнен с возможностью оценивать сходство строки между введенным пользователем запросов и каждым из множества прошлых запросов 300 путем вычисления редакционного расстояния между введенным пользователем запросом и каждым из множества прошлых запросов 300.

[91] В общем случае, редакционное расстояние является способом количественной оценки того, насколько различаются две строки символов друг от друга путем вычисления минимального числа операций, которые потребуются для преобразования одной строки в другую. Например, сервер 230 может быть выполнен с возможностью вычислять расстояние Левенштейна между введенным пользователем запросом и каждым из множества прошлых запросов 300. Расстояние Левенштейна хорошо известно в данной области техники, это тип редакционного расстояния, которое позволяет удалять, добавлять и заменять символы.

[92] В некоторых вариантах осуществления настоящей технологии, множество прошлых запросов 300 может быть заранее отфильтровано с помощью известных способов для снижения числа прошлых запросов, которые будут сравниваться в отношении сходства строк с введенным пользователем запросом. Например, множество прошлых запросов 300 может быть заранее отфильтровано на основе соответствующих длин их строк символов.

[93] Дополнительно или опционально, сервер 230 может быть выполнен с возможностью вычислять другие типы редакционных расстояния между введенным пользователем запросом и каждым из множества прошлых запросов 300, например, расстояние наибольшей общей последовательности (LCS), расстояние Хэмминга, расстояние Дамерау-Левенштейна или расстояние Джаро, все они являются типами редакционных расстояний, которые хорошо известны в данной области техники. Вычисление редакционного расстояния для каждого из прошлых запросов из множества прошлых запросов 300 в соответствии с любым из различных типов редакционных расстояний, которые описаны выше, будет зависеть, среди прочего, от конкретной реализации настоящей технологии.

[94] После вычисления соответствующего редакционного расстояния между одним из множества прошлых запросов 300 и введенным пользователем запросом, сервер 230 может быть выполнен с возможностью проверять, является ли введенный пользователем запрос идентичным по сравнению с любым из множества прошлых запросов 300, путем проверки того, обладает ли любой из множества прошлых запросов 300 соответствующим редакционным расстоянием, равным нулю, по отношению к введенному пользователем запросу. Другими словами, сервер 230 может быть выполнен с возможностью определить, был ли введенный пользователем запрос когда-либо ранее введен в поисковую систему.

[95] В итоге, если сервер 230 определяет, что введенный пользователем запрос не является частью лексической информации базы 275 данных словаря, и не идентичен ни одному из множества прошлых запросов 300, сервер 230 может определять, что введенный пользователем запрос никогда ранее не вводился или иным образом не использовался поисковой системой, и что введенный пользователем запрос потенциально был введен с ошибкой.

[96] Опционально, другие способы, известные в данной области техники, могут быть реализованы для определения того, что введенный пользователем запрос никогда ранее не был введен или иным образом использован поисковой системой, и что введенный пользователем запрос потенциально был введен с ошибкой. Вне зависимости от конкретного способа, который используется для этого определения сервером 230, в ответ на это определение, сервер 230 может быть выполнен с возможностью выполнять способ 900 (см. Фиг 9) создания данного заменяющего запроса для данного введенного пользователем запроса, который никогда не был введен или иным образом использован поисковой системой, и который потенциально был введен с ошибкой.

[97] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью выбирать набор заменяющих запросов-кандидатов 350 из множества прошлых запросов 300 на основе сходства строк между введенным пользователем запросом "oligopsony" и каждым из множества прошлых запросов 300.

[98] В некоторых вариантах осуществления настоящей технологии, для выбора набора заменяющих запросов-кандидатов 350, сервер 230 может быть выполнен с возможностью ранжировать множество прошлых запросов 300 в соответствии с соответствующими редакционными расстояниями, где данный из множества прошлых запросов 300, связанных с наименьшим редакционным расстоянием, ранжируется как первый, а другой из множества прошлых запросов 300, связанный с наибольшим расстоянием, ранжируется как последний. В этом случае, сервер 230 может выбирать, например, 20 наиболее высоко ранжированных прошлых запросов из множества прошлых запросов 300 как набор заменяющих запросов-кандидатов 350.

[99] Альтернативно, для выбора набора заменяющих запросов-кандидатов 350, сервер 230 может быть выполнен с возможностью сравнивать редакционное расстояние, связанное с каждым из множества прошлых запросов 300, с заранее определенным пороговым редакционным расстоянием, и выбирать предыдущие запросы, которые связаны с соответствующими редакционными расстояниями, которые ниже, чем заранее определенное пороговое редакционное расстояние, как набор заменяющих запросов-кандидатов 350.

[100] Таким образом, набор заменяющих запросов-кандидатов 350 может включать в себя только наиболее похожие предыдущие запросы (т.е. те похожие предыдущие запросы, которые связаны с наименьшим редакционным расстоянием) среди множества прошлых запросов 300 по отношению к введенному пользователем запросу.

[101] Предполагается, что на основе сходства строк между введенным пользователем запросом "oligopsony" и каждым из множества прошлых запросов 300, сервер 230 выбирает четыре прошлых запроса 352, 354, 356 и 358, а именно "oligophsony", "oligospoony", "oligopoly" и "oligophrenia", соответственно, как часть набора заменяющих запросов-кандидатов 350. Следует отметить, что сервер 230, который выбирает предыдущие запросы 352, 354, 356 и 358 как набор заменяющих запросов-кандидатов 350, описан исключительно для целей упрощения и что в других вариантах осуществления настоящей технологи, другие предыдущие запросы могут быть выбраны как набор заменяющих запросов-кандидатов 350, и что другое общее число прошлых запросов, отличное от четырех прошлых запросов, может быть выбрано сервером 230 как часть набора заменяющих запросов-кандидатов 350, не выходя за границы настоящей технологии.

[102] Исключительно для целей иллюстрации, редакционное расстояние между введенным пользователем запросом "oligopsony:

- и прошлым запросом 352 "oligophsony" равно "1";

- и прошлым запросом 354 "oligospoony" равно "2";

- и прошлым запросом 356 "oligopoly" равно "2";

- и прошлым запросом 358 "oligophrenia" равно "5".

[103] Для целей описания, предыдущие запроса 352, 354, 356 и 358 будут далее упоминаться как заменяющие запросы-кандидаты 352, 354, 356 и 358 соответственно, из набора заменяющих запросов-кандидатов 350.

[104] Следует иметь в виду, что поскольку введенный пользователем запрос ранее никогда не был введен в поисковую системы сервера 230, введенный пользователем запрос не включен ли в одно из множества прошлых запросов 300 или набор заменяющих запросов-кандидатов 350. Дополнительно, поскольку введенный пользователем запрос никогда не был введен в поисковую систему сервера 230, база 270 данных журнала запросов не хранит никаких данных, связанных с прошлыми запросами, которые были бы связаны с введенным пользователем запросом. Кроме того, поскольку введенный пользователем запрос никогда не был введен в поисковую систему сервера 230, данные о взаимозависимости прошлых запросов, хранящиеся в базе 270 данных журнала запросов не указывают ни на какие предыдущие преобразования между введенным пользователем запросом и любым из множества прошлых запросов 300. Следовательно, данные о взаимозависимости прошлых запросов, хранящиеся в базе 270 данных журнала запросов, не указывают ни на какие предыдущие преобразования между введенным пользователем запросом и любым из набора заменяющих запросов-кандидатов 350 (т.е. меньшим подмножеством множества прошлых запросов 300).

[105] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью использовать по меньшей мере один заменяющий запрос-кандидат из множества заменяющих запросов-кандидатов 350 в качестве приближения введенного пользователем запроса, если по меньшей мере один заменяющий запрос-кандидат связан с допустимыми значениями характеристик приближения гипотезы. Другими словами, сервер 230 может выбирать приближенный запрос для введенного пользователем запроса, если по меньшей мере один заменяющий запрос-кандидат из набора заменяющих запросов-кандидатов 350 связан с допустимыми значениями характеристик приближения гипотезы.

[106] Эти характеристики приближения гипотезы основаны на сходстве строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350 и на частоте использования каждого из набора заменяющих запросов-кандидатов 350. Эти характеристики приближения гипотезы позволяют проверить, является ли по меньшей мере один заменяющий запрос-кандидат достаточно похожим на введенный пользователем запрос (например, состоящим из по существу сходных строк символов), и редко ли используется по меньшей мере один заменяющий запрос-кандидат (например, связан ли он с низкой частотой использования), аналогично введенному пользователем запросу, который не использовался никогда.

[107] Таким образом, без ограничения какой-либо теорией, если по меньшей мере один заменяющий запрос-кандидат связан с допустимыми значениями характеристик приближения гипотезы (например, по меньшей мере один заменяющий запрос-кандидат достаточно похож на введенный пользователем запрос и похожим образом редко используется или, другими словами, по меньшей мере один заменяющий запрос-кандидат сравнительно нечасто используется и достаточно похож на введенный пользователем запрос), гипотеза состоит в том, что если введенный пользователем запрос был ранее использован поисковой системой, предыдущие данные о введенном пользователем запросе должны быть похожи на предыдущие данные по меньшей мере об одном выбранном заменяющем запросе-кандидате и, следовательно, этот по меньшей мере один заменяющий запрос-кандидат может быть использован как приближенный запрос для введенного пользователем запроса. Другими словами, это позволяет, в некоторым смысле, сделать вывод о том, что данные, связанные с прошлыми запросами, и данные о взаимозависимости прошлых запросов приближенного запроса являются допустимыми оценками данных, связанны с прошлыми запросами, и данных о взаимозависимости прошлых запросов, которые относятся к введенному пользователем запросу, соответственно.

[108] Таким образом, в некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью оценивать данные, связанные с прошлыми запросами, которые могли быть связаны с введенным пользователем запросом, если введенный пользователем запрос был ранее введен или иным образом ранее использовался поисковой системой сервера 230.

[109] Также, в некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью оценивать данные о взаимозависимости прошлых запросов, которые могли быть связаны с введенным пользователем запросом, если введенный пользователем запрос был ранее введен или иным образом ранее использовался поисковой системой сервера 230. Это означает, что сервер 230 может быть выполнен с возможностью оценивать предыдущие преобразования между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350, которые могли быть записаны, если предыдущие преобразования между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350 ранее выполнялись пользователями поисковой системы сервера 230.

[110] Как уже ранее упоминалось, сервер 230 также может быть выполнен с возможностью выбирать приближенный запрос из набора заменяющих запросов-кандидатов 350 на основе сходства строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350 и частоты использования каждого из набора заменяющих запросов-кандидатов 350 (т.е. характеристик приближения гипотезы).

[111] Далее будут описаны два различных сценария выбора приближенного запроса из набора заменяющих запросов-кандидатов 350 сервером 230, а также их соответствующие варианты осуществления в рамках настоящей технологии. Вкратце, первый сценарий описывает случай, когда сервер 230 выбирает только один единственный заменяющий запрос-кандидат в качестве приближенного запроса, а второй сценарий описывает случай, когда сервер 230 выбирает больше одного заменяющего запроса-кандидата в качестве более чем одного приближенного запроса.

Сценарий 1. Сервер выбирает один заменяющий запрос-кандидат в качестве приближенного запроса

[112] На Фиг. 4 представлено графическое представление 400 графика, на котором размещены (i) соответствующие сходства строк каждого из набора заменяющих запросов-кандидатов 350 и введенного пользователем запроса и (ii) соответствующие частоты использования каждого из набора заменяющих запросов-кандидатов 350. Графическое представление 400 графика определено осью 402 частоты использования и осью 404 сходства строк.

[113] Также представлена пороговая линия 406 частоты использования, которая совпадает с пороговым значением 407 для характеристики частоты использования, относящейся к приближению гипотезы. Другими словами, все значения частоты использования, которые меньше или равны пороговому значению 407 частоты использования, определены как допустимые значения частоты использования для характеристики частоты использования, относящейся к приближению гипотезы.

[114] Пороговое значение 407 характеристики частоты использования, относящейся к приближению гипотезы, может быть определено сервером 230 различными способами. Пороговое значение 407 частоты использования может быть определено сервером 230 таким образом, что оно совпадает с нижней квартилью (т.е. квартиль нижних 25%) из набора заменяющих запросов-кандидатов 350 в соответствии с распределением частот их использования. Альтернативно, пороговое значение 407 частоты использования может быть определено эмпирическим путем сервером 230 в соответствии с методом проб и ошибок. Опционально, пороговое значение 407 частоты использования может быть заранее определено оператором поисковой системы или сервера 230.

[115] Кроме того, представлена пороговая линия 408 сходства строк, которая совпадает с пороговым значением 409 для характеристики сходства строк, относящейся к приближению гипотезы. Другими словами, все значения сходства строк, которые меньше или равны пороговому значению 409 сходства строк, определены как допустимые значения сходства строк для характеристики сходства строк, относящейся к приближению гипотезы.

[116] Пороговая линия 408 характеристики сходства строк, относящейся к приближению гипотезы, может быть определена сервером 230 различными способами. Пороговая линия 408 сходства строк может быть определено сервером 230 таким образом, что оно совпадает с нижней квартилью (т.е. квартиль нижних 25%) из набора заменяющих запросов-кандидатов 350 в соответствии с распределением их редакционных расстояний (от введенного пользователем запроса). Альтернативно, пороговое значение 408 сходства строк может быть определено эмпирическим путем сервером 230 в соответствии с методом проб и ошибок. Опционально, пороговая линия 408 сходства строк может быть заранее определена оператором поисковой системы или сервера 230.

[117] Кроме того, представлена область 410 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 406 частоты использования и пороговой линией 408 сходства строк. В соответствии с вариантами осуществления настоящей технологии, если данный заменяющий запрос-кандидат расположен в области 410 допустимого приближения гипотезы на основе его соответствующего сходства строк по отношению к введенному пользователем запросу на основе его частоты использования, данный заменяющий запрос-кандидат выбирается как приближенный запрос, который может быть использован сервером 230 для приближения данных, связанных с прошлыми запросами, и данных о взаимозависимости прошлых запросов по отношению к введенному пользователем запросу.

[118] В самом деле, если данный заменяющий запрос-кандидат расположен в области 410 допустимого приближения гипотезы, данный заменяющий запрос-кандидат связан с допустимыми значениями характеристик приближения гипотезы, а именно - данным допустимым значением частоты использования для характеристики приближения гипотезы и данным допустимым значением сходства строк для характеристики приближения гипотезы.

[119] Также представлено четыре графических маркера 452, 454, 456 и 458. Предполагается, что графические маркеры 452, 454, 456 и 458 расположены на основе соответствующей частоты использования заменяющих запросов-кандидатов 352, 354, 356 и 358 соответственно, и на основе их соответствующих редакционных расстояний между введенным пользователем запросом и каждым из заменяющих запросов-кандидатов 352, 354, 356 и 358 соответственно.

[120] Другими словами, графические маркеры 452, 454, 456 и 458 соответственно представляют каждый из набора заменяющих запросов-кандидатов 350, а именно заменяющие запросы-кандидаты 352, 354, 356 и 358, которые были расположены на основе их соответствующих частот использования и их соответствующих редакционных расстояний от введенного пользователем запроса.

[121] В этом первом сценарии, как показано на Фиг. 4, только графический маркер 452, который связан с заменяющим запросом-кандидатом 352, расположен в области 410 допустимого приближения гипотезы. Таким образом, приближенный запрос, который связан с допустимыми значениями характеристик приближения гипотезы, является заменяющим запросом-кандидатом 352.

[122] Следует отметить, что приближенные запросы относятся ко всем заменяющим запросам-кандидатам из набора заменяющих запросов-кандидатов 350, которые связаны с соответствующими маркерами, расположенными в области 410 допустимого приближения гипотезы. Таким образом, в этом первом сценарии, приближенный запрос является единственным заменяющим запросом-кандидатом, который является заменяющим запросом-кандидатом 352. Следовательно, сервер 230 может быть выполнен с возможностью использовать заменяющий запрос-кандидат 352 как приближение введенного пользователем запроса.

[123] Это означает, что сервер 230 может быть выполнен с возможностью оценивать данные, связанные с прошлыми запросами, которые могли быть связаны с введенным пользователем запросом на основе данных, связанных с прошлыми запросами, в отношении заменяющего запроса-кандидата 352.

[124] Также сервер 230 может быть выполнен с возможностью оценивать данные, связанные с прошлыми запросами, которые могли быть связаны с введенным пользователем запросом на основе данных, связанных с прошлыми запросами, в отношении заменяющего запроса-кандидата 352. Это означает, что сервер 230 может быть выполнен с возможностью оценивать предыдущие преобразования между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350 на основе прошлых преобразований заменяющим запросом-кандидатом 352 и каждым из набора заменяющих запросов-кандидатов 350.

[125] Сервер 230 может быть выполнен с возможностью создавать соответствующий вектор свойств для каждой пары, состоящей из приближенного запроса (т.е. заменяющего запроса-кандидата 352) и данного одного из набора заменяющих запросов-кандидатов 350. Далее будет описано создание векторов свойств в соответствии с первым сценарием со ссылкой на Фиг. 5.

[126] На Фиг. 5 представлено множество пар 580, множество наборов 550 данных свойств и множество векторов 500 свойств, созданных сервером 230. Множество пар 580 включает в себя пары, состоящие из приближенного запроса (т.е. заменяющего запроса-кандидата 352) и данного одного из набора заменяющих запросов-кандидатов 350.

[127] Иллюстративный пример показан на Фиг. 5, множество пар 580 включает в себя:

- первую пару 582, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. приближенного запроса), который является первым запросом в первой паре 582, и (ii) заменяющего запроса-кандидата 452 "oligophsony", который является вторым запросом в первой паре 582;

- вторую пару 584, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. приближенного запроса), который является первым запросом во второй паре 584, и (ii) заменяющего запроса-кандидата 354 "oligospoony", который является вторым запросом во второй паре 584;

- третью пару 586, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. приближенного запроса), который является первым запросом в третьей паре 586, и (ii) заменяющего запроса-кандидата 356 "oligopoly", который является вторым запросом третьей паре 586; и

- четвертую пару 588, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. приближенного запроса), который является первым запросом во четвертой паре 588, и (ii) заменяющего запроса-кандидата 358 "oligophrenia", который является вторым запросом в четвертой паре 588.

[128] Сервер 230 может быть выполнен с возможностью определять для каждой из множества пар 580 соответствующий набор данных свойств из множества наборов 550 данных свойств. Таким образом, сервер 230 может быть выполнен с возможностью определять: для первой пары 582 первый набор 552 данных свойств; для второй пары 584 второй набор 554 данных свойств; для третьей пары 586 третий набор 556 данных свойств; и для четвертой пары 588 четвертый набор 558 данных свойств.

[129] Каждый из множества наборов 550 данных свойств может быть определен сервером 230 на основе каждой из соответствующих пар запросов и их соответствующей связанной информации, которая хранится в базе 275 данных словаря и базе 270 данных журнал запросов.

[130] Например, сервер 230 может определять первый набор 552 данных свойство путем извлечения информации из базы 275 данных словаря и из базы 270 данных журнала запросов, которая связана с каждым запросом в первой паре 582 (т.е. заменяющим запросом-кандидатом 352). Таким образом, первый набор 552 данных свойств может включать в себя указание 522 на данные о взаимозависимости прошлых запросов, указывающие на предыдущие преобразования между заменяющим запросом-кандидатов 352 (т.е. приближенным запросом) и заменяющим запросом-кандидатом 352. Дополнительно, первый набор 552 данных свойств может включать в себя указание 512 на данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 352. Кроме того, сервер 230 может извлекать свойства сходства внешних форм, свойства сходства фонетических форм, свойства элемента, словарные свойства и частотные свойства, связанные с заменяющим запросом-кандидатом 352 из базы 275 данных словаря и из базы 270 данных журнала запросов, и включать их в первый набор 552 данных свойств.

[131] В другом примере, сервер 230 может определять третий набор 556 данных свойство путем извлечения информации из базы 275 данных словаря и из базы 279 данных журнала запросов, которая связана с каждым запросом в третьей паре 586 (т.е. заменяющим запросом-кандидатом 352, который является приближенным запросом, и заменяющим запросом-кандидатом 356). Таким образом, третий набор 556 данных свойств может включать в себя указание 526 на данные о взаимозависимости прошлых запросов, указывающие на предыдущие преобразования между заменяющим запросом-кандидатов 352 (т.е. приближенным запросом) и заменяющим запросом-кандидатом 356. Дополнительно, третий набор 556 данных свойств может включать в себя указание 512 на данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 352 (т.е. приближенного запроса), и указание 516 на данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 356. Кроме того, сервер 230 может извлекать свойства сходства внешних форм, свойства сходства фонетических форм, свойства элемента, словарные свойства и частотные свойства, связанные с заменяющим запросом-кандидатом 352 и заменяющим запросом-кандидатом 356 из базы 275 данных словаря и из базы 275 данных журнала запросов, и включать их в третий набор 556 данных свойств.

[132] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью осуществлять сохранение множества наборов 550 данных свойств в базе 270 данных журнала запросов и/или твердотельном накопителе 120 сервера 230.

[133] Сервер 230 может быть выполнен с возможностью создавать соответствующий вектор свойств из множества векторов 500 свойств на основе соответствующего определенного таким образом набора данных свойств из множества наборов 550 данных свойств. В результате, поскольку каждый соответствующий набор свойств данных содержит соответствующее указание на данные о взаимозависимости прошлых запросов, соответствующий вектор свойств, созданный на их основе, представляет преобразования между (i) первым запросом из соответствующей пары (т.е. приближенного запроса) и (ii) вторым запросом из соответствующей пары (т.е. соответствующим одним из набора заменяющихся запросов-кандидатов 350).

[134] Продолжая с примером на Фиг. 5, множество векторов 500 свойств включает в себя:

- первый вектор 502 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенный запрос) и заменяющим запросом-кандидатом 352 "oligophsony";

- второй вектор 504 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенный запрос) и заменяющим запросом-кандидатом 354 "oligospoony";

- третий вектор 506 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенный запрос) и заменяющим запросом-кандидатом 356 "oligopoly"; и

- четвертый вектор 508 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенный запрос) и заменяющим запросом-кандидатом 358 "oligophrenia".

[135] Каждый вектор свойств из множества векторов 500 свойств также представляет данные, связанные с прошлыми запросами, в отношении каждого запроса в соответствующей паре из множества пар 580. Например, первый вектор 502 свойств может также представлять данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 352 (т.е. приближенного запроса). В другом примере, третий вектор 506 свойств может представлять (i) данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 352 (т.е. приближенного запроса), и (ii) данные, связанные с прошлыми запросами, в отношении заменяющего запроса-кандидата 356.

[136] Подразумевается, что в некоторых вариантах осуществления настоящей технологии, соответствующий вектор свойств из множества векторов 500 свойств может представлять свойства сходства внешних форм, свойства сходства фонетических форм, свойства элемента, словарные свойства и частотные свойства, связанные с соответствующей парой запросов из множества пар 580. В самом деле, соответствующий вектор свойств из множества векторов 500 свойств может представлять свойства сходства внешних форм, свойства сходства фонетических форм, свойства элемента, словарные свойства и частотные свойства, поскольку они могут быть включены в соответствующее создание наборов данных, как уже упоминалось ранее.

[137] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть создан с возможностью сохранять множество пар 580 в связи со множеством векторов 500 свойств. Другими словами, сервер 230 может быть выполнен с возможностью сохранять каждую пару из множества пар 580 в связи с соответствующим вектором свойств из множества векторов 500 свойств. Сервер 230 может быть выполнен с возможностью сохранять множество пар 580, связанных с множеством векторов 500 свойств, в базе 270 данных журнала запросов и/или на твердотельном накопителе 120 сервера 230.

[138] В этом первом сценарии, поскольку приближенный запрос является единственным заменяющим запросом-кандидатом (т.е. заменяющим запросом-кандидатом 352), сервер 230 может быть выполнен с возможностью определять, что заменяющий запрос-кандидат 352 (т.е. приближенный запрос) является единственным допустимым приближением для введенного пользователем запроса. В результате, сервер 230 может быть выполнен с возможностью использовать множество векторов 500 свойств для заменяющего запроса-кандидата 352 (т.е. приближенного запроса) как множество приближенных векторов свойств для введенного пользователем запроса. Другими словами, сервер 230 может быть выполнен с возможностью использовать данный вектор свойств из множества векторов 500 свойств как данный приближенный вектор свойств, который представляет оценку прошлых преобразований между введенным пользователем запросом и вторым запросом из соответствующей пары.

[139] Продолжая с примером на Фиг. 5, сервер 230 может быть выполнен с возможностью использовать:

- первый вектор 502 свойств, представляющий предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенным запросом) и заменяющим запросом-кандидатом 352 "oligophsony", как первый вектор свойств, который представляет оценку прошлых переходов между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 352 "oligophsony";

- второй вектор 504 свойств, представляющий предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенным запросом) и заменяющим запросом-кандидатом 354 "oligopspoony", как второй вектор свойств, который представляет оценку прошлых переходов между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 354 "oligospoony";

- третий вектор 506 свойств, представляющий предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенным запросом) и заменяющим запросом-кандидатом 356 "oligopoly", как третий вектор свойств, который представляет оценку прошлых переходов между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 356 "oligopoly"; и

- четвертым вектор 508 свойств, представляющий предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенным запросом) и заменяющим запросом-кандидатом 358 "oligophrenia", как четвертый вектор свойств, который представляет оценку прошлых переходов между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 358 "oligophrenia".

[140] Далее сервер 230 может быть выполнен с возможностью использовать множество векторов 500 свойств как множество приближенных векторов свойств, где соответствующий приближенный вектор свойств представляет оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350, сервер 230 может быть выполнен с возможностью создавать соответствующий параметр ранжирования для каждого приближенного вектора свойств.

[141] В некоторых вариантах осуществления настоящей технологии, сервер 230 выполнен с возможностью осуществлять создание соответствующего параметра ранжирования для каждого приближенного вектора свойств с помощью системы ранжирования. Система ранжирования может представлять собой алгоритм машинного обучения (MLA), который был обучен на основе обучающих векторов свойств, созданный для других пар прошлых запросов из множества прошлых запросов 300. Обучающие векторы свойств могут быть созданы аналогично тому, как сервер 230 создает множество векторов 500 свойств. Этот обученный MLA может быть реализован и обучен сервером 230.

[142] Следует отметить, что система ранжирования может быть реализована как любое ранжирование программного типа, которое выполнено с возможностью создавать соответствующие параметры ранжирования для векторов свойств, которые были созданы аналогично множеству векторов 500 свойств. Таким образом, можно сказать, что система ранжирования может быть реализована как любое ранжирование программного типа, которое выполнено с возможностью ранжировать векторы свойств.

[143] В качестве примера, система ранжирования может быть представлять собой линейное ранжирование, которое создает реальное значение, являющееся параметром ранжирования, для вектора свойств t. Например, линейное ранжирование может создавать параметр ранжирования для вектора свойств с помощью выученного вектора веса, который был оптимизирован для точности на основе размеченных человеком пар запросов. Следовательно, в некоторых вариантах осуществления настоящей технологии, подразумевается, что система ранжирования может быть алгоритмом машинного обучения с учителем, который был обучен на основе размеченных человеком пар запросов, для которых обучающие векторы свойств были созданы сервером 230 аналогично тому, как было создано множество векторов 500 свойств.

[144] Один пример системы ранжирования, который может быть использован в некоторых вариантах осуществления настоящей технологии, описан в американской патентной заявке US 12/790,996, озаглавленной "ВЕРОЯТНОСТЬ ИСПРАВЛЕНИЯ ЗАПРОСА НА ОСНОВЕ ПАР ЗАПРОС-ИСПРАВЛЕНИЕ", поданной 1 июня 2011 года, которая включена в настоящую заявку полностью посредством ссылки. Тем не менее, подразумевается, что другие системы ранжирования могут быть использованы для создания соответствующих параметров ранжирования для приближенных векторов свойств, не выходя за границы настоящей технологии.

[145] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью определять наиболее высоко ранжированный приближенный вектор свойств среди множества приближенных векторов свойств на основе их соответствующих параметров ранжирования. Следует отметить, что каждый параметр ранжирования указывает на вероятность второго запроса из каждой соответствующей пары из множества пар 580 быть заменяющим запросом для введенного пользователем запроса. Следовательно, сервер 230 может быть выполнен с возможностью определять заменяющий запрос для введенного пользователем запроса среди набора заменяющих запросов-кандидатов 350 на основе соответствующих параметров ранжирования, связанных со множеством приближенных векторов 500 свойств (т.е. соответствующего использованного вектора свойств среди множества векторов 500 свойств).

[146] Например, предполагается, что третий приближенный вектор свойств (т.е. третий вектор 506 свойств, который представляет предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. приближенным запросом) и заменяющим запросом-кандидатом 356 "oligopoly"), который представляет оценку прошлых преобразований между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 356 "oligopoly", связан с наиболее высоким параметром ранжирования среди параметров ранжирования для каждого из приближенных векторов свойств (т.е. первого приближенного вектора свойств, который является первым вектором 502 свойств, второго приближенного вектора свойств, который является вторым вектором 504 свойств, третьего приближенного вектора свойств, который является третьи вектором 506 свойств, и четвертого приближенного вектора свойств, который является четвертым вектором 508 свойств). Таким образом, сервер 230 может быть выполнен с возможностью определять, что заменяющий запрос для введенного пользователем запроса "oligopsony" - "oligopoly".

[147] Как уже ранее упоминалось, сервер 230 может быть выполнен с возможностью осуществлять создание и передачу электронному устройству 210 ответный пакет 290 данных через сеть 240 передачи данных (см. Фиг. 2). Ответный пакет 290 данных может содержать информацию, указывающую на заменяющий запрос "oligopoly" для введенного пользователем запроса "oligopsony". Электронное устройство 210 может быть выполнено с возможностью получать ответный пакет 290 данных и может отображать с помощью дисплея 150 заменяющий запрос пользователю 211 в браузерном приложении 250.

[148] Альтернативно, сервер 230 может быть выполнен с возможностью включать, в ответ на ответный 290 пакет данных, поисковые результаты, которые отвечают на заменяющий запрос в дополнение или вместо поисковых результатов, которые отвечают на введенный пользователем запрос.

Сценарий 2. Сервер выбирает более одного заменяющего запроса-кандидата как более нем один приближенный запрос

[149] На Фиг. 6, аналогично первому сценарию, представлено графическое представление 600 графика, на котором размещены соответствующие сходства строк каждого из набора заменяющих запросов-кандидатов 350 и введенного пользователем запроса и соответствующие частоты использования каждого из набора заменяющих запросов-кандидатов 350. Аналогично графическому представлению 400 на Фиг. 4 (т.е. первый сценарий), графическое представление 600 графика определено осью 402 частоты использования и осью 404 сходства строк.

[150] Аналогично графическому представлению 400, четыре графических маркера 452, 454, 456 и 458 также представлено на Фиг. 6. Как уже ранее упоминалось, графические маркеры 452, 453, 456 и 458 расположены на основе соответствующей частоты использования заменяющих запросов-кандидатов 352, 354, 356 и 358 соответственно, и на основе из соответствующих редакционных расстояний между введенным пользователем запросом и каждым из заменяющих запросов-кандидатов 352, 354, 356 и 358 соответственно.

[151] Аналогично графическому представлению 400, это означает графические маркеры 452, 454, 456 и 458 соответственно представляют каждый из набора заменяющих запросов-кандидатов 350, а именно заменяющие запросы-кандидаты 352, 354, 356 и 358, которые были расположены на основе их соответствующих частот использования и их соответствующих редакционных расстояний от введенного пользователем запроса.

[152] Тем не менее, вместо представления пороговой линии 406 частоты использования, которая совпадает с пороговым значением 407 частоты использования характеристики приближения гипотезы, во втором сценарии, в отличие от первого, представлена пороговая линия 606 частоты использования, которая совпадает с пороговым значением 607 частоты использования характеристики приближения гипотезы в отношении частоты использования. В этом случае, предполагается, что пороговое значение 607 частоты использования определяется сервером 230 таким образом, что оно выше порогового значения 407 частоты использования.

[153] Также, вместо представления пороговой линии 408 сходства строк, которая совпадает с пороговым значением 409 сходства строк характеристики приближения гипотезы, во втором сценарии, в отличие от первого, представлена пороговая линия 608 сходства строк, которая совпадает с пороговым значением 609 сходства строк характеристики приближения гипотезы в отношении частоты использования. В этом случае, предполагается, что пороговое значение 609 сходства строк определяется сервером 230 таким образом, что оно выше порогового значения 409 сходства строк.

[154] В результате, вместо области 419 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 406 частоты использования и пороговой линией 408 сходства строк, во втором сценарии, в отличие от первого, представлена область 610 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 606 частоты использования и пороговой линией 608 сходства строк.

[155] Из-за того, что пороговое значение 609 сходства строк выше значения 409 сходства строк, а пороговое значение 607 частоты использования выше порогового значения 407 частоты использования, область 610 допустимого приближения гипотезы занимает большую поверхность на графическом представлении 600 графика, чем область 410 допустимого приближения гипотезы на графическом представлении 400 графика.

[156] Во втором сценарии, как показано на Фиг. 6, графические маркеры 452 и 454, которые связаны с заменяющими запросами-кандидатами 352 и 354 соответственно, расположены в области 610 допустимого приближения гипотезы. Таким образом, по меньшей мере один заменяющий запрос-кандидат, который связан с допустимыми значениями характеристик приближения гипотезы, представляет собой больше одного, а именно в данном случае два, заменяющих запроса-кандидата 352 и 354. Другими словами, сервер 230 может быть выполнен с возможностью выбирать более одного приближенного запроса в качестве заменяющих запросов-кандидатов 352 и 354.

[157] Следует отметить, что приближенные запросы относятся ко всем заменяющим запросам-кандидатам из набора заменяющих запросов-кандидатов 350, который связаны с соответствующими маркерами, расположенными в области 610 допустимого приближения гипотезы. Таким образом, во втором сценарии, вместо одного приближенного запроса, присутствует более одного приближенного запроса, т.е. заменяющие запросы-кандидаты 352 и 354. Следовательно, сервер 230 может быть выполнен с возможностью использовать заменяющие запросы-кандидаты 352 и 354 для приближения информации в отношении введенного пользователем запроса.

[158] Во втором сценарии, поскольку присутствует более одного приближенного запроса (т.е. заменяющие запросы-кандидаты 352 и 354), сервер 230 определяет, что заменяющие запросы-кандидаты 352 и 354 оба являются допустимыми приближениями для введенного пользователем запроса. Тем не менее, сервер 230 может быть выполнен с возможностью определять, какой из заменяющих запросов-кандидатов 352 и 354 является лучшим приближением для введенного пользователем запроса. В результате, вместо определения лучшего приближения (например, лучше приближенного запроса среди более чем одного приближенного запроса) для введенного пользователем запроса среди заменяющих запросов-кандидатов 352 и 354, сервер 230 может быть выполнен с возможностью использовать информацию в отношении обоих заменяющих запросов-кандидатов 352 и 354 для приближения информации в отношении введенного пользователем запроса.

[159] Это означает, что сервер 230 может быть выполнен с возможностью оценивать данные, связанные с прошлыми запросами, которые могли быть связаны с введенным пользователем запросом на основе данных, связанных с прошлыми запросами, в отношении заменяющих запросов-кандидатов 352 и 354 соответственно.

[160] Также сервер 230 может быть выполнен с возможностью оценивать данные, связанные с прошлыми запросами, которые могли быть связаны с введенным пользователем запросом на основе данных, связанных с прошлыми запросами, в отношении заменяющих запросов-кандидатов 352 и 354 соответственно. Это означает, что сервер 230 может быть выполнен с возможностью оценивать предыдущие преобразования между введенным пользователем запросом и каждым из одного из набора заменяющих запросов-кандидатов 350 на основе (i) прошлых преобразований между заменяющим запросом-кандидатом 352 (т.е. первым из более чем одного приближенного запроса) и каждым из набора заменяющих запросов-кандидатов 350 и (ii) прошлых преобразований между заменяющим запросом-кандидатом 354 (т.е. вторым из более чем одного приближенного запроса) и каждым из набора заменяющих запросов-кандидатов 350.

[161] Сервер 230 может быть выполнен с возможностью вычислять соответствующий вектор свойств для каждой пары, состоящей из данного одного из боле чем одного приближенного запроса и данного одного из набора заменяющих запросов-кандидатов 350. Это означает, что, поскольку во втором сценарии больше одного приближенного запроса (заменяющие запросы-кандидаты 352 и 354), сервер 230 выполнен с возможностью вычислять соответствующий вектор свойств для: (i) каждой пары, состоящей из заменяющего запроса-кандидата 352 (т.е. первого из более чем одного приближенного запроса) и данного одного из набора заменяющих запросов-кандидатов 350 (т.е. аналогично первому сценарию), и (ii) каждой пары, состоящей из заменяющего запроса-кандидата 354 (т.е. второго из более чем одного приближенного запроса) и данного одного из набора заменяющих запросов-кандидатов 350.

[162] На Фиг. 7 представлено множество векторов 700 свойств. Сервер 230 создает соответствующий вектор свойств из множества векторов свойств для, (i) каждой пары, состоящей из заменяющего запроса-кандидата 352 (т.е. первого из более чем одного приближенного запроса) и данного одного из набора заменяющих запросов-кандидатов 350 (т.е. аналогично первому сценарию), и (ii) каждой пары, состоящей из заменяющего запроса-кандидата 354 (т.е. второго из более чем одного приближенного запроса) и данного одного из набора заменяющих запросов-кандидатов 350. Другими словами, для каждой пары из множества пар 780, сервер 230 может быть выполнен с возможностью создавать соответствующий вектор свойств из множества векторов 700 свойств.

[163] Исключительно для целей иллюстрации, множество пар 780 включает в себя:

- первую пару 582, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. первого из более чем одного приближенного запроса), который является первым запросом в первой паре 582, и (ii) заменяющего запроса-кандидата 352 "oligophsony", который является вторым запросом в первой паре 582;

- вторую пару 584, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. первого из более чем одного приближенного запроса), который является первым запросом во второй паре 584, и (ii) заменяющего запроса-кандидата 354 "oligospoony", который является вторым запросом во второй паре 584;

- третью пару 586, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. первого из более чем одного приближенного запроса), который является первым запросом в третьей паре 586, и (ii) заменяющего запроса-кандидата 356 "oligopoly", который является вторым запросом в третьей паре 586;

- четвертую пару 588, состоящую из (i) заменяющего запроса-кандидата 352 "oligophsony" (т.е. первого из более чем одного приближенного запроса), который является первым запросом в четвертой паре 588, и (ii) заменяющего запроса-кандидата 358 "oligophrenia", который является вторым запросом в четвертой паре 588;

- пятую пару 782, состоящую из (i) заменяющего запроса-кандидата 354 "oligospoony" (т.е. второго из более чем одного приближенного запроса), который является первым запросом в пятой паре 782, и (ii) заменяющего запроса-кандидата 352 "oligophsony", который является вторым запросом в пятой паре 782;

- шестую пару 784, состоящую из (i) заменяющего запроса-кандидата 354 "oligospoony" (т.е. второго из более чем одного приближенного запроса), который является первым запросом в шестой паре 784, и (ii) заменяющего запроса-кандидата 354 "oligospoony", который является вторым запросом в шестой паре 784;

- седьмую пару 786, состоящую из (i) заменяющего запроса-кандидата 354 "oligospoony" (т.е. второго из более чем одного приближенного запроса), который является первым запросом в седьмой паре 786, и (ii) заменяющего запроса-кандидата 356 "oligopoly", который является вторым запросом в седьмой паре 786; и

- и восьмую пару 788, состоящую из (i) заменяющего запроса-кандидата 354 "oligospoony" (т.е. второго из более чем одного приближенного запроса), который является первым запросом в восьмой паре 788, и (ii) заменяющего запроса-кандидата 358 "oligophrenia", который является вторым запросом в восьмой паре 788.

[164] Для целей упрощения, в отличие от Фиг. 5, где было представлено множество наборов 550 данных свойств, соответствующие наборы данных свойств, определенные сервером 230 для создания множества векторов 700 свойств, были опущены. Тем не менее, следует иметь в виду, что сервер 230 может быть выполнен с возможностью определять соответствующий набора данных свойств для каждой из множества пар 780 для создания соответствующего вектора свойств из множества векторов 700 свойств аналогично тому, как это было описано в первом сценарии.

[165] В некоторых вариантах осуществления настоящей технологии, по меньшей мере некоторые из векторов 700 свойств были уже вычислены и сохранены сервером 230. Например, если сервер 230 занят вычислением вектора свойств для пары запросов, сервер 230 может быть выполнен с возможностью искать на своем твердотельном накопителе 120 и/или в базе 270 данных журнала запросов, указание на данную пару запросов и соответствующий связанный вектор свойств. Таким образом, сервер 230 может быть выполнен с возможностью просто извлекать вектор свойств вместо того, чтобы создавать этот вектор свойств заново.

[166] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть создан с возможностью сохранять множество пар 780 в связи со множеством векторов 700 свойств. Другими словами, сервер 230 может быть выполнен с возможностью сохранять каждую пару из множества пар 780 в связи с соответствующим вектором из множества векторов 700 свойств. Сервер 230 может быть выполнен с возможностью сохранять множество пар 780, связанных с множеством векторов 700 свойств, в базе 270 данных журнала запросов и/или на твердотельном накопителе 120 сервера 230.

[167] Создание каждого из множества векторов 700 свойств может осуществлять сервером 230 аналогично тому, как сервер 230 выполнен с возможностью создавать каждый из множества векторов 500 свойств в первом сценарии.

[168) Таким образом, исключительно для целей иллюстрации, множество векторов 500 свойств включает в себя:

- первый вектор 502 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. первый из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 352 "oligophsony";

- второй вектор 504 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. первый из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 354 "oligospoony";

- третий вектор 506 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. первый из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 356 "oligopoly";

- четвертый вектор 508 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 352 "oligophsony" (т.е. первый из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 358 "oligophrenia";

- пятый вектор 702 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 354 "oligospoony" (т.е. второй из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 352 "oligophsony";

- шестой вектор 704 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 354 "oligospoony" (т.е. второй из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 354 "oligospoony";

- седьмой вектор 706 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 354 "oligospoony" (т.е. второй из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 356 "oligopoly"; и

- восьмой вектор 708 свойств, который представляет собой предыдущие преобразования между заменяющим запросом-кандидатом 354 "oligospoony" (т.е. второй из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 358 "oligophrenia".

[169] Как уже упоминалось ранее, во втором сценарии, поскольку присутствует более одного приближенного запроса (т.е. заменяющие запросы-кандидаты 352 и 354), сервер 230 определяет, что заменяющие запросы-кандидаты 352 и 354 оба являются допустимыми приближениями для введенного пользователем запроса. Тем не менее, сервер 230 может быть выполнен с возможностью определять, который из заменяющих запросов-кандидатов 352 и 354 является лучшим приближением для введенного пользователем запроса. В результате, вместо определения лучшего приближения (лучшего из более чем одного приближенного запроса) для введенного пользователем запроса среди заменяющих запросов-кандидатов 352 и 354, сервер 230 может быть выполнен с возможностью использовать информацию в отношении обоих заменяющих запросов-кандидатов 352 и 354 для приближения информации в отношении введенного пользователем запроса.

[170] С этой целью, сервер 230 может быть выполнен с возможностью осуществлять объединение сервером более одного вектора свойств, которые представляют предыдущие преобразования между каждым из более одного приближенного запроса и соответствующим данным одним из набора заменяющих запросов-кандидатов 350, в соответствующий объединенный вектор свойств;

[171] На Фиг. 8 представлена процедура 800 объединения множества векторов 700 свойств. Сервер 230 может быть выполнен с возможностью объединять:

- первую совокупность 802 векторов свойств, которые представляют предыдущие преобразования между (i) заменяющим запросом-кандидатом 352 (т.е. первым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 352 (т.е. первым вектором 502 свойств) и между (ii) заменяющим запросом-кандидатом 354 (т.е. вторым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 352 (т.е. пятым вектором 702 свойств);

- вторую совокупность 804 векторов свойств, которые представляют предыдущие преобразования между (i) заменяющим запросом-кандидатом 352 (т.е. первым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 354 (т.е. вторым вектором 504 свойств) и между (ii) заменяющим запросом-кандидатом 354 (т.е. вторым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 354 (т.е. шестым вектором 704 свойств);

- третью совокупность 806 векторов свойств, которые представляют предыдущие преобразования между (i) заменяющим запросом-кандидатом 352 (т.е. первым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 356 (т.е. третьим вектором 506 свойств) и между (ii) заменяющим запросом-кандидатом 354 (т.е. вторым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 356 (т.е. седьмым вектором 706 свойств); и

- четвертую совокупность 808 векторов свойств, которые представляют предыдущие преобразования между (i) заменяющим запросом-кандидатом 352 (т.е. первым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 358 (т.е. четвертым вектором 508 свойств) и между (ii) заменяющим запросом-кандидатом 354 (т.е. вторым из из более чем одного приближенного запроса) и заменяющим запросом-кандидатом 358 (т.е. восьмым вектором 708 свойств).

[172] Это означает, что сервер 230 может быть выполнен с возможностью объединять:

- первый вектор 502 свойств (связанный с первой парой 582, состоящей из заменяющего запроса-кандидата 352 и заменяющего запроса-кандидата 352) с пятым вектором 702 свойств (связанным с пятой парой 782, состоящей из заменяющего запроса-кандидата 354 и заменяющего запроса-кандидата 352);

- второй вектор 504 свойств (связанный со второй парой 584, состоящей из заменяющего запроса-кандидата 352 и заменяющего запроса-кандидата 354) с шестым вектором 704 свойств (связанным с шестой парой 784, состоящей из заменяющего запроса-кандидата 354 и заменяющего запроса-кандидата 354);

- третий вектор 506 свойств (связанный с третьей парой 586, состоящей из заменяющего запроса-кандидата 352 и заменяющего запроса-кандидата 356) с седьмым вектором 706 свойств (связанным с седьмой парой 786, состоящей из заменяющего запроса-кандидата 354 и заменяющего запроса-кандидата 356); и

- четвертый вектор 508 свойств (связанный с четвертой парой 588, состоящей из заменяющего запроса-кандидата 352 и заменяющего запроса-кандидата 358) с восьмым вектором 708 свойств (связанным с восьмой парой 788, состоящей из заменяющего запроса-кандидата 354 и заменяющего запроса-кандидата 358).

[173] Сервер 230 может быть выполнен с возможностью объединять:

- первую совокупность 802 векторов свойств в первый объединенный вектор 852 свойств из множества объединенных векторов 850 свойств;

- вторую совокупность 804 векторов свойств во второй объединенный вектор 854 свойств из множества объединенных векторов 850 свойств;

- третью совокупность 806 векторов свойств в третий объединенный вектор 856 свойств из множества объединенных векторов 850 свойств; и

- четвертую совокупность 808 векторов свойств в четвертый объединенный вектор 858 свойств из множества объединенных векторов 850 свойств.

[174] Следует отметить, что каждая из первой, второй, третьей и четвертой совокупностей 802, 804, 806 и 808 векторов свойств соответственно включает в себя более одного, а именно два, вектора свойства. Тем не менее, в других вариантах осуществления технологии, каждая из первой, второй, третьей и четвертой совокупностей 802, 804, 806 и 808 векторов свойств соответственно может включать в себя другое число векторов свойств, отличное от двух векторов свойств, не выходя за границы настоящей технологии.

[175] Тем не менее, подразумевается, что общее число векторов свойств в каждой из совокупностей 802, 804, 806 и 808 векторов свойств равно общему число приближенных запросов среди более чем одного приближенного запроса, которые определены сервером 230.

[176] Сервер 230 может быть выполнен с возможностью объединять каждую из совокупностей 802, 804, 806 и 808 векторов свойств различными способами. Например, сервер 230 может быть выполнен с возможностью усреднять каждую из совокупностей 802, 804, 806 и 808 векторов свойств для создания соответствующего объединенного вектора свойства из множества объединенных векторов 850 свойств. Это означает, что сервер 230 может быть выполнен с возможностью вычислять усредненный вектор для каждой из совокупностей 802, 804, 806 и 808 векторов свойств. В качестве другого примера, сервер 230 может быть выполнен с возможностью брать среднее из каждой из совокупностей 802, 804, 806 и 808 векторов свойств для создания соответствующего объединенного вектора свойства из множества объединенных векторов 850 свойств. Это означает, что сервер 230 может быть выполнен с возможностью вычислять средний вектор для каждой из совокупностей 802, 804, 806 и 808 векторов свойств.

[177] Вне зависимости от конкретного способа, которым сервер 230 может объединять каждую из совокупностей 802, 804, 806 и 808 векторов свойств, каждый соответствующий объединенный вектор свойств содержит информацию, которая представляет, по меньшей мере частично, информацию в отношении совокупности векторов свойств.

[178] В результате выполнения процедуры 800 объединения, сервер 230 создает множество объединенных векторов 850 свойств. Сервер 230 может быть выполнен с возможностью использовать соответствующий вектор свойств из множество объединенных векторов 850 свойств в качестве соответствующих приближенных векторов свойств, представляющих оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350. Другими словами, каждый объединенный вектор свойств из множества объединенных векторов свойств может быть использован как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350;

[179] В качестве иллюстрации, в рамках множества объединенных векторов 850 свойств:

- первый объединенный вектор 852 свойств может быть использован как первый приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и заменяющим запросом-кандидатом 352;

- второй объединенный вектор 854 свойств может быть использован как второй приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и заменяющим запросом-кандидатом 354;

- третий объединенный вектор 856 свойств может быть использован как третий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и заменяющим запросом-кандидатом 356; и

- четвертый объединенный вектор 858 свойств может быть использован как четвертый приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и заменяющим запросом-кандидатом 358.

[180] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью создавать соответствующий параметр ранжирования для каждого приближенного вектора свойств из множества приближенных векторов свойств с помощью системы ранжирования, аналогично тому, как сервер 230 создал соответствующий параметр ранжирования для каждого приближенного вектора свойств в первом сценарии.

[181] Например, предположим, что четвертый приближенный вектор свойств, который представляет оцененные предыдущие преобразования между введенным пользователем запросом "oligopsony" и заменяющим запросом-кандидатом 358 "oligophrenia", связан с наиболее высоким параметром ранжирования среди всех параметров ранжирования, вычисленных для каждого из множества приближенных векторов свойств (например, первый приближенный вектор свойств является первым объединенным вектором 852 свойств, второй приближенный вектор свойств является вторым объединенным вектором 854 свойств, третий приближенный вектор свойств является третьим объединенным вектором 856 свойств, четвертый приближенный вектор свойств является четвертым объединенным вектором 856 свойств и пятый приближенный вектор свойств является пятым объединенным вектором 858 свойств). Таким образом, сервер 230 может быть выполнен с возможностью определять, что заменяющий запрос для введенного пользователем запроса "oligopsony" - "oligophrenia".

[182] Сервер 230 может быть выполнен с возможностью создавать и передавать ответный пакет 290 данных на электронное устройство 210. Ответный пакет 290 данных во втором сценарии может содержать информацию, указывающую на заменяющий запрос "oligophrenia" для введенного пользователем запроса "oligopsony". Альтернативно, сервер 230 может включать, в ответ на ответный 290 пакет данных, поисковые результаты, которые отвечают на заменяющий запрос в дополнение или вместо поисковых результатов, который отвечают на введенный пользователем запрос.

[183] На Фиг. 9 представлена блок-схема способа 900 создания заменяющего запроса для введенного пользователем запроса. Способ 900 будет более подробно описан ниже.

ЭТАП 902: Выбор набора заменяющих запросов-кандидатов для введенного пользователем запроса из множества прошлых запросов

[184] Способ 900 начинается на этапе 902, где сервер 230 выбирает набор заменяющих запросов-кандидатов 350 для введенного пользователем запроса из множества прошлых запросов 300, использованных в исполняемом на компьютере сервисе, на основе сходства строк между введенным пользователем запросом и каждым из множества прошлых запросов 300.

[185] На Фиг. 3 представлено множество прошлых запросов 300, которые хранятся в базе 270 данных журнала запросов. Для выполнения этапа 902, в некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью получать доступ к базе 270 данных журнала запросов и извлекать из нее указание на множество прошлых запросов 300. Как уже ранее упоминалось, база 270 данных журнала запросов может хранить информацию, относящуюся к прошлым запросам, которые пользователи ранее ввели в сервер 230. Таким образом, множество прошлых запросов 300 может включать в себя предыдущие запросы, которые пользователи ранее ввели или иным образом использовались исполняемым на компьютере сервисом сервера 230.

[186] Сервер 230 может быть выполнен с возможностью оценивать сходство строки между введенным пользователем запросов и каждым из множества прошлых запросов 300 путем вычисления редакционного расстояния между введенным пользователем запросом и каждым из множества прошлых запросов 300.

[187] В общем случае, редакционное расстояние является способом количественной оценки того, насколько различаются две строки символов друг от друга путем вычисления минимального числа операций, которые потребуются для преобразования одной строки в другую. Например, сервер 230 может быть выполнен с возможностью вычислять расстояние Левенштейна между введенным пользователем запросом и каждым из множества прошлых запросов 300. Расстояние Левенштейна хорошо известно в данной области техники, это тип редакционного расстояния, которое позволяет удалять, добавлять и заменять символы.

[188] В некоторых вариантах осуществления настоящей технологии, для выбора набора заменяющих запросов-кандидатов 350, сервер 230 может быть выполнен с возможностью ранжировать множество прошлых запросов 300 в соответствии с соответствующими редакционными расстояниями, где данный из множества прошлых запросов 300, связанных с наименьшим редакционным расстоянием, ранжируется как первый, а другой из множества прошлых запросов 300, связанный с наибольшим расстоянием, ранжируется как последний. В этом случае, сервер 230 может выбирать, например, 20 наиболее высоко ранжированных прошлых запросов из множества прошлых запросов 300 как набор заменяющих запросов-кандидатов 350.

[189] Альтернативно, для выбора набора заменяющих запросов-кандидатов 350, сервер 230 может быть выполнен с возможностью сравнивать редакционное расстояние, связанное с каждым из множества прошлых запросов 300, с заранее определенным пороговым редакционным расстоянием, и выбирать предыдущие запросы из множества прошлых запросов 300, которые связаны с соответствующими редакционными расстояниями, которые ниже, чем заранее определенное пороговое редакционное расстояние, как набор заменяющих запросов-кандидатов 350.

[190] В некоторых вариантах осуществления настоящей технологии, набор заменяющих запросов-кандидатов 350 может включать в себя только наиболее похожие предыдущие запросы (т.е. с наименьшим редакционным расстоянием) среди множества прошлых запросов 300 по отношению к введенному пользователем запросу.

[191] Предполагается, что на основе сходства строк между введенным пользователем запросом "oligopsony и каждым из множества прошлых запросов 300, сервер 230 выбора четыре прошлых запроса 352, 354, 356 и 358, а именно "oligophsony", "oligospoony", "oligopoly" и "oligophrenia", соответственно, как часть набора заменяющих запросов-кандидатов 350.

[192] Следует отметить, что сервер 230, который выбирает предыдущие запрос 352, 354, 356 и 358 как набора заменяющих запросов-кандидатов 350, описан исключительно для целей упрощения и что в других вариантах осуществления настоящей технологи, другие предыдущие запросы могут быть выбраны как набор заменяющих запросов-кандидатов 350, и что другое общее число прошлых запросов, отличное от четырех прошлых запросов, может быть выбрано сервером 230 как часть набора заменяющих запросов-кандидатов 350, не выходя за границы настоящей технологии.

[193] Для целей нижеследующего описания, после того как сервер 230 выбрал набор заменяющих запросов-кандидатов 350 из множества прошлых запросов 300, предыдущие запросы 352, 354, 356 и 358 упоминаются как заменяющие запросы-кандидаты 352, 354, 356 и 358 соответственно из набора заменяющих запросов-кандидатов 350.

ЭТАП 904: Для набора заменяющих запросов-кандидатов, извлечение указания на данные о взаимозависимости прошлых запросов

[194] Способ 900 продолжается на этапе 904, где сервер 230 выполнен с возможностью, для набора заменяющих запросов-кандидатов 350, осуществлять извлечение указания на данные о взаимозависимости прошлых запросов. Данные о взаимозависимости прошлых запросов указывают на предыдущие преобразования между каждой парой заменяющих запросов-кандидатов в наборе заменяющих запросов-кандидатов 350.

[195] Сервер 230 может быть выполнен с возможностью извлекать указание на данные о взаимозависимости прошлых запросов для набора заменяющихся запросов-кандидатов 350 из базы 270 данных журнала запросов. В общем случае, сервер 230, где размещены один или несколько исполняемых на компьютере сервисов, например, поисковые системы, может использовать информацию из истории, собранную из большого количества ранее использованных запросов, которые были введены в систему, и могут храниться в базе 270 данных журнала запросов.

[196] В некоторых вариантах осуществления настоящей технологии, база 270 данных журнала запросов может содержать одну или несколько коллекций данных, относящихся к запросам, которые пользователи ранее ввели в сервер 230. Другими словами, сервер 230 может быть выполнен с возможностью заполнять базу 270 данных журнала запросов на основе пользовательских взаимодействий с исполняемыми на компьютере сервисами, которые расположены на нем. В некоторых вариантах осуществления технологии, тем не менее, сервер 230 может быть выполнен с возможностью связываться и использовать внешние ресурсы, чтобы продолжить заполнение базы 270 данных журнала запросов.

[197] В некоторых вариантах осуществления настоящей технологии, база 270 данных журнала запросов может быть выполнена с возможностью сохранять "данные, связанные с прошлыми запросами", связанные с каждым прошлым запросом, введенным в поисковую систему сервера 230. Например, данные, связанные с прошлыми запросами могут включать в себя данные о кликах из прошлых запросов, введенных в поисковую систему сервера 230. Эти данные о кликах могут храниться в форме записей, указывающих на то, что на данные документы был совершен "клик" пользователями поисковой системы, когда они просматривали результаты поиска для их соответствующих прошлых запросов.

[198] Дополнительно, данные, связанные с прошлыми запросами, могут включать в себя дополнительные статистические данные, связанные с прошлыми запросами, введенными в поисковую систему сервера 230. Например, частота использования данного прошлого запроса, которая указывает на то, как часто данный прошлый запрос был введен в сервер 230, может храниться на сервере 230 в связи с данным прошлым запросом.

[199] В дополнительных вариантах осуществления настоящей технологии, база 270 данных журнала запросов может быть выполнена с возможностью сохранять "данные о взаимозависимости прошлых запросов", которые указывают на предыдущие преобразования между парой прошлых запросов, введенных в поисковую систему сервера 230. Данные о взаимозависимости прошлых запросов могут извлекаться из данных поисковой сессии, связанных с прошлыми поисковыми сессиями, которые осуществлялись пользователями поисковой системы.

[200] Данные поисковой сессии могут содержать информацию, связанную со множеством подмножеств прошлых запросов, которые были введены пользователями во время различных поисковых сессий. Данные о поисковой сессии могут предоставлять релевантную информацию в отношении данного подмножества прошлых запросов в виде последовательности прошлых запросов, введенных данных пользователем в данной прошлой поисковой сессии, был ли данный прошлый запрос в данной прошлой поисковой сессии явно исправлен пользователем (например, путем ввода последующего прошлого поискового запроса, по сути аналогичного данному предыдущему запросу), был ли данный прошлый запрос в данной прошлой поисковой сессии неявно исправлен (например, когда поисковая система предоставила поисковые результаты данному пользователю в ответ на исправленный прошлый поисковый запрос вместо того, чтобы предоставить их в ответ на данный прошлый поисковый запрос, и данный пользователь существенно взаимодействовал с этими поисковыми результатами) и так далее.

[201] Другими словами, данные о взаимозависимости прошлых запросов для данного прошлого запроса могут указывать на предыдущие преобразования, которые могут быть извлечены сервером 230 из базы 270 данных журнала запросов, между данных прошлым поисковым запросом, введенным в поисковую систему, и другим прошлым поисковым запросом, введенным в поисковую систему. Таким образом, данные о взаимозависимости прошлых запросов для данной пары прошлых запросов могут указывать на предыдущие преобразования, которые могут быть извлечены сервером 230 из базы 270 данных журнала запросов, между первым прошлым запросом в данной паре прошлых запросов, введенных в поисковую систему, и вторым прошлым запросом в данной паре прошлых запросов, введенных в поисковую систему.

[202] Таким образом, в некоторых вариантах осуществления настоящей технологии, сервер 230 может извлекать соответствующее указание на данные о взаимозависимости прошлых запросов для каждой пары заменяющих запросов-кандидатов в наборе заменяющих запросов-кандидатов 350 путем получения доступа к базе 270 данных журнала запросов.

[203] Следует отметить, что введенный пользователем запрос не включен в набор заменяющих запросов-кандидатов 350, поскольку введенный пользователем запрос никогда не был использован сервером 230 и, следовательно, база 270 данных журнала запросов не обладает никакой информацией в отношении пользовательских взаимодействий с введенным пользователем запросом. В результате, данные о взаимозависимости прошлых запросов, извлеченные сервером 230 из базы 270 данных журнала запросов, не указывают ни на какие предыдущие преобразования между введенным пользователем запросом и любым из набора заменяющих запросов-кандидатов 350.

ЭТАП 906: Выбор приближенного запроса из набора запросов на основе сходства строк и частоты использования

[204] Способ 900 продолжается на этапе 906, где сервер 230 выполнен с возможностью выбирать приближенный запрос из набора заменяющих запросов-кандидатов 350 на основе (i) сходства строк между введенным пользователем запросом и каждым из набора заменяющих запросов-кандидатов 350 и (ii) частоты использования каждого из набора заменяющих запросов-кандидатов 350, где пользовательская частота основана на прошлых взаимодействиях пользователя с исполняемым на компьютере сервисом.

[205] Следует отметить, что этап 906, в некоторых вариантах осуществления настоящей технологии, может выполняться сервером 230 до этапа 904 или параллельно с ним.

[206] В соответствии с первым сценарием, на Фиг. 4 представлено графическое представление 400 графика, на котором размещены (i) соответствующие сходства строк каждого из набора заменяющих запросов-кандидатов 350 и введенного пользователем запроса и (ii) соответствующие частоты использования каждого из набора заменяющих запросов-кандидатов 350. Графическое представление 400 определено осью 402 частоты использования и осью 404 сходства строк.

[207] Представлена область 410 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 406 частоты использования и пороговой линией 408 сходства строк. Важно иметь в виду, что если данный заменяющий запрос-кандидат расположен в области 410 допустимого приближения гипотезы на основе его соответствующего сходства строк по отношению к введенному пользователем запросу на основе его частоты использования, данный заменяющий запрос-кандидат выбирается как приближенный запрос, который может быть использован сервером 230 для приближения данных, связанных с прошлыми запросами, и данных о взаимозависимости прошлых запросов по отношению к введенному пользователем запросу.

[208] В самом деле, если данный заменяющий запрос-кандидат расположен в области 410 допустимого приближения гипотезы, данный заменяющий запрос-кандидат связан с допустимыми значениями характеристик приближения гипотезы, а именно - данным допустимым значением частоты использования для характеристики приближения гипотезы и данным допустимым значением сходства строк для характеристики приближения гипотезы.

[209] В первом сценарии, как показано на Фиг. 4, только графический маркер 452, который связан с заменяющим запросом-кандидатом 352, расположен в области 410 допустимого приближения гипотезы. Таким образом, приближенный запрос, который связан с допустимыми значениями характеристик приближения гипотезы, является заменяющим запросом-кандидатом 352.

[210] В некоторых вариантах осуществления настоящей технологии, вместо выбора одного приближенного запроса, как в первом сценарии, сервер 230 может быть выполнен с возможностью выбирать более одного приближенного запроса, как во втором сценарии.

[211] В соответствии со вторым сценарием, на Фиг. 6, аналогично первому сценарию, представлено графическое представление 600 графика, на котором размещены соответствующие сходства строк каждого из набора заменяющих запросов-кандидатов 350 и введенного пользователем запроса и соответствующие частоты использования каждого из набора заменяющих запросов-кандидатов 350.

[212] Вместо области 419 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 406 частоты использования и пороговой линией 408 сходства строк, во втором сценарии, в отличие от первого, представлена область 610 допустимого приближения гипотезы, которая ограничена осью 404 сходства строк, осью 402 частоты использования, пороговой линией 606 частоты использования и пороговой линией 608 сходства строк.

[213] Из-за того, что пороговое значение 609 частоты использования выше значения 409 сходства строк, а пороговое значение 607 частоты использования выше порогового значения 407 частоты использования, область 610 допустимого приближения гипотезы занимает большую поверхность на графическом представлении 600, чем область 410 допустимого приближения гипотезы на графическом представлении 400 графика.

[214] Во втором сценарии, как показано на Фиг. 6, графические маркеры 452 и 454, которые связаны с заменяющими запросами-кандидатами 352 и 354 соответственно, расположены в области 610 допустимого приближения гипотезы. Таким образом, присутствует больше одного, в данном случае два, приближенных запроса (т.е. заменяющие запросы-кандидаты 352 и 354).

[215] Следует отметить, что приближенные запросы относятся ко всем заменяющим запросам-кандидатам из набора заменяющих запросов-кандидатов 350, который связаны с соответствующими маркерами, расположенными в области допустимого приближения гипотезы.

[216] В первом сценарии существует один приближенный запрос (т.е. заменяющий запрос-кандидат 352). Следовательно, сервер 230 может быть выполнен с возможностью использовать заменяющий запрос-кандидат 352 как приближение введенного пользователем запроса в первом сценарии.

[217] Во втором сценарии существует более одного приближенного запроса (т.е. заменяющие запросы-кандидаты 352 и 354). Следовательно, сервер 230 может быть выполнен с возможностью использовать заменяющие запросы-кандидаты 352 и 354 для приближения информации в отношении введенного пользователем запроса во втором сценарии.

ЭТАП 908: Для каждой пары, состоящей из приближенного запроса и данного одного из набора заменяющих запросов-кандидатов, создание соответствующего вектора свойств

[218] Способ 900 продолжается на этапе 908, где сервер 230 выполнен с возможностью, для каждой пары приближенного запроса и одного из набора заменяющих запросов-кандидатов 350, осуществлять создание соответствующего вектора свойств на основе данных о взаимозависимости прошлых запросов между приближенным запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350.

[219] Данный вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350.

[220] В первом сценарии сервер 230 может быть выполнен с возможностью использовать соответствующий вектор свойств как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350.

[221] Во втором сценарии, где сервер 350 выбирает более одного приближенного запроса (вместо одного приближенного запроса), сервер 230 может, для каждой пары, состоящей из одного из более чем одного приближенного запроса и данного одного из набора заменяющих запросов-кандидатов 350, создавать соответствующий вектор свойств на основе данных о взаимозависимости прошлых запросов между соответствующим одним из более чем одного приближенного запроса и соответствующим одним из набора заменяющих запросов-кандидатов 350. В данном случае, данный вектор свойств представляет собой предыдущие преобразования между данным одним из более чем одного приближенного запроса и соответствующим одним из набора заменяющих запросов-кандидатов 350.

[222] Во втором сценарии, сервер 230 может осуществлять объединение сервером более одного вектора свойств, которые представляют предыдущие преобразования между каждым из более одного приближенного запроса и данным одним из набора заменяющих запросов-кандидатов 350, в соответствующий объединенный вектор свойств.

[223] В некоторых вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью объединять более одного вектора свойств в соответствующий объединенный вектор свойств путем вычисления соответствующего усредненного вектора на основе более чем одного вектора свойств. В других вариантах осуществления настоящей технологии, сервер 230 может быть выполнен с возможностью объединять более одного вектора свойств в соответствующий объединенный вектор свойств путем вычисления соответствующего среднего вектора на основе более чем одного вектора свойств.

[224] В этом случае, соответствующий объединенный вектор свойств используется как соответствующий приближенный вектор свойств, который представляет собой оценку прошлых преобразований между введенным пользователем запросом и соответствующим одним из набора заменяющих запросов-кандидатов 350.

ЭТАП 910: Создание соответствующего параметра ранжирования для каждого приближенного вектора свойств

[225] Способ 900 продолжается на этапе 910, где сервер 230 выполнен с возможностью создавать соответствующий параметр ранжирования для каждого приближенного вектора свойств. Параметр ранжирования данного приближенного вектора свойств указывает на вероятность того, что соответствующий один из набора заменяющих запросов-кандидатов 350 является заменяющим запросом для введенного пользователем запроса.

[226] В некоторых вариантах осуществления настоящей технологии сервер 230 может быть выполнен с возможностью использовать систему ранжирования, как было упомянуто ранее. Например, сервер 230 может создавать соответствующие параметры ранжирования для приближенных векторов свойств с помощью алгоритма машинного обучения. Алгоритм машинного обучения может представлять собой линейное ранжирование.

ЭТАП 912: Определение заменяющего запроса для введенного пользователем запроса среди набора заменяющих запросов-кандидатов на основе соответствующих параметров ранжирования

[227] Способ 900 завершается на этапе 912, где сервер 230 определяет заменяющий запрос для введенного пользователем запроса среди набора заменяющих запросов-кандидатов 350 на основе соответствующих параметров ранжирования.

[228] Другими словами, после того как сервер 230 определяет соответствующие параметры ранжирования для каждого из множества приближенных векторов свойств, сервер 230 может идентифицировать данный приближенный вектор свойств (среди множества приближенных векторов свойств), который связан с наиболее высоко ранжированным параметром. Таким образом, сервер 230 может определить, что заменяющий запрос является соответствующим запросом из набора заменяющих запросов-кандидатов 350, который связан с данным приближенным вектором свойств.

[229] Модификации и улучшения вышеописанных вариантов осуществления настоящей технологии будут ясны специалистам в данной области техники. Предшествующее описание представлено только в качестве примера и не устанавливает никаких ограничений. Таким образом, объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.

СПОСОБЫ И СИСТЕМЫ ДЛЯ СОЗДАНИЯ ЗАМЕНЯЮЩЕГО ЗАПРОСА ДЛЯ ВВЕДЕННОГО ПОЛЬЗОВАТЕЛЕМ ЗАПРОСА

Источник поступления информации: Роспатент

‹ › ×

Правообладатели

Показаны записи 1-1 из 1.

22.06.2019

№219.017.8e0e

Способ и система перевода исходного предложения на первом языке целевым предложением на втором языке

Изобретение относится к вычислительной технике. Технический результат – обеспечение перевода исходного предложения целевым предложением. Реализуемый на компьютере способ перевода исходного предложения на первом языке целевым предложением на втором языке включает: прием исходного предложения;...

Тип: Изобретение

Номер охранного документа: 0002692049

Дата охранного документа: 19.06.2019

Показать авторов и правообладателей