Вид РИД
Изобретение
Изобретение относится к области вычислительной техники, основанной на детерминированных конечных автоматах и стековых вычислительных машинах. Более точно - к компьютерному системному анализу численных данных в структурированных массивах информации, предназначенным для решения задачи определения математически обусловленных функциональных зависимостей, и может быть также использовано для анализа существующих в матрицах математически обусловленных функциональных зависимостей, в частности, для проверки новых векторов на непротиворечивость исходным данным.
Предлагаемый способ позволяет существенно снизить трудоемкость анализа разнородных статистических данных и обеспечить получение набора математически обусловленных функциональных зависимостей для дальнейшего исследования сложных технических систем эргатического типа («персонал-система-среда»).
Известен способ (см. патент RU №2504006, 10.01.2014, МПК7 G06N 3/08) в котором для последовательного поиска и восстановления зависимостей между матрицей исходных данных и эталонными данными используется численная оптимизация статистических параметров нейросети на основе дополнения процесса ее обучения экспертными данными. Такое решение позволяет за счет знаний эксперта существенно увеличить качество и скорость процесса обучения нейросети. Вместе с тем, ему также присущи и недостатки, которые связаны с тем, что фактически время, затрачиваемое на обучение нейросети, переносится на этап проведения экспертной обработки исходных данных. Кроме того, мнение эксперта о возможной классификации исходных данных зачастую может быть субъективным и не совпадать с общим мнением экспертной группы.
Известно также техническое решение (см. патент RU №.105038, 27.05.2011, МПК7 G06F 9/45) в котором для установления зависимости между матрицей исходных данных и эталонными данными используется метод регрессионного анализа на основе заранее определенных классов функций. Такое техническое решение, в отличие от предыдущего решения, позволяет получить аналитический вид зависимости, однако, в основе используемого способа восстановления зависимостей также содержится аналог нейросети с заранее заданной структурой.
Недостатком выше указанного технического решения, является необходимость априорного задания классов функций, что делает его применение ограниченным и требует значительных временных ресурсов для реализации.
Известен способ обучения искусственной нейронной сети (ИНС) (см. патент RU №2504006, 10.01.2014, МПК7 G06N3/08), заключающийся в подаче исходных данных на вход ИНС, которая на основании обучающих примеров осуществляет оптимизацию статистических коэффициентов в виде векторов синаптических весов нейронов с соответствующей коррекцией до завершения обучения ИНС. Данное изобретение выбрано в качестве прототипа.
Недостатками указанного способа являются требование исходного существования структуры нейросети и невозможность осуществления последовательного приближения к исходному виду функции.
Целью предлагаемого изобретения является устранение вышеуказанных недостатков.
Указанная цель достигается путем последовательного усложнения математических формул с их последующей подачей на оптимизатор и сохранения математически обусловленных зависимостей для дальнейшей оценки вероятности их появления.
Решение сформулированной задачи целесообразно реализовать в виде отдельного унифицированного блока, что позволяет ускорить процесс поиска функциональных зависимостей и расчет вероятности их наблюдения за счет распараллеливания вычислений.
На фиг. 1 представлена схема устройства поиска функциональных зависимостей между входными и выходными данными.
Устройство для поиска функциональных зависимостей содержит: базу данных (сервер очередей) - 1, генератор функций - 2, блок оптимизации - 3, который включает в себя компилятор математических выражений в объектный код - 4, блок оптимизации статистических коэффициентов - 5 и объектную машину - 6.
Вход и выходы устройства поиска функциональных зависимостей (которыми являются вход и выход сервера очередей 1) на фиг. 1 не показаны.
База данных (сервер очередей) - 1 представляет собой систему выдачи на генератор функций исходной матрицы численных значений и целевого вектора параметров исследуемого объекта. Отличительной особенностью его является то, что за одно обращение он выдает ровно один набор данных. В сервер очередей может входить база данных, которая используется для хранения исходных данных и результатов расчета.
Генератор функций - 2 представляет собой систему поэтапного усложнения математических функций, который работает на основе заранее заданной формальной грамматики. Эта грамматика описывает, в свою очередь, множество всех возможных математически корректных формул. Структурно генератор получает исходные данные от сервера очередей, генерирует функции и передает их в компилятор математических выражений.
Блок оптимизации - 3 представляет собой систему поиска оптимальных значений набора статистических коэффициентов в переданной от генератора функций (2) формулы. Структурно блок оптимизации 3 получает исходные данные для расчета и математическую формулу от генератора функций, а также осуществляет оптимизацию статистических коэффициентов переданной формулы по заранее выбранному функционалу. В качестве возвращаемого на генератор функций 2 данных блок оптимизации 3 использует функционал, который рассчитывается на основе отклонения эталонных и расчетных данных.
Компилятор математических выражений - 4 представляет транслятор переданных математических формул в объектный код, что способствует существенному ускорению расчетов.
Блок оптимизации статистических коэффициентов - 5 представляет собой систему численной оптимизации статистических коэффициентов по заранее заданному функционалу.
Объектная машина - 6 представляет собой устройство, выполняющее объектный код, который генерирует компилятор математических выражений. Технически объектная машина представляет собой стековую вычислительную машину.
Сущность способа последовательного поиска и восстановления функциональных зависимостей и устройство для его реализации заключается в следующем.
Генератор функций 2, осуществляющий общее управление поиском математически обусловленных функциональных зависимостей, производит запрос задания, хранимого в сервере очередей 1. Генератор функций 2 инициализирует значение текущей формулы пустой строкой и производит на основе формальной грамматики вывод всех формул, которые отличаются от исходной формулы применением ровно одного правила. При этом на данном этапе предусматривается возможность увеличения количества статистических коэффициентов в формуле на 1. Данный набор функциональных зависимостей последовательно передается на оптимизатор функций (3), который последовательно возвращает обратно формулы с рассчитанными коэффициентами и ошибку в расчетах. На основании этих данных в сервер очередей передается для хранения информация о формуле с наименьшей ошибкой и сложность ее математической конструкции, определяемая как количество правил грамматики, которое необходимо применить для синтаксического разбора полученной формулы. На основании этих данных сервер очередей (1) осуществляет оценку вероятности наблюдения формулы, как отношение количества раз, сколько формула передавалась в блок (1) к общему числу транзакций по передаче формулы заданной сложности.
Оптимизатор функций (3), получая данные от генератора функций (2), осуществляет компиляцию переданной формулы в объектный код при помощи транслятора (4), который после этого передает полученный результат, исходную матрицу численных данных и вектор целевых значений на оптимизатор статистических коэффициентов (5).
Оптимизатор статистических коэффициентов (5) осуществляет поиск наилучшего набора статистических коэффициентов переданной формулы, используя для этого объектную машину (6), которая производит вычисления на основе полученного от генератора функций (2) объектного кода.
Модельный пример
Известны исходные данные о характеристиках отечественных и зарубежных средств выведения (СВ), представленные в виде матрицы вида (таблица 1):
Таблица 1.
|
|
Требуется: определить возможный вид зависимости "Стоимости" средств выведения (Y) от массы ракеты (X1) и массы полезной нагрузки (ПН, Х0), выводимой на различные низкие околоземные орбиты (НОО) для решения целевых задач.
Решения, которые были получены с использованием предлагаемого способа и разработанного на его основе алгоритма (показаны только наилучшие в своем уровне сложности функциональные зависимости) представлены в таблице 2.
Таблица 2.
|
* обеспечиваемая полученной функциональной зависимостью сумма квадратов отклонений между рассчитанным и фактическим значениями.
С практической точки зрения, соответствие между единицами измерений для функциональных зависимостей (Y) и значениями вектора X=(Х0, Х1) обеспечивается тем, что подобные преобразования осуществляются при помощи найденных предлагаемым в заявке способом значениями статистических коэффициентов. Данная особенность иллюстрируется примером формирования функциональных зависимостей с уровнями сложности 1 и 2, которые могут быть записаны в виде:
где
– стоимость пуска ракеты космического назначения (РКН), млн. долл.;
– выводимая масса полезной нагрузки (ПН) на НОО, размерность которой – кг.;
– статистический коэффициент, выраженный в (млн. долл.) на один килограмм полезной нагрузки, характеризующий удельную стоимость выведения ПН.
С экономической точки зрения, данная формула вида (1) полностью соответствует существующему в ракетно-космической отрасли методическому подходу к укрупненной оценке стоимости оказания пусковых услуг, которая активно используется при сравнении конкурентоспособности отечественных и зарубежных средств выведения /1, 2/.
где
– стоимость пуска РКН, млн. долл.;
– масса РКН, выраженная в кг;
– статистический коэффициент, выраженный в (млн. долл.) на один килограмм РКН, характеризующий удельную стоимость производства и эксплуатации РКН.
Кроме того, с экономической точки зрения, выражения (1) и (2) соответствуют рекомендованным к использованию ФГУП «Организация «Агат» укрупненным соотношениям, которые приняты к использованию при планировании ценообразования на производство и эксплуатацию средств выведения (СВ). При этом необходимо отметить, что существующие отклонения в значениях статистических коэффициентов
и
от приведенных в нормативно-правовых документах объясняются использованием в рассматриваемом модельном примере данных не только по российским средствам выведения, но также и по зарубежным СВ.
Таким образом, предлагаемый способ поиска и восстановления функциональных зависимостей характеризуется следующей новизной и практической значимостью:
Полученные в ходе поиска функциональные зависимости с уровнем сложности до 5-го уровня включительно коррелируются по своей структуре с принятым в ракетно-космической отрасли укрупненным подходом, который предусматривает использование при распределении финансовых средств по государственному заказу методов линейного регрессионного анализа.
Получаемые далее соотношения функциональных зависимостей (например, по уровню сложности 13) демонстрируют переход к таким функциональным зависимостям, которые наиболее полно соответствуют академическим исследованиям, а также зависимостям, которые на практике используют при проектировании средств выведения конструкторские бюро предприятий и организаций Государственной корпорации «Роскомос».
Возможность практической реализации представленного способа и его технической реализации, т.е. возможность ее промышленного применения, подтверждается следующими факторами. Общая структура реализации подобных систем известна из прототипа (патент G06N 3/08 от 10.01.2014). Остальные блоки, входящие в состав заявленного «Способа поиска и восстановления функциональных зависимостей», относятся к классам устройств, для которых известны правила и методы, с помощью которых они могут быть получены по предъявляемым к ним требованиям Заказчика, а именно:
- сервер очередей (1) может быть реализован по предъявляемым к нему требованиям в соответствии с известными правилами и методами, описанными: Дюбуа, Поль «MySQL, 2-e издание». Издательский дом: «Вильяме», 2004. – с. 697-719;
- блоки генератора (2) и транслятора функций (4) могут быть реализованы по предъявляемым к ним требованиям по известным правилам и методам, описанными: Ахо, Сети Р., Ульман Дж. «Компиляторы: принципы, техника реализации и инструменты». 2-е изд. Издательский дом «Вильяме», 2003. – с. 22-41;
- блок оптимизатора статистических коэффициентов (5) представлен в источнике: Е.В. Алексеева, О.А. Кутненко, А.В. Плясунов «Численные методы оптимизации». Министерство Образования Российской Федерации. Новосибирск, 2008. – с. 4-120;
- объектная машина (6) может быть получена по предъявляемым к ним требованиям по известным правилам и методам, описанными в Ахо, Сети Р., Ульман Дж. «Компиляторы: принципы, техника реализации и инструменты». 2-е изд. Издательский дом «Вильяме», 2003. – с. 22-41.
Список использованных источников
Министерство экономического развития. Приказ от 2016 г. №.423 «Об утверждении методических рекомендаций по разработке, корректировке, мониторингу среднесрочного прогноза социально-экономического развития Российской Федерации и о признании утратившим силу приказа Минэкономразвития России от 30 ноября 2009 г. № 492».
Министерство экономического развития. Приказ от 2 октября 2013 г.№567. «Об утверждении методических рекомендаций по применению методов определения начальной (максимальной) цены контракта, цены контракта, заключаемого с единственным поставщиком (исполнителем)».
