×
27.10.2018
218.016.96fb

Результат интеллектуальной деятельности: СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО

Вид РИД

Изобретение

№ охранного документа
0002670790
Дата охранного документа
25.10.2018
Аннотация: Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получения одного или более опорных параметров кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества. 6 н. и 16 з.п. ф-лы, 10 ил.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

[0002] Настоящее изобретение относится к технологиям аудиокодирования и, в частности, к способу аудиокодирования и соответствующему устройству.

УРОВЕНЬ ТЕХНИКИ

[0003] В существующем алгоритме кодирования аудиосигнала (например, музыки), при одинаковой битовой скорости, некоторые алгоритмы аудиокодирования ограничиваются конкретной полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно узкую полосу, и некоторые алгоритмы аудиокодирования не ограничиваются полосой кодирования и, в основном используются для кодирования кадра аудио, имеющего относительно широкую полосу. Конечно, обе категории алгоритмов аудиокодирования имеют достоинства и недостатки.

[0004] Однако, в уровне техники, в ходе кодирования кадра аудио, фиксированный алгоритм кодирования непосредственно используется для кодирования кадра аудио. Таким образом, используемый алгоритм аудиокодирования вряд ли может гарантировать высокое качество кодирования или высокую эффективность кодирования.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0005] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.

[0006] Первый аспект вариантов осуществления настоящего изобретения предусматривает способ аудиокодирования, включающий в себя:

осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

получение опорного параметра кодирования текущего кадра аудио; и

если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0007] Согласно первому аспекту, в первом возможном варианте реализации первого аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте;

диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц;

диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0008] Согласно первому возможному варианту реализации первого аспекта, во втором возможном варианте реализации первого аспекта,

выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.

[0009] Согласно первому возможному варианту реализации первого аспекта или второму возможному варианту реализации первого аспекта, в третьем возможном варианте реализации первого аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.

[0010] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта или третьему возможному варианту реализации первого аспекта, в четвертом возможном варианте реализации первого аспекта, первое условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.

[0011] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта или четвертому возможному варианту реализации первого аспекта, в пятом возможном варианте реализации первого аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0012] Согласно первому возможному варианту реализации первого аспекта, второму возможному варианту реализации первого аспекта, третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта или пятому возможному варианту реализации первого аспекта, в шестом возможном варианте реализации первого аспекта, второе условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0013] Согласно третьему возможному варианту реализации первого аспекта, четвертому возможному варианту реализации первого аспекта, пятому возможному варианту реализации первого аспекта или шестому возможному варианту реализации первого аспекта, в седьмом возможном варианте реализации первого аспекта,

выполняется, по меньшей мере, одно из следующих условий:

порог T2 больше или равен 2;

порог T4 меньше или равен 1/1,2;

интервал R1 составляет [1/2,25, 2,25];

порог T44 меньше или равен 1/2,56;

порог T45 больше или равен 1,5;

порог T46 больше или равен 1/2,56;

порог T47 меньше или равен 1,5;

порог T68 меньше или равен 1,25; или

порог T69 больше или равен 2.

[0014] Второй аспект вариантов осуществления настоящего изобретения предусматривает аудиокодер, включающий в себя:

блок временно-частотного преобразования, выполненный с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио;

блок получения, выполненный с возможностью получения опорного параметра кодирования текущего кадра аудио; и

блок кодирования, выполненный с возможностью: если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0015] Согласно второму аспекту, в первом возможном варианте реализации второго аспекта, опорный параметр кодирования включает в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, причем

наибольший элемент разрешения по частоте подполосы z больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы w больше, чем критический элемент F1 разрешения по частоте; наибольший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте; и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте; диапазон значений критического элемента F1 разрешения по частоте составляет от 6,4 кГц до 12 кГц; и диапазон значений критического элемента F2 разрешения по частоте составляет от 4,8 кГц до 8 кГц; и

наибольший элемент разрешения по частоте подполосы i меньше, чем наибольший элемент разрешения по частоте подполосы j; наибольший элемент разрешения по частоте подполосы m меньше, чем наибольший элемент разрешения по частоте подполосы n; наибольший элемент разрешения по частоте подполосы x меньше или равен наименьшему элементу разрешения по частоте подполосы y; наибольший элемент разрешения по частоте подполосы p меньше или равен наименьшему элементу разрешения по частоте подполосы q; наибольший элемент разрешения по частоте подполосы r меньше или равен наименьшему элементу разрешения по частоте подполосы s; и наибольший элемент разрешения по частоте подполосы e меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0016] Согласно первому возможному варианту реализации второго аспекта, во втором возможном варианте реализации второго аспекта, выполняется, по меньшей мере, одно из следующих условий: наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше, чем критический элемент F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте.

[0017] Согласно первому возможному варианту реализации второго аспекта или второму возможному варианту реализации второго аспекта, в третьем возможном варианте реализации второго аспекта, первое условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11.

[0018] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта или третьему возможному варианту реализации второго аспекта, в четвертом возможном варианте реализации второго аспекта, первое условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83.

[0019] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта или четвертому возможному варианту реализации второго аспекта, в пятом возможном варианте реализации второго аспекта, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0020] Согласно первому возможному варианту реализации второго аспекта, второму возможному варианту реализации второго аспекта, третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта или пятому возможному варианту реализации второго аспекта, в шестом возможном варианте реализации второго аспекта, второе условие параметра включает в себя одно из следующих условий:

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0021] Согласно третьему возможному варианту реализации второго аспекта, четвертому возможному варианту реализации второго аспекта, пятому возможному варианту реализации второго аспекта или шестому возможному варианту реализации второго аспекта, в седьмом возможном варианте реализации второго аспекта,

выполняется, по меньшей мере, одно из следующих условий:

порог T2 больше или равен 2;

порог T4 меньше или равен 1/1,2;

интервал R1 составляет [1/2,25, 2,25];

порог T44 меньше или равен 1/2,56;

порог T45 больше или равен 1,5;

порог T46 больше или равен 1/2,56;

порог T47 меньше или равен 1,5;

порог T68 меньше или равен 1,25; или

порог T69 больше или равен 2.

[0022] Как можно видеть, в технических решений в некоторых вариантах осуществления настоящего изобретения, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0023] Для более наглядного описания технических решений согласно вариантам осуществления настоящего изобретения, ниже кратко перечислены прилагаемые чертежи, необходимые для описания вариантов осуществления. Очевидно, прилагаемые чертежи в нижеследующем описании демонстрируют лишь некоторые варианты осуществления настоящего изобретения, и специалисты в данной области техники могут вывести другие чертежи из этих прилагаемых чертежей без применения творческих способностей.

[0024] Фиг. 1-8 - блок-схемы операций нескольких способов аудиокодирования согласно вариантам осуществления настоящего изобретения; и

[0025] Фиг. 9 и фиг. 10 - схемы двух типов аудиокодеров согласно вариантам осуществления настоящего изобретения.

ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ

[0026] Варианты осуществления настоящего изобретения предусматривают способ аудиокодирования и соответствующее устройство для повышения качества кодирования или эффективности кодирования при кодировании кадра аудио.

[0027] Чтобы специалисты в данной области техники могли лучше понять технические решения в настоящем изобретении, ниже отчетливо описаны технические решения согласно вариантам осуществления настоящего изобретения со ссылкой на прилагаемые чертежи согласно вариантам осуществления настоящего изобретения. Очевидно, описанные варианты осуществления представляют собой лишь часть, а не все из вариантов осуществления настоящего изобретения. Все остальные варианты осуществления, полученные специалистами в данной области техники на основании вариантов осуществления настоящего изобретения без применения творческих способностей подлежат включению в объем защиты настоящего изобретения.

[0028] Ниже приведено подробное описание.

[0029] В описании изобретения, формуле изобретения и прилагаемых чертежах настоящего изобретения, термины "первый", "второй", "третий", "четвертый" и т.д. предназначены для различения между разными объектами, но не предназначены для описания конкретного порядка. Кроме того, термины "включают в себя" и "имеют" и любая их вариация призваны охватывать неисключающее включение. Например, процесс, способ, система, продукт или устройство, которые включают в себя несколько этапов или блоков, не ограничивается перечисленными этапам или блоками, но, в необязательном порядке, дополнительно включает в себя неперечисленный этап или блок или, в необязательном порядке, дополнительно включает в себя другой внутренний этап или блок процесса, способа, продукта или устройства.

[0030] Рассмотрим способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения. Способ аудиокодирования, предусмотренный согласно вариантам осуществления настоящего изобретения может выполняться аудиокодером. Аудиокодер может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0031] В одном варианте осуществления способа аудиокодирования в настоящем изобретении, способ аудиокодирования включает в себя: осуществление обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получение опорного параметра кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0032] На фиг. 1 показана блок-схема операций способа аудиокодирования согласно варианту осуществления настоящего изобретения. Как показано на фиг. 1, способ аудиокодирования, предусмотренный в этом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0033] 101: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0034] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0035] 102: Получать опорный параметр кодирования текущего кадра аудио.

[0036] 103: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с возбуждением, кодированным преобразованием (по-английски: transform coded excitation, сокращенно TCX).

[0037] 104: Если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества (по-английски: high quality transform coding, сокращенно HQ).

[0038] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0039] В алгоритме TCX, обработка изъятия обычно осуществляется на сигнале временной области текущего кадра аудио. Например, квадратный зеркальный фильтр используется для осуществления обработки изъятия на сигнале временной области текущего кадра аудио. В алгоритме HQ, обработка изъятия не осуществляется на сигнале временной области текущего кадра аудио.

[0040] Согласно требованию сценария применения, опорный параметр кодирования, полученный на этапе 102, текущего кадра аудио может изменяться.

[0041] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0042] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0043] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0044] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0045] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0046] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0047] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0048] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0049] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0050] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0051] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0052] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0053] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0054] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0055] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0056] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0057] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0058] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0059] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0060] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0061] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0062] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0063] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0064] Первое условие параметра может изменяться.

[0065] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио меньше, чем порог T1 (порог T1 может быть, например, больше или равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости);

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T2 (порог T2 может быть, например, больше или равен 1, 2, 3, 5 или другому значению);

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T3 (порог T3 может быть, например, больше или равен 10, 20, 35 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T4 (порог T4 может быть, например, больше или равен 0,5, 1, 2, 3 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, больше или равна порогу T5 (порог T5 может быть, например, больше или равен 10, 20, 51, 100 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T6 (порог T6 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению);

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, больше или равна порогу T7 (порог T7 может быть, например, больше или равен 11, 20, 50, 101 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1 (интервал R1 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше или равно порогу T8 (порог T8 может быть, например, больше или равен 1, 2, 3 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, попадает в интервал R2 (интервал R2 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше или равно порогу T9 (порог T9 может быть, например, больше или равен 10, 20, 35 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3 (интервал R3 может быть равен, например, [0,5, 2], [0,4, 2,5] или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше или равно порогу T10 (порог T10 может быть, например, больше или равен 11, 20, 50, 101 или другому значению); или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, больше или равно порогу T11 (порог T11 может быть равен, например, 0,5, 0,8, 0,9, 1, или другому значению).

[0066] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра, например, может включать в себя одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T12 (порог T12 может быть, например, больше или равен порогу T4, и порог T12 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T13 (порог T13 может быть, например, больше или равен порогу T6, и порог T13 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T14 (порог T14 может быть, например, меньше или равен порогу T2, и порог T14 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4 или другому значению);

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T15 (порог T15 может быть, например, меньше или равен порогу T3, и порог T15 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T16 (порог T16 может быть, например, больше или равен порогу T4, и порог T16 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T17 (порог T17 может быть, например, больше или равен порогу T6, и порог T17 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T18 (порог T18 может быть, например, меньше или равен порогу T2, и порог T18 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T19 (порог T19 может быть, например, меньше или равен порогу T3, и порог T19 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T20 (порог T20 может быть, например, больше или равен порогу T4, и порог T20 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T21 (порог T21 может быть, например, больше или равен порогу T6, и порог T21 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T22 (порог T22 может быть, например, меньше или равен порогу T2, и порог T22 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T23 (порог T23 может быть, например, меньше или равен порогу T3, и порог T23 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T24 (порог T24 может быть, например, больше или равен порогу T4, и порог T24 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T25 (порог T25 может быть, например, больше или равен порогу T6, и порог T25 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T26 (порог T26 может быть, например, меньше или равен порогу T2, и порог T26 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T27 (порог T27 может быть, например, меньше или равен порогу T3, и порог T27 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T28 (порог T28 может быть, например, больше или равен порогу T4, и порог T28 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T29 (порог T29 может быть, например, больше или равен порогу T6, и порог T29 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T30 (порог T30 может быть, например, меньше или равен порогу T2, и порог T30 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T31 (порог T31 может быть, например, меньше или равен порогу T3, и порог T31 может быть, например, меньше или равен 5, 8, 10, 20, или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T32 (порог T32 может быть, например, больше или равен порогу T4, и порог T32 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T33 (порог T33 может быть, например, больше или равен порогу T6, и порог T33 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T34 (порог T34 может быть, например, меньше или равен порогу T2, и порог T34 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T35 (порог T35 может быть, например, меньше или равен порогу T3, и порог T35 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T36 (порог T36 может быть, например, больше или равен порогу T4, и порог T36 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T37 (порог T37 может быть, например, больше или равен порогу T6, и порог T37 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T38 (порог T38 может быть, например, меньше или равен порогу T2, и порог T38 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T39 (порог T39 может быть, например, меньше или равен порогу T3, и порог T39 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, больше или равно порогу T40 (порог T40 может быть, например, больше или равен порогу T4, и порог T40 может быть, например, больше или равен 2, 3, 5, 8 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, больше или равно порогу T41 (порог T41 может быть, например, больше или равен порогу T6, и порог T41 может быть, например, больше или равен 2, 3, 9, 7 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T42 (порог T42 может быть, например, меньше или равен порогу T2, и порог T42 может быть, например, меньше или равен 0,5, 2, 3, 1,5, 4, 5 или другому значению);

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T43 (порог T43 может быть, например, меньше или равен порогу T3, и порог T43 может быть, например, меньше или равен 5, 8, 9,5, 10, 15, 20 или другому значению);

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44 (диапазон значений порога T44 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T45 (диапазон значений порога T45 может составлять, например, от 1 до 3);

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46 (диапазон значений порога T46 может составлять, например, от 1,5 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T47 (диапазон значений порога T47 может составлять, например, от 1 до 3);

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48 (диапазон значений порога T48 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T49 (диапазон значений порога T49 может составлять, например, от 1 до 3);

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50 (диапазон значений порога T50 может составлять, например, от -1 до 3), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T51 (диапазон значений порога T51 может составлять, например, от 1 до 3);

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52 (диапазон значений порога T52 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T53 (порог T53 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54 (диапазон значений порога T54 может составлять, например, от 1 до 3), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T55 (порог T55 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56 (диапазон значений порога T56 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T57 (порог T57 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58 (диапазон значений порога T58 может составлять, например, от -40 до 40), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T59 (порог T59 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60 (диапазон значений порога T60 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T61 (порог T61 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62 (диапазон значений порога T62 может составлять, например, от 1 до 3), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T63 (порог T63 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64 (диапазон значений порога T64 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T65 (порог T65 может быть равен, например, 10, 20, 30 или другому значению);

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66 (диапазон значений порога T66 может составлять, например, от -40 до 40), и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T67 (порог T67 может быть равен, например, 10, 20, 30 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68 (порог T68 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T69 (порог T69 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70 (порог T70 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T71 (порог T71 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72 (порог T72 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T73 (порог T73 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74 (порог T74 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, меньше или равно порогу T75 (порог T75 может быть, например, меньше или равен 1, 2, 3, 5 или другому значению);

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76 (порог T76 может быть, например, меньше или равен 0,5, 1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T77 (порог T77 может быть, например, больше или равен 10, 20, 35 или другому значению);

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78 (порог T78 может быть, например, меньше или равен 10, 20, 51, 100 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T79 (порог T79 может быть, например, больше или равен 10, 20, 35 или другому значению);

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80 (порог T80 может быть, например, больше или равен 0,5, 1,1, 2, 3 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T81 (порог T81 может быть, например, больше или равен 10, 20, 35 или другому значению); или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82 (порог T82 может быть, например, больше или равен 11, 20, 50, 101 или другому значению), и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, меньше или равно порогу T83 (порог T83 может быть, например, больше или равен 10, 20, 35 или другому значению).

[0067] Очевидно, что первое условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.

[0068] Например, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя, по меньшей мере, одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1;

отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T2;

отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T3;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T4;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше, чем порог T5;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T6;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше, чем порог T7;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, не попадает в интервал R3;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10; или

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше, чем порог T11.

[0069] В порядке другого примера, в некоторых возможных вариантах реализации настоящего изобретения, второе условие параметра включает в себя одно из следующих условий:

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T12;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T13;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T14;

скорость кодирования текущего кадра аудио больше или равна порогу T1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T15;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T16;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T17;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T18;

отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, не попадает в интервал R1, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T19;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T20;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T21;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T22;

абсолютное значение разности между отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношением пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T8, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T23;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T24;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T25;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T26;

отношение отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, к отклонению огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, не попадает в интервал R2, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T27;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T28;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T29;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T30;

абсолютное значение разности между отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонением огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T9, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T31;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T32;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T33;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T34;

отношение огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио к огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, попадает в интервал R3, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T35;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T36;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T37;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T38;

абсолютное значение разности между огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T10, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T39;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше, чем порог T40;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше, чем порог T41;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T42;

значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио, меньше или равно порогу T11, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T43;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T44, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T45;

частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T46, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T47;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, меньше, чем порог T48, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше, чем порог T49;

разность, полученная вычитанием отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, из отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, больше, чем порог T50, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, меньше, чем порог T51;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T52, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T53;

частное от деления отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, на отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T54, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T55;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, меньше, чем порог T56, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, больше, чем порог T57;

разность, полученная вычитанием отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, из отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, больше, чем порог T58, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио, меньше, чем порог T59;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T60, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T61;

частное от деления огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, на огибающую спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T62, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T63;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, меньше, чем порог T64, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, больше, чем порог T65;

разность, полученная вычитанием огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, из огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, больше, чем порог T66, и огибающая спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио, меньше, чем порог T67;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T68, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T70, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T71;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T72, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T73;

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T74, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T75;

частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, меньше или равно порогу T76, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T77;

разность, полученная вычитанием среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, из среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, меньше или равна порогу T78, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T79;

частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, меньше или равно порогу T80, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T81; или

разность, полученная вычитанием среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, из среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, меньше или равна порогу T82, и отклонение огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио, больше, чем порог T83.

[0070] Очевидно, что второе условие параметра не ограничивается вышеприведенными примерами, и некоторые другие возможные варианты реализации можно расширять на основании вышеприведенных примеров.

[0071] Очевидно, что примеры первого условия параметра и второго условия параметра являются не всеми возможными вариантами реализации. В фактическом применении, вышеприведенные примеры можно расширять, для обогащения возможных вариантов реализации первого условия параметра и второго условия параметра.

[0072] Для лучшего понимания вариантов осуществления настоящего изобретения, ниже приведено иллюстративное описание согласно некоторым конкретным сценариям применения.

[0073] На фиг. 2 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 2, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0074] Как показано на фиг. 2, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0075] 201: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0076] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0077] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0078] Обработка временно-частотного преобразования осуществляется на сигнале временной области текущего кадра аудио с использованием алгоритма быстрого преобразования Фурье (по-английски: fast fourier transform, сокращенно FFT), алгоритма модифицированного дискретного косинусного преобразования (по-английски: modified discrete cosine transform, сокращенно MDCT), или другого алгоритма временно-частотного преобразования, для получения спектральных коэффициентов текущего кадра аудио.

[0079] 202: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0080] 203: Определять, больше или равно ли порогу T4 частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0081] Если да, осуществляется этап 204; если нет, осуществляется этап 205.

[0082] Порог T4 может быть больше или равен 0,5, и порог T4, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.

[0083] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0084] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0085] 204: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0086] 205: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0087] Как можно видеть, в решениях этого варианта осуществления, после получения среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, алгоритм TCX или алгоритм HQ выбирается на основании полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и полученного среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связано с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0088] На фиг. 3 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 3, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.

[0089] Как показано на фиг. 3, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0090] 301: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0091] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0092] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0093] 302: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0094] 303: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T68.

[0095] Если нет, осуществляется этап 304; если да, осуществляется этап 306.

[0096] Порог T68 больше или равен порогу T4. Например, порог T68 может быть больше или равен 0,6, и порог T68, например, равен 0,8, 0,6, 1, 1,5, 2, 3, 5 или другому значению.

[0097] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0098] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0099] 304: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио.

[00100] 305: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, больше, чем порог T69.

[0100] Если да, осуществляется этап 307; если нет, осуществляется этап 306.

[0101] Порог T69 может быть больше или равен 1, и порог T69, например, равен 1, 1,1, 1,5, 2, 3,5, 6, 4,6 или другому значению.

[0102] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц или от 8 кГц до 9,6 кГц.

[0103] 306: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0104] 307: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0105] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио и средним по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0106] На фиг. 4 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 4, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0107] Как показано на фиг. 4, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0108] 401: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0109] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0110] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0111] 402: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0112] 403: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.

[0113] Если да, осуществляется этап 404; если нет, осуществляется этап 405.

[0114] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.

[0115] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0116] 404: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0117] 405: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0118] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0119] На фиг. 5 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 5, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0120] Как показано на фиг. 5, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0121] 501: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0122] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0123] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0124] 502: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0125] 503: Определять, больше или равно ли частное от деления отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, на отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, порогу T46.

[0126] Если да, осуществляется этап 504; если нет, осуществляется этап 505.

[0127] порог T46 может быть больше или равен 0,5, и порог T46, например, равен 0,5, 1, 1,5, 2, 3 или другому значению.

[0128] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0129] 504: Определять, ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, больше или равно порогу T47.

[0130] Если да, осуществляется этап 506; если нет, осуществляется этап 507.

[0131] 505: Определять, меньше ли отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, чем порог T47.

[0132] Если да, осуществляется этап 506; если нет, осуществляется этап 507.

[0133] 506: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0134] 507: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0135] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0136] На фиг. 6 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 6, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0137] Как показано на фиг. 6, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0138] 601: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0139] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0140] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0141] 602: Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио.

[0142] 603: Определять, ли отношение отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, к отношению пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, попадает в интервал R1.

[0143] Если нет, осуществляется этап 604; если да, осуществляется этап 606.

[0144] Интервал R1 может представлять собой, например, [0,5, 2], [0,8, 1,25], [0,4, 2,5] или другой диапазон.

[0145] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц или от 1,6 кГц до 3,2 кГц, и диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц или от 4,8 кГц до 6,4 кГц.

[0146] 604: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0147] 605: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T16.

[0148] Если да, осуществляется этап 606; если нет, осуществляется этап 607.

[0149] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.

[0150] Порог T16 больше, чем порог T4. Например, порог T16 может быть больше или равен 2, и порог T16, например, равен 2, 2,5, 3, 3,5, 5, 5, 1, или другому значению.

[0151] 606: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0152] 607: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0153] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0154] На фиг. 7 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 7, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, с использованием скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0155] Как показано на фиг. 7, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0156] 701: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0157] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0158] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0159] 702: Определять, больше или равна ли скорость кодирования текущего кадра аудио порогу T1.

[0160] Если да, осуществляется этап 703; если нет, осуществляется этап 705.

[0161] Порог T1, например, больше или равен 24,4 кбит/с. Например, порог T1 равен 24,4 кбит/с, 32 кбит/с, 64 кбит/с или другой скорости.

[0162] 703: Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио.

[0163] 704: Определять, больше или равно ли частное от деления среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, на среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, порогу T12.

[0164] Если да, осуществляется этап 705; если нет, осуществляется этап 706.

[0165] Диапазон элемента разрешения по частоте подполосы i может составлять, например, от 0 кГц до 1,6 кГц или от 1 кГц до 2,6 кГц, и диапазон элемента разрешения по частоте подполосы j может составлять, например, от 6,4 кГц до 8 кГц, от 4,8 кГц до 6,4 кГц или от 7,4 кГц до 9 кГц.

[0166] Порог T12 может быть больше порога T4. Например, порог T12 может быть больше или равен 2, и порог T12, например, равен 2, 2,5, 3, 3,5, 5, 5,2 или другому значению.

[0167] 705: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0168] 706: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0169] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании скорости кодирования текущего кадра аудио, среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Скорость кодирования текущего кадра аудио, среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0170] На фиг. 8 показана блок-схема операций другого способа аудиокодирования согласно другому варианту осуществления настоящего изобретения. В примере, показанном на фиг. 8, алгоритм кодирования, используемый для кодирования спектральных коэффициентов текущего кадра аудио, определяется, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0171] Как показано на фиг. 8, другой способ аудиокодирования, предусмотренный в другом варианте осуществления настоящего изобретения, может включать в себя следующее содержание:

[0172] 801: Осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0173] Кадр аудио, упомянутый согласно вариантам осуществления настоящего изобретения, может быть кадром речи или кадром музыки.

[0174] Предполагается, что полоса сигнала временной области текущего кадра аудио равна 16 кГц.

[0175] 802: Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0176] 803: Определять, больше или равно ли порогу T6 частное от деления среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, на среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио.

[0177] Если да, осуществляется этап 804; если нет, осуществляется этап 805.

[0178] Порог T6 может быть больше или равен 0,3, и порог T6, например, равен 0,5, 1, 1,5, 2, 3,2, или другому значению.

[0179] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц или от 0,4 кГц до 6,4 кГц.

[0180] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц или от 4,8 кГц до 9,6 кГц.

[0181] 804: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма TCX.

[0182] 805: Кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма HQ.

[0183] Как можно видеть, в решениях этого варианта осуществления, алгоритм TCX или алгоритм HQ выбирается, в основном, на основании среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Соотношение между средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и средним по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио, связаны с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0184] Очевидно, что иллюстративные варианты реализации, представленные на фиг. 2-8, являются лишь некоторыми вариантами реализации настоящего изобретения. В фактическом применении, многие другие возможные варианты реализации могут расширяться на основании соответствующих иллюстративных описаний согласно варианту осуществления, соответствующему фиг. 1.

[0185] В некоторых сценариях, в ходе выбора подполосы можно рассматривать следующее.

[0186] При вычислении сходства между параметрами свойства спектральных коэффициентов, расположенных в двух подполосах, можно выбирать две согласованные подполосы, например, две подполосы составляют от 0 кГц до 1,6 кГц и от 6,4 кГц до 8 кГц. В некоторых сценариях, поскольку свойство спектральных коэффициентов в пределах от 0 до 1 кГц значительно отличается от свойства спектральных коэффициентов в пределах от 1 до 1,6 кГц, спектр от 0 кГц до 1,6 кГц может не выбираться при вычислении сходства между параметрами свойства спектральных коэффициентов. Например, спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц можно выбирать для замены спектральных коэффициентов в пределах от 0 до 1,6 кГц, для вычисления параметра свойства низкочастотных спектральных коэффициентов. В этом случае, если низкочастотные спектральные коэффициенты в пределах от 1 кГц до 2,6 кГц копируются в высокую частоту, соответствующие спектральные коэффициенты являются высокочастотными спектральными коэффициентами в пределах от 7,4 кГц до 9 кГц. При вычислении параметра свойства высокочастотных спектральных коэффициентов, спектральные коэффициенты в пределах от 7,4 кГц до 9 кГц более пригодны для вычисления спектрального свойства. Однако, в некоторых сценариях, разрешение спектральных коэффициентов в пределах от 0 кГц до 6,4 кГц может быть очень высоким, и спектральные коэффициенты в пределах от 0 кГц до 6,4 кГц пригодны для вычисления параметра свойства. Если разрешение спектральных коэффициентов в пределах от 6,4 кГц до 16 кГц относительно низко, спектральные коэффициенты в пределах от 6,4 кГц до 16 кГц могут быть не пригодны для вычисления параметра свойства спектральных коэффициентов. Поэтому, при вычислении параметра свойства высокочастотных спектральных коэффициентов, для вычисления параметра свойства можно выбирать спектральные коэффициенты в пределах от 4,8 кГц до 6,4 кГц, и параметр свойства используется в качестве высокочастотного параметра свойства.

[0187] Кодирование спектральных коэффициентов текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием может, в частности, включать в себя: деление спектральных коэффициентов на N подполос; вычисление и квантование огибающей каждой подполосы; осуществление выделение битов для каждой подполосы согласно квантованному значению огибающей и количеству доступных битов; квантование спектральные коэффициенты каждой подполосы согласно количеству битов, выделенных подполосе; и запись квантованных спектральных коэффициентов и значение индекса спектральной огибающей в битовый поток.

[0188] Ниже дополнительно представлено соответствующее устройство, выполненное с возможностью реализации вышеприведенного решения.

[0189] Согласно фиг. 9, вариант осуществления настоящего изобретения дополнительно предусматривает аудиокодер 900. Аудиокодер 900 может включать в себя блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.

[0190] Блок 910 временно-частотного преобразования выполнен с возможностью осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио.

[0191] Блок 920 получения выполнен с возможностью получения опорного параметра кодирования текущего кадра аудио.

[0192] Блок 930 кодирования выполнен с возможностью: если опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если опорный параметр кодирования, полученный блоком получения и относящийся к текущему кадру аудио, удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0193] Согласно требованию сценария применения, опорный параметр кодирования, полученный блоком 920 получения и относящийся к текущему кадру аудио, может изменяться.

[0194] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0195] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0196] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0197] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0198] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0199] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0200] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0201] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий: наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0202] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0203] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0204] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0205] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0206] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0207] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0208] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0209] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0210] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0211] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0212] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0213] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0214] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0215] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0216] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0217] Первое условие параметра и второе условие параметра может изменяться.

[0218] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.

[0219] Очевидно, что функции каждого функционального модуля аудиокодера 900 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.

[0220] Аудиокодер 900 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0221] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 900 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0222] На фиг. 10 показана структурная блок-схема аудиокодера 1000 согласно другому варианту осуществления настоящего изобретения.

[0223] Аудиокодер 1000 может включать в себя, по меньшей мере, один процессор 1001, память 1005 и, по меньшей мере, одну шину 1002 связи. Шина 1002 связи выполнена с возможностью реализации соединения и связи между компонентами.

[0224] В необязательном порядке, аудиокодер 1000 может дополнительно включать в себя, по меньшей мере, один сетевой интерфейс 1004, пользовательский интерфейс 1003 и пр. В необязательном порядке, пользовательский интерфейс 1003 включает в себя дисплей (например, сенсорный экран, жидкокристаллический дисплей, устройство формирования голографического (по-английски: Holographic) изображения или проектор (по-английски: Projector)), указательное устройство (например, мышь, шаровой манипулятор (по-английски: trackball), сенсорную панель или сенсорный экран), камеру и/или считывающее устройство.

[0225] Память 1005 может включать в себя постоянную память и оперативную память и обеспечивать инструкцию и данные для процессора 1001. Часть памяти 1005 может дополнительно включать в себя энергонезависимую оперативную память.

[0226] В некоторых вариантах реализации, в памяти 1005 хранятся следующие элементы, исполнимые модули или структуры данных, или их подмножество, или их расширяющее множество: блок 910 временно-частотного преобразования, блок 920 получения и блок 930 кодирования.

[0227] В этом варианте осуществления настоящего изобретения, процессор 1001 выполняет код или инструкцию в памяти 1005, чтобы: осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получать опорный параметр кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием, или если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества.

[0228] Согласно требованию сценария применения, опорный параметр кодирования, полученный процессором 1001 и относящийся к текущему кадру аудио, может изменяться.

[0229] Например, опорный параметр кодирования может включать в себя, по меньшей мере, один из следующих параметров: скорости кодирования текущего кадра аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе w и относятся к текущему кадру аудио; среднего по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднего по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио; среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио, и среднего по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио; отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношения пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио; отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе r и относятся к текущему кадру аудио, и отклонения огибающей спектральных коэффициентов, которые располагаются в подполосе s и относятся к текущему кадру аудио; огибающей спектральных коэффициентов, которые располагаются в подполосе e и относятся к текущему кадру аудио, и огибающей спектральных коэффициентов, которые располагаются в подполосе f и относятся к текущему кадру аудио; или значения параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио.

[0230] Большее значение параметра спектральной корреляции между спектральными коэффициентами, которые располагаются в подполосе p и относятся к текущему кадру аудио, и спектральными коэффициентами, которые располагаются в подполосе q и относятся к текущему кадру аудио указывает более сильную спектральную корреляцию между спектральными коэффициентами, расположенными в подполосе p, и спектральными коэффициентами, расположенными в подполосе q. Значение параметра спектральной корреляции может быть, например, значением параметра нормализованной кросс-корреляции.

[0231] Диапазоны элемента разрешения по частоте подполос могут определяться согласно фактическим потребностям.

[0232] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы z может быть больше критического элемента F1 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы w может быть больше критического элемента F1 разрешения по частоте. Диапазон значений критического элемента F1 разрешения по частоте может составлять, например, от 6,4 кГц до 12 кГц. Например, значение критического элемента F1 разрешения по частоте может быть равно 6,4 кГц, 8 кГц, 9 кГц, 10 кГц или 12 кГц. Конечно, критический элемент F1 разрешения по частоте может иметь другое значение.

[0233] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы j может быть больше критического элемента F2 разрешения по частоте, и наибольший элемент разрешения по частоте подполосы n больше, чем критический элемент F2 разрешения по частоте. Например, диапазон значений критического элемента F2 разрешения по частоте может составлять от 4,8 кГц до 8 кГц. В частности, например, значение критического элемента F2 разрешения по частоте может быть равно 6,4 кГц, 4,8 кГц, 6 кГц, 8 кГц, 5 кГц или 7 кГц. Конечно, критический элемент F2 разрешения по частоте может иметь другое значение.

[0234] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы i может быть меньше наибольшего элемента разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m может быть меньше наибольшего элемента разрешения по частоте подполосы n, наибольший элемент разрешения по частоте подполосы x может быть меньше или равен наименьшему элементу разрешения по частоте подполосы y, наибольший элемент разрешения по частоте подполосы p может быть меньше или равен наименьшему элементу разрешения по частоте подполосы q, наибольший элемент разрешения по частоте подполосы r может быть меньше или равен наименьшему элементу разрешения по частоте подполосы s, и наибольший элемент разрешения по частоте подполосы e может быть меньше или равен наименьшему элементу разрешения по частоте подполосы f.

[0235] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наименьший элемент разрешения по частоте подполосы w больше или равен критическому элементу F1 разрешения по частоте, наименьший элемент разрешения по частоте подполосы z больше или равен критическому элементу F1 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен наименьшему элементу разрешения по частоте подполосы j, наибольший элемент разрешения по частоте подполосы m меньше или равен наименьшему элементу разрешения по частоте подполосы n, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы i меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы m меньше или равен критическому элементу F2 разрешения по частоте, наименьший элемент разрешения по частоте подполосы j больше или равен критическому элементу F2 разрешения по частоте, или наименьший элемент разрешения по частоте подполосы n больше или равен критическому элементу F2 разрешения по частоте.

[0236] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, может выполняться, по меньшей мере, одно из следующих условий:

наибольший элемент разрешения по частоте подполосы e меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы x меньше или равен критическому элементу F2 разрешения по частоте, наибольший элемент разрешения по частоте подполосы p меньше или равен критическому элементу F2 разрешения по частоте, или наибольший элемент разрешения по частоте подполосы r меньше или равен критическому элементу F2 разрешения по частоте.

[0237] В необязательном порядке, в некоторых возможных вариантах реализации настоящего изобретения, наибольший элемент разрешения по частоте подполосы f может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы f может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы q может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы q может быть больше или равен критическому элементу F2 разрешения по частоте. Наибольший элемент разрешения по частоте подполосы s может быть меньше или равен критическому элементу F2 разрешения по частоте, и, конечно, наименьший элемент разрешения по частоте подполосы s может быть больше или равен критическому элементу F2 разрешения по частоте.

[0238] Например, диапазон значений наибольшего элемента разрешения по частоте подполосы z может составлять от 12 кГц до 16 кГц. Диапазон значений наименьшего элемента разрешения по частоте подполосы z может составлять от 8 кГц до 14 кГц. Диапазон значений полосы подполосы z может составлять от 1,6 кГц до 8 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы z может составлять от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц или от 12 кГц до 14 кГц. Конечно, диапазон элемента разрешения по частоте подполосы z не ограничивается вышеприведенными примерами.

[0239] Например, диапазон элемента разрешения по частоте подполосы w может определяться согласно фактическим потребностям. Например, диапазон значений наибольшего элемента разрешения по частоте подполосы w может составлять от 12 кГц до 16 кГц, и диапазон значений наименьшего элемента разрешения по частоте подполосы w может составлять от 8 кГц до 14 кГц. В частности, например, диапазон элемента разрешения по частоте подполосы w составляет от 8 кГц до 12 кГц, от 9 кГц до 11 кГц, от 8 кГц до 9,6 кГц, от 12 кГц до 14 кГц или от 12,2 кГц до 14,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы w не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы w может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы z.

[0240] Например, диапазон элемента разрешения по частоте подполосы i может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы i не ограничивается вышеприведенными примерами.

[0241] Например, диапазон элемента разрешения по частоте подполосы j может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы j не ограничивается вышеприведенными примерами.

[0242] Например, диапазон элемента разрешения по частоте подполосы m может составлять от 3,2 кГц до 6,4 кГц, от 3,2 кГц до 4,8 кГц, от 4,8 кГц до 6,4 кГц, от 0,4 кГц до 6,4 кГц или от 0,4 кГц до 3,6 кГц. Конечно, диапазон элемента разрешения по частоте подполосы m не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы m может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы i.

[0243] Например, диапазон элемента разрешения по частоте подполосы n может составлять от 6,4 кГц до 9,6 кГц, от 6,4 кГц до 8 кГц, от 8 кГц до 9,6 кГц, от 4,8 кГц до 9,6 кГц или от 4,8 кГц до 8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы n не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы n может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы j.

[0244] Например, диапазон элемента разрешения по частоте подполосы x может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2 кГц до 3,2 кГц или от 2,5 кГц до 3,4 кГц. Конечно, диапазон элемента разрешения по частоте подполосы x не ограничивается вышеприведенными примерами.

[0245] Например, диапазон элемента разрешения по частоте подполосы y может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,4 кГц до 6,4 кГц или от 4,5 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы y не ограничивается вышеприведенными примерами.

[0246] Например, диапазон элемента разрешения по частоте подполосы p может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,1 кГц до 3,2 кГц или от 2,5 кГц до 3,5 кГц. Конечно, диапазон элемента разрешения по частоте подполосы p не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы p может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0247] Например, диапазон элемента разрешения по частоте подполосы q может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 4,2 кГц до 6,4 кГц или от 4,7 кГц до 6,2 кГц. Конечно, диапазон элемента разрешения по частоте подполосы q не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы q может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0248] Например, диапазон элемента разрешения по частоте подполосы r может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 2,05 кГц до 3,27 кГц или от 2,59 кГц до 3,51 кГц. Конечно, диапазон элемента разрешения по частоте подполосы r не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы r может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0249] Например, диапазон элемента разрешения по частоте подполосы s может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,4 кГц до 7,1 кГц или от 4,55 кГц до 6,29 кГц. Конечно, диапазон элемента разрешения по частоте подполосы s не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы s может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0250] Например, диапазон элемента разрешения по частоте подполосы e может составлять от 0 кГц до 1,6 кГц, от 1 кГц до 2,6 кГц, от 1,6 кГц до 3,2 кГц, от 0,8 кГц до 3 кГц или от 1,9 кГц до 3,8 кГц. Конечно, диапазон элемента разрешения по частоте подполосы e не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы e может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы x.

[0251] Например, диапазон элемента разрешения по частоте подполосы f может составлять от 6,4 кГц до 8 кГц, от 7,4 кГц до 9 кГц, от 4,8 кГц до 6,4 кГц, от 5,3 кГц до 7,15 кГц или от 4,58 кГц до 6,52 кГц. Конечно, диапазон элемента разрешения по частоте подполосы f не ограничивается вышеприведенными примерами. В некоторых возможных вариантах реализации, диапазон элемента разрешения по частоте подполосы f может быть идентичен или аналогичен диапазону элемента разрешения по частоте подполосы y.

[0252] Первое условие параметра и второе условие параметра может изменяться.

[0253] Например, в некоторых возможных вариантах реализации настоящего изобретения, первое условие параметра в этом варианте осуществления может быть, например, первым условием параметра согласно варианту осуществления способа, и второе условие параметра в этом варианте осуществления может быть, например, вторым условием параметра согласно варианту осуществления способа. За соответствующими описаниями, обратимся к записям согласно варианту осуществления способа.

[0254] Очевидно, что функции каждого функционального модуля аудиокодера 1000 в этом варианте осуществления, в частности, могут быть реализованы согласно способам вышеприведенных вариантов осуществления способа. За конкретным процессом реализации, обратимся к соответствующему описанию вышеприведенных вариантов осуществления способа, и детали здесь не описаны.

[0255] Аудиокодер 1000 может представлять собой любое устройство, которое необходимо для сбора, сохранения или передачи аудиосигнала, например, мобильный телефон, планшетный компьютер, персональный компьютер или компьютер-ноутбук.

[0256] Как можно видеть, в решениях этого варианта осуществления, после получения опорного параметра кодирования текущего кадра аудио, аудиокодер 1000 выбирает алгоритм TCX или алгоритм HQ на основании полученного опорного параметра кодирования текущего кадра аудио, для кодирования спектральных коэффициентов текущего кадра аудио. Опорный параметр кодирования текущего кадра аудио связан с алгоритмом кодирования, используемым для кодирования спектральных коэффициентов текущего кадра аудио, что позволяет повысить адаптивность и согласуемость между алгоритмом кодирования и опорным параметром кодирования текущего кадра аудио, и дополнительно позволяет повысить качество кодирования или эффективность кодирования текущего кадра аудио.

[0257] Дополнительно, используется несколько необязательных опорных параметров кодирования, что позволяет удовлетворять требованиям выбора алгоритма в нескольких сценариях.

[0258] Вариант осуществления настоящего изобретения дополнительно предусматривает компьютерный носитель данных, причем на компьютерном носителе данных может храниться программа, и когда программа выполняется, осуществляются некоторые или все этапы способа аудиокодирования, записанные согласно варианту осуществления способа.

[0259] Следует отметить, что, для краткого описания, вышеприведенные варианты осуществления способа представлены в виде нескольких действий. Однако специалистам в данной области техники очевидно, что настоящее изобретение не ограничивается описанным порядком действий, поскольку, согласно настоящему изобретению, некоторые этапы могут осуществляться в других порядках или одновременно. Специалисту в данной области техники также очевидно, что все варианты осуществления, описанные в этом описании изобретения принадлежат иллюстративным вариантам осуществления, и предусмотренные действия и модули не обязательно требуются согласно настоящему изобретению.

[0260] Согласно вышеприведенным вариантам осуществления, описание каждого варианта осуществления сосредоточены на соответствующих аспектах. За частью, которая не описана подробно согласно варианту осуществления, можно обратиться к соответствующим описаниям в других вариантах осуществления.

[0261] В некоторых вариантах осуществления, представленных в настоящей заявке, следует понимать, что раскрытое устройство можно реализовать иначе. Например, описанный вариант осуществления устройства является лишь иллюстративным. Например, разделение на блоки является лишь разделение на логические функции, и в фактической реализации может существовать другое разделение. Например, несколько блоков или компонентов может быть объединено или интегрировано в другую систему, или некоторые признаки можно игнорировать или не осуществлять. Кроме того, отображаемые или рассматриваемые взаимные соединения или прямые соединения или коммуникационные соединения можно реализовать через некоторые интерфейсы. Непрямые соединения или коммуникационные соединения между устройствами иди блоками могут быть реализованы электрическими, механическими или другими средствами.

[0262] Блоки, описанные как отдельные части могут быть или не быть физически отдельными, и части, отображаемые как блоки, могут быть или не быть физическими блоками, могут располагаться в одном положении, или могут распределяться по множеству сетевых блоков. Некоторые или все из блоков могут выбираться согласно фактическим потребностям для решения задач вариантов осуществления.

[0263] Кроме того, функциональные блоки согласно вариантам осуществления настоящего изобретения могут интегрироваться в один блок обработки, или каждый из блоков может существовать физически отдельно, или два или более блоков интегрированы в один блок. Объединенный блок можно реализовать в форме оборудования или можно реализовать в форме программного функционального блока.

[0264] Когда объединенный блок реализован в форме программного функционального блока и продается или используется как независимый продукт, объединенный блок может храниться на компьютерно-считываемом носителе данных. На основании такого понимания, технические решения настоящего изобретения, по существу, или часть, вносящая вклад в уровень техники, или все или часть технических решений можно реализовать в форме программного продукта. Программный продукт хранится на носителе данных и включает в себя несколько инструкций для предписания компьютерному устройству (которым может быть персональный компьютер, сервер или сетевое устройство) для осуществления всех или некоторых из этапов способов, описанных согласно вариантам осуществления настоящего изобретения. Вышеупомянутый носитель данных включает в себя: любой носитель, где может храниться программный код, например, флэш-носитель с интерфейсом USB, сменный жесткий диск, постоянную память (ROM, Read-Only Memory), оперативную память (RAM, Random Access Memory), магнитный диск или оптический диск.

[0265] Вышеприведенные варианты осуществления предназначены лишь для описания технических решений настоящего изобретения, но не для ограничения настоящего изобретения. Хотя настоящее изобретение подробно описано согласно вышеприведенным вариантам осуществления, специалисты в данной области техники должны понимать, что они могут вносить изменения в технические решения, описанные согласно вышеприведенным вариантам осуществления или делать эквивалентные замены в некоторых их технических особенностях, не выходя за рамки объема технических решений вариантов осуществления настоящего изобретения.

ПЕРЕВОД ЧЕРТЕЖЕЙ

фиг. 1

101. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

102. получать опорный параметр кодирования текущего кадра аудио

103. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет первому условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

104. если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет второму условию параметра, кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 2

201. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

202. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

203. Больше или равно ли частное средних по энергии порогу T4

204. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

205. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 3

301. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

302. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

303. определять, больше или равно ли частное средних по энергии порогу T68

304. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе z и относятся к текущему кадру аудио

305. больше ли отношение пикового значения к среднему, чем порог T69

306. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

307. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 4

401. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

402. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

403. попадает ли отношение между отношениями пикового значения к среднему в интервал R1

404. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

405. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 5

501. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

502. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

503. больше или равно ли частное отношений пикового значения к среднему порогу T46

504. больше или равно ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, порогу T47

505. меньше ли отношение пикового значения к среднему спектральных коэффициентов, расположенных в подполосе y, чем порог T47

506. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

507. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 6

601. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

602. Получать отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе x и относятся к текущему кадру аудио, и отношение пикового значения к среднему спектральных коэффициентов, которые располагаются в подполосе y и относятся к текущему кадру аудио

603. попадает ли отношение отношений пикового значения к среднему в интервал R1

604. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

605. больше или равно ли частное средних по энергии порогу T16

606. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

607. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 7

701. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

702. больше или равна ли скорость кодирования текущего кадра аудио порогу T1

703. Получать среднее по энергии спектральных коэффициентов, которые располагаются в подполосе i и относятся к текущему кадру аудио, и среднее по энергии спектральных коэффициентов, которые располагаются в подполосе j и относятся к текущему кадру аудио

704. больше или равно ли частное средних по энергии порогу T12

705. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

706. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 8

801. осуществлять обработку временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио

802. Получать среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе m и относятся к текущему кадру аудио и среднее по амплитуде спектральных коэффициентов, которые располагаются в подполосе n и относятся к текущему кадру аудио

803. больше или равно ли частное средних по амплитуде порогу T6

804. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного преобразованием

805. кодировать спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества

фиг. 9

900. Аудиокодер

910. блок временно-частотного преобразования

920. Блок получения

930. Блок кодирования

фиг. 10

1000. Аудиокодер

1001. Процессор

1003. Пользовательский интерфейс

1004. Сетевой интерфейс

1005. Память


СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
СПОСОБ АУДИОКОДИРОВАНИЯ И СООТВЕТСТВУЮЩЕЕ УСТРОЙСТВО
Источник поступления информации: Роспатент

Показаны записи 11-20 из 704.
27.04.2013
№216.012.3c1a

Система и способ для sr-vcc экстренных сеансов ims

Изобретение относится к области связи в сетях передачи данных. Технический результат заключается в обеспечении непрерывности экстренных сеансов для мобильности между 4G-системами и 2G/3G-системами. Предлагаемая группа изобретений обеспечивает непрерывность экстренных сеансов IMS, установленных...
Тип: Изобретение
Номер охранного документа: 0002480947
Дата охранного документа: 27.04.2013
27.05.2013
№216.012.456f

Способ, устройство и система для идентификации сервиса

Настоящая группа изобретений относится к области технологий связи. Технический результат заключается в обеспечении отказоустойчивой работы шлюза протокола беспроводных приложений и увеличении вероятности правильной идентификации типа сервиса. Для этого предложен способ идентификации сервиса,...
Тип: Изобретение
Номер охранного документа: 0002483352
Дата охранного документа: 27.05.2013
27.05.2013
№216.012.4575

Способ и система начисления платы за услугу, сервер доступа к сети и устройство анализа информации протокола

Изобретение относится к технологиям предоставления услуг передачи данных в мобильных сетях. Технический результат заключается в повышении точности начисления платы за услугу передачи данных и упрощении осуществления начисления платы за счет устранения необходимости ввода дополнительных настроек...
Тип: Изобретение
Номер охранного документа: 0002483358
Дата охранного документа: 27.05.2013
27.05.2013
№216.012.45db

Способ, устройство и система для временной синхронизации xdsl

Изобретение относится к технике связи и может быть использовано для временной синхронизации цифровой абонентской линии. Технический результат - повышение точности временной синхронизации. Способ временной синхронизации цифровой абонентской линии (DSL) заключается в передаче посредством первого...
Тип: Изобретение
Номер охранного документа: 0002483460
Дата охранного документа: 27.05.2013
27.05.2013
№216.012.45ec

Способ и устройство для передачи мультикадра нисходящей линии связи

Изобретение относится к мобильной связи. Предоставлены способ и устройство для передачи мультикадра нисходящей линии связи. Этот способ включает в себя этапы, на которых: устанавливают позиции кадров Медленного Совмещенного Канала Управления (SACCH) и кадров Канала Трафика (ТСН) множества...
Тип: Изобретение
Номер охранного документа: 0002483477
Дата охранного документа: 27.05.2013
27.05.2013
№216.012.45ee

Способ и устройство для передачи данных

Изобретение относится к технологии связи и, в частности, к способу и устройству для передачи данных и предназначено для передачи служебных и управляющих данных, когда базовая станция поддерживает множество технологий радиодоступа. Изобретение раскрывает, в частности, способ передачи данных,...
Тип: Изобретение
Номер охранного документа: 0002483479
Дата охранного документа: 27.05.2013
20.06.2013
№216.012.4e87

Способ, устройство и система для многоантенной передачи

Изобретение относится к системе беспроводной связи, использующей технологию с множеством входов и множеством выходов (MIMO) и предназначено для реализации формирования диаграммы направленности на множестве всенаправленных антенн для создания лучей в различных пространственных направлениях....
Тип: Изобретение
Номер охранного документа: 0002485685
Дата охранного документа: 20.06.2013
20.06.2013
№216.012.4e89

Способ и устройство для осуществления отображения и обратного отображения клиентского сигнала

Изобретение относится к области технологии связи, в частности технологии оптической транспортировки сообщений, и предназначено для упрощения процесса отображения клиентского сигнала при удовлетворении требования многоскоростных служб. Изобретение раскрывает способ и устройство для отображения и...
Тип: Изобретение
Номер охранного документа: 0002485687
Дата охранного документа: 20.06.2013
27.06.2013
№216.012.5219

Способ кодирования сигнала и способ декодирования сигнала

Изобретение относится к способу, устройству и системе для кодирования и декодирования сигналов. Способ кодирования включает в себя этапы, на которых: преобразуют сигнал первой области в сигнал второй области; выполняют обработку Линейного Предсказания (Linear Predictive, LP) и обработку...
Тип: Изобретение
Номер охранного документа: 0002486610
Дата охранного документа: 27.06.2013
27.06.2013
№216.012.5279

Способ и устройство для определения мощности передачи

Изобретение относится к технологиям связи. В настоящем изобретении описываются способ и устройство для определения мощности передачи. Способ для определения мощности передачи включает в себя то, что: коэффициент усиления выделенного физического канала передачи данных усовершенствованного...
Тип: Изобретение
Номер охранного документа: 0002486706
Дата охранного документа: 27.06.2013
Показаны записи 11-18 из 18.
04.04.2018
№218.016.2fb7

Способ и устройство декодирования битового потока речи/аудио

Изобретение относится к технологиям декодирования аудио и предназначено для декодирования битового потока речи/аудио сигнала. Технический результат - повышение качества выходного речевого/аудио сигнала. Данный способ декодирования битового потока речи/аудио включает извлечение параметра...
Тип: Изобретение
Номер охранного документа: 0002644512
Дата охранного документа: 12.02.2018
10.05.2018
№218.016.486c

Способ обработки речевого/звукового сигнала и устройство

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей. Данный способ включает в себя этапы, на которых: принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой...
Тип: Изобретение
Номер охранного документа: 0002651184
Дата охранного документа: 18.04.2018
09.06.2018
№218.016.5ea0

Способ и устройство обработки сигналов

Изобретение относится к средствам для обработки сигналов. Технический результат заключается в повышении эффективности кодирования и декодирования сигналов. Выбирают M низкочастотных поддиапазонов из N поддиапазонов. N поддиапазонов получаются путем деления спектральных коэффициентов текущего...
Тип: Изобретение
Номер охранного документа: 0002656812
Дата охранного документа: 06.06.2018
11.09.2018
№218.016.85ef

Способ и устройство для обработки потери кадра

Изобретение относится к средствам для обработки потери кадра. Технический результат заключается в повышении качества восстановленного после потери кадра аудиосигнала. Определяют начальный высокочастотный сигнал текущего потерянного кадра. Определяют усиление текущего потерянного кадра....
Тип: Изобретение
Номер охранного документа: 0002666471
Дата охранного документа: 07.09.2018
28.10.2018
№218.016.97aa

Способ и устройство для определения параметра межканальной временной разности

Изобретение относится к области обработки аудио. Технический результат - уменьшение объема вычислений в процессе поиска и вычисление межканальной временной разности в процессе кодирования стерео. Способ включает в себя: определение опорного параметра согласно сигналу временной области в первом...
Тип: Изобретение
Номер охранного документа: 0002670843
Дата охранного документа: 25.10.2018
16.03.2019
№219.016.e18c

Способ и устройство для определения параметра межканальной разности времени

Изобретение относится к средствам для определения параметра межканальной разности времени. Технический результат заключается в повышении точности определения параметра межканальной разности времени. Определяют целевую сложность поиска на основании по меньшей мере двух сложностей поиска, причем...
Тип: Изобретение
Номер охранного документа: 0002682026
Дата охранного документа: 14.03.2019
29.05.2019
№219.017.62b2

Способ и устройство обработки сигналов

Изобретение относится к средствам для обработки сигналов. Технический результат заключается в повышении эффективности кодирования и декодирования сигналов. Определяют, согласно значению энергетической характеристики и значению спектральной характеристики первого поднабора N поддиапазонов...
Тип: Изобретение
Номер охранного документа: 0002688259
Дата охранного документа: 21.05.2019
10.11.2019
№219.017.e00a

Способ кодирования многоканального сигнала и кодировщик

Изобретение относится к области обработки многоканального сигнала. Технический результат заключается в повышении точности кодирования многоканального сигнала. Технический результат достигается за счет получения многоканального сигнала текущего кадра; определения начального многоканального...
Тип: Изобретение
Номер охранного документа: 0002705427
Дата охранного документа: 07.11.2019
+ добавить свой РИД