ITU-T Recommendation database

Search by number:

Others:

Study Groups tree view

ITU-T G.722 (09/2012)

Кодирование звукового сигнала с полосой 7 кГц на скорости передачи 64 кбит/с

В Рекомендации МСЭ-Т G.722 содержится описание характеристик системы широкополосного (ШП, 50–7000 Гц) кодирования звуковых сигналов, которая может использоваться для разнообразных обеспечивающих высшее качество речевых приложений. Система кодирования использует адаптивную дифференциальную импульсно-кодовую модуляцию с делением на поддиапазоны (SB-ADPCM) при битовой скорости 64 кбит/с. Далее эта система называется кодированием звуковых сигналов со скоростью 64 кбит/с (7 кГц). В рамках используемого метода SB-ADPCM полоса частоты подразделяется на два поддиапазона (верхний и нижний), и сигналы в каждом поддиапазоне кодируются с помощью ADPCM. Система имеет три базовых режима работы, соответствующие трем значениям битовой скорости для кодирования звуковых сигналов 7 кГц: 64, 56 и 48 кбит/с. Два последних режима обеспечивают возможность использования вспомогательного канала данных со скоростью 8 и 16 кбит/с, соответственно, для кодирования со скоростью 64 кбит/с путем использования битов из нижнего поддиапазона. В это новое издание был включен Список опечаток 1, а также ряд дополнительных опечаток, встретившихся в основной части Рекомендации МСЭ-T G.722.
В Приложении A представлены три частотные маски, которые могут использоваться для упрощения оценки оборудования серийного производства с использованием кодеков МСЭ-T G.722, в также для упрощения проверок, выполняемых в ходе установки. Эти маски специально не предназначены для замещения какого-либо требования данной Рекомендации, скорее они предназначены для указания на потребности приемо-сдаточных испытаний для партий оборудования, в котором используются кодеки МСЭ-Т G.722. Маски связаны с отношением сигнала к полному искажению в петле с SB-ADPCM. Таким образом, эти спецификации не предназначены для замещения цифровых последовательностей тестов алгоритма МСЭ-Т G.722, а, напротив, предназначены для обеспечения того, что прохождение последовательностями проверки на первой модели означает поддержание качества оборудования, в котором используются эти кодеки.
В Приложении B описан алгоритм масштабируемого сверхширокополосного (СШП, 50–14 000 Гц) кодирования речевых и звуковых сигналов, работающий со скоростью 64, 80 и 96 кбит/с. Сверхширокополосный кодек МСЭ-Т G.722 с расширением полосы функционально совместим с МСЭ-Т G.722. Ширина полосы выходного сигнала СШП кодера G.722 составляет 50–14 000 Гц. Кодер работает с кадрами длительностью 5 мс, имеет алгоритмическую задержку 12,3125 мс и наихудшую сложность 22,76 WMOPS (взвешенных миллионов операций в секунду). По умолчанию дискретизация входного сигнала кодера и выходного сигнала декодера осуществляется с частотой 32 кГц. Сверхширокополосный кодер для улучшенного основного элемента МСЭ-Т G.722 64 кбит/с создает встроенный битовый поток, структурно состоящий из двух слоев, соответствующих двум доступным битовым скоростям – от 80 до 96 кбит/с. Сверхширокополосный кодер для улучшенного основного элемента МСЭ-Т G.722 56 кбит/с создает встроенный битовый поток, структурно состоящий из одного слоя, соответствующего одной доступной битовой скорости – 64 кбит/с. Этот режим работы со скоростью 64 кбит/с также масштабируется на два режима – 80 кбит/с и 96 кбит/с. Битовый поток может быть усечен на стороне декодера или каким-либо компонентом системы связи для мгновенной корректировки битовой скорости до желаемого значения (96 кбит/с – 80 кбит/с – 64 кбит/с), не требуя для этого сигнализации по внешнему каналу. Базовый алгоритм состоит из трех основных частей: расширенные возможности в верхней полосе, расширение полосы (BWE) и кодирование с преобразованием в области модифицированного дискретного косинусного преобразования (MDCT) на основе алгебраического векторного квантования (AVQ). В этой пересмотренной версии были обновлены тестовые векторы Приложения B, с тем чтобы они могли в большей степени способствовать проверке реализаций на соответствие.
В Приложении C описана альтернативная реализация Приложения В МСЭ-Т G.722 на основе арифметических операций с плавающей запятой. Если Приложение B является спецификацией режима бит-в-бит с фиксированной запятой с исходным С-кодом с фиксированной запятой, доступным в МСЭ-Т, то альтернативная реализация с плавающей запятой целесообразна для платформ, оборудованных процессорами с плавающей запятой. Это альтернативное арифметическое устройство с плавающей запятой функционально полностью совместимо с Приложением B во всех конфигурациях, включая кросс-конфигурации.
В Приложении D описано расширение для стереосигналов широкополосного кодека МСЭ-Т G.722 и его сверхширокополосного расширения, Приложение В МСЭ-Т G.722. Оно оптимизировано для передачи стереосигналов с ограниченной дополнительной битовой скоростью при сохранении полной функциональной совместимости с обоими кодеками. Приложение D предусматривает работу на скорости 64–128 кбит/с с четырьмя значениями битовой скорости для сверхширокополосных стереосигналов – 80, 96, 112 и 128 кбит/с и двумя значениями битовой скорости для широкополосных стереосигналов – 64 и 80 кбит/с. Режимы широкополосных стереосигналов обеспечивают обратную совместимость с МСЭ-Т G.722, а сверхширокополосные режимы обеспечивают обратную функциональную совместимость с обеими спецификациями – широкополосных монофонических сигналов МСЭ-Т G.722 и сверхширокополосных сигналов Приложения В МСЭ-Т G.722. Стереокодек работает с кадрами длительностью 5 мс, имеет алгоритмическую задержку 13,625 мс для широкополосных стереосигналов и 15,9375 мс для сверхширокополосных стереосигналов. Дискретизация входного сигнала кодера и выходного сигнала декодера осуществляется с частотой 16 кГц и 32 кГц для широкополосных и сверхширокополосных режимов, соответственно. Базовый алгоритм состоит из трех основных частей: анализ параметров стереосигнала и микширование после записи в кодере и синтез стереосигнала в декодере. Первым слоем стереорасширения является слой со скоростью 8 кбит/с, содержащий базовые параметры стереосигнала, значения межканальной разницы во времени/межканальной фазовой разницы/межканальной когерентности и поддиапазонной межканальной разницы по уровням. Второй слой стереорасширения является также слоем со скоростью 8 кбит/с, который улучшает стереоизображение путем кодирования относящихся к нижней полосе значений поддиапазонной межканальной фазовой разницы. Наконец, третий слой стереорасширения является слоем со скоростью 16 кбит/с. В этом последнем слое передаются относящиеся к большей полосе значения межканальной фазовой разницы, которые позволяют далее улучшить стереоизображение. Битовый поток может быть усечен декодером или каким-либо компонентом системы связи для мгновенной корректировки битовой скорости до желаемого значения, включая битовые скорости широкополосного сигнала МСЭ-Т G.722 и сверхширокополосного сигнала Приложения В МСЭ-T G.722, не требуя для этого сигнализации по внешнему каналу.
Сетевые аспекты и тестовые последовательности основного алгоритма рассматриваются в Дополнениях I и II, соответственно, к настоящей Рекомендации. Дополнение II этого нового издания было обновлено для отражения изменения структуры тестовых последовательностей для основной части МСЭ-Т G.722.
Алгоритмы маскирования потери пакетов (PLC), называемые также алгоритмами маскирования стирания кадров, скрывают потери при передаче в аудиосистемах, в которых входной сигнал кодируется и пакетируется, передается по сети, принимается и декодируется до воспроизведения. Алгоритмы PLC включены в большинство стандартных современных речевых кодеров. Эта функция первоначально не входила в МСЭ-Т G.722. Таким образом, в Дополнениях III и IV представлены два механизма PLC МСЭ-Т G.722. Алгоритмы обоих дополнений были проверены в отношении сохранения показателей высокого качества с альтернативными вариантами качества/сложности. При дополнительной сложности в 2,8 WMOPS для худшего случая и в 2 WMOPS для усредненного случая по сравнению с декодером МСЭ-Т G.722, не имеющим PLC, алгоритм PLC МСЭ-Т G.722, представленный в Дополнении III, обеспечивает более высокое качество речи, в то время как PLC МСЭ-Т G.722, определенный в Дополнении IV МСЭ-Т G.722, обеспечивает меньшую сложность, практически не увеличивая сложности основного декодирования МСЭ-Т G.722 (дополнительная сложность для худшего случая составляет 0,07 WMOPS).
Алгоритм, представленный в Дополнении III, выполняет маскирование потери пакетов в выходном домене 16 кГц декодера МСЭ-Т G.722. Для заполнения сигнала потерянных пакетов используется периодическая экстраполяция сигнала при смешении с отфильтрованным шумом в соответствии с характеристиками сигнала до потери. Экстраполированный сигнал 16 кГц проходит через набор фильтров для разложения сигнала QMF, и сигналы поддиапазонов проходят в частичные поддиапазонные кодеры ADPCM для обновления состояния поддиапазонных декодеров ADPCM. Для каждой потери пакета выполняется дополнительная обработка, с тем чтобы обеспечить плавный переход от экстраполированного сигнала к сигналу, декодированному из полученных пакетов. Наряду с этим состояния поддиапазонных декодеров ADPCM синхронизованы по фазе с пакетом, полученным первым после потери пакета, и в декодированный сигнал введено предыскажение времени для согласования с экстраполированным сигналом, до того как оба сигнала будут суммированы с наложением для выравнивания перехода. При продолжительной потере пакетов алгоритм постепенно подавляет выходной сигнал. Алгоритм работает с собственным размером кадров в 10 мс. Он может работать с любым размером пакета или кадра, кратным 10 мс. Входной кадр большей продолжительности становится суперкадром, маскирование потери пакетов для которого требует соответствующего значения времени в его внутреннем размере кадра в 10 мс. Это не увеличивает задержку по сравнению с обычным декодированием МСЭ-Т G.722 с использованием того же размера кадра.
В Дополнении IV работа декодера состоит из трех этапов: декодирование в нижнем поддиапазоне, декодирование в верхнем поддиапазоне и синтезирование квадратурного зеркального фильтра (QMF). В отсутствие стирания кадров структура декодера идентична структуре МСЭ-Т G.722, за исключением хранения двух декодированных сигналов – верхнего и нижнего поддиапазонов. В случае стирания кадров сигнализация идентификации дефектного кадра (BFI) информирует об этом декодер. Далее он выполняет анализ предыдущего восстановленного сигнала нижнего поддиапазона и экстраполирует пропущенный сигнал, используя кодирование с линейным прогнозированием (LPC), повторения периода синхронизации по шагу и адаптивное подавление. Когда получен хороший кадр, выполняется перекрестное замирание декодированного сигнала и экстраполированного сигнала. В верхнем поддиапазоне декодер синхронно повторяет предыдущий шаг кадра при адаптивном подавлении и постобработке в верхних частотах. Состояние адаптивной дифференциальной импульсно-кодовой модуляции (ADPCM) обновляется после каждого стирания кадра.
В Дополнении V определяется схема кодирования средних-боковых (MS) стереосигналов с использованием сверхширокополосного расширения, определенного в Приложении B [МСЭ-Т G.722]. Благодаря введению в стереофонические терминалы кодирования средних-боковых стереосигналов функциональная совместимость с монофоническими устройствами может достигаться при весьма низкой сложности. Базовой является следующая схема кодирования: два канала левого-правого (LR) стереосигнала конвертируются в средние-боковые каналы стереосигнала и затем сигналы каждого канала кодируются независимо с использованием Приложения В МСЭ-Т G.722; далее, на стороне декодера, средний-боковой каналы битового потока от кодера декодируются соответственно и затем декодированные сигналы среднего-бокового каналов возвращаются в сигналы левого-правого каналов. Преобразование LR-MS и обратно выполняется традиционным образом. На стороне кодера для преобразования LR-MS требуются две дополнительные арифметические операции на выборку, а также требуется один оператор для преобразования MS-LR в декодере. В реализации базовых операторов библиотеки программных средств STL2009 (см. МСЭ-Т G.191) сложность преобразования составляет около 0,2 WMOPS в целом. Алгоритм кодирования для каждого канала идентичен алгоритму, описанному в Приложении В Рекомендации МСЭ-Т G.722.
В Приложениях B, C и D содержится электронное приложение, в которое включены исходные коды ANSI C, являющиеся неотъемлемой частью этих Приложений. Исходный код ANSI C также представлен как неотъемлемая часть Дополнений III и IV.
ПРИМЕЧАНИЕ. – Эталонная реализация кода ANSI-C алгоритма основной части МСЭ-Т G.722 содержится в модуле МСЭ-Т G722 Библиотеки программных средств МСЭ-Т G.191.
Тестовые последовательности представляются для проверки на соответствие алгоритма МСЭ-Т G.722 в основной части настоящей Рекомендации. Тестовые векторы представлены в помощь при проведении проверок корректного функционирования Приложений B, C и D и Дополнений III и IV.

Citation:	https://handle.itu.int/11.1002/1000/11673
Series title:	G series: Transmission systems and media, digital systems and networks G.700-G.799: Digital terminal equipments G.710-G.729: Coding of voice and audio signals
Approval date:	2012-09-13
Provisional name:	G.72x
Approval process:	AAP
Status:	In force
Maintenance responsibility:	ITU-T Study Group 21
Further details:	Patent statement(s) Development history Associated test signals

Ed.	ITU-T Recommendation	Status	Summary	Table of Contents	Download
3.1	G.722 (2012) Amd. 1 (10/2014)	In force	here	-	here
3	G.722 (09/2012)	In force	here	here	here
2.8	G.722 (1988) Amd. 2 (03/2011)	Superseded	here	-	here
2.7	G.722 (1988) Amd. 1 (11/2010)	Superseded	here	here	here
2.6	G.722 (1988) App. IV (11/2009)	Superseded	here	here	here
2.5	G.722 (1988) App. IV (07/2007)	Superseded	here	here	here
2.4	G.722 (1988) App. IV (11/2006)	Superseded	here	here	here
2.3	G.722 (1988) App. III (11/2006)	Superseded	here	here	here
2.2	G.722 (1988) Annex A (03/1993)	Superseded	here	here	here
2.1	G.722 (1988) App. II (11/1988)	Superseded	-	-	here
2.0	G.722 (1988) Err. 1 (05/2003)	Superseded	here	-	here
2	G.722 (11/1988)	Superseded	-	-	here
1	G.722 (02/1987)	Superseded	-	-	Not available


ITU-T Supplement	Title	Status	Summary	Table of contents	Download
G Suppl. 4 (12/1972)	Certain methods of avoiding the transmission of excessive noise between interconnected systems	In force	-	-	here
G Suppl. 5 (10/1984)	Measurement of the load of telephone circuits under field conditions	In force	-	-	here
G Suppl. 7 (12/1972)	Loss-frequency response of channel-translating equipment used in some countries for international circuits	In force	here	here	here
G Suppl. 8 (12/1972)	Method proposed by the Belgian telephone administration for interconnection between coaxial and symmetric pair systems	In force	-	-	here
G Suppl. 17 (10/1984)	Group-delay distortion performance of terminal equipment	In force	-	-	here
G Suppl. 19 (10/1984)	Digital crosstalk measurement (method used by the Administrations of France, the Netherlands and Spain)	In force	-	-	here
G Suppl. 22 (10/1984)	Mathematical models of multiplex signals	In force	-	-	here
G Suppl. 26 (10/1984)	Estimating the signal load margin of FDM wideband amplifier equipment and transmission systems	In force	-	-	here
G Suppl. 27 (10/1984)	Interference from external sources	In force	-	-	here
G Suppl. 28 (10/1984)	Application of transmultiplexers, FDM codecs, data-in-voice (DIV) systems and data-over-voice (DOV) systems during the transition from an analogue to a digital network	In force	-	-	here
G Suppl. 32 (11/1988)	Transfer of alarm information on 60-channel transmultiplexing equipment	In force	-	-	here
G Suppl. 34 (11/1988)	Temperature in underground containers for the installation of repeaters	In force	-	-	here
G Suppl. 35 (11/1988)	Guidelines concerning the measurement of wander	In force	-	-	here
G Suppl. 36 (11/1988)	Jitter and wander accumulation in digital networks	In force	-	-	here
G Suppl. 39 (03/2025)	Optical system design and engineering considerations	In force	here	here	here
G Suppl. 40 (07/2024)	Optical fibre and cable Recommendations and standards guideline	In force	here	here	here
G Suppl. 41 (07/2024)	Design guidelines for optical fibre submarine cable systems	In force	here	here	here
G Suppl. 42 (10/2018)	Guide on the use of the ITU-T Recommendations related to optical fibres and systems technology	In force	here	here	here
G Suppl. 43 (02/2011)	Transport of IEEE 10GBASE-R in optical transport networks (OTN)	In force	here	here	here
G Suppl. 44 (06/2007)	Test plan to verify B-PON interoperability	In force	here	here	here
G Suppl. 45 (09/2022)	Power conservation in optical access systems	In force	here	here	here
G Suppl. 46 (05/2009)	G-PON interoperability test plan between optical line terminations and optical network units	In force	here	here	here
G Suppl. 47 (03/2025)	General aspects of optical fibres and cables	In force	here	here	here
G Suppl. 48 (06/2010)	10-Gigabit-capable passive optical networks: Interface between media access control with serializer/deserializer and physical medium dependent sublayers	In force	here	here	here
G Suppl. 49 (09/2020)	Rogue optical network unit (ONU) considerations	In force	here	here	here
G Suppl. 50 (09/2011)	Overview of digital subscriber line Recommendations	In force	here	here	here
G Suppl. 51 (06/2017)	Passive optical network protection considerations	In force	here	here	here
G Suppl. 52 (09/2012)	Ethernet ring protection switching	In force	here	here	here
G Suppl. 53 (12/2014)	Guidance for Ethernet OAM performance monitoring	In force	here	here	here
G Suppl. 54 (07/2015)	Ethernet linear protection switching	In force	here	here	here
G Suppl. 55 (12/2023)	Radio-over-fibre (RoF) technologies and their applications	In force	here	here	here
G Suppl. 56 (02/2016)	OTN transport of CPRI signals	In force	here	here	here
G Suppl. 57 (07/2015)	Smart home profiles for 6LoWPAN devices	In force	here	here	here
G Suppl. 58 (07/2024)	Optical transport network module framer interfaces	In force	here	here	here
G Suppl. 59 (02/2018)	Guidance on optical fibre and cable reliability	In force	here	here	here
G Suppl. 60 (09/2016)	Ethernet linear protection switching with dual node interconnection	In force	here	here	here
G Suppl. 62 (02/2018)	Gfast certification	In force	here	here	here
G Suppl. 64 (02/2018)	PON transmission technologies above 10 Gb/s per wavelength	In force	here	here	here
G Suppl. 65 (10/2018)	Simulations of transport of time over packet networks	In force	here	here	here
G Suppl. 66 (09/2020)	5G wireless fronthaul requirements in a passive optical network context	In force	here	here	here
G Suppl. 67 (07/2019)	Application of optical transport network Recommendations to 5G transport	In force	here	here	here
G Suppl. 68 (12/2023)	Synchronization operations, administration and maintenance requirements	In force	here	here	here
G Suppl. 69 (09/2020)	Migration of a pre-standard network to a metro transport network	In force	here	here	here
G Suppl. 70 (09/2020)	Supplement on sub 1 Gbit/s services transport over optical transport network	In force	here	here	here
G Suppl. 71 (12/2023)	Optical line termination capabilities for supporting cooperative dynamic bandwidth assignment	In force	here	here	here
G Suppl. 72 (03/2025)	Modelling consideration for optical media networks	In force	here	here	here
G Suppl. 73 (10/2021)	Influencing factors on quality of experience for multiview video (MVV) services	In force	here	here	here
G Suppl. 74 (12/2021)	Network slicing in a passive optical network context	In force	here	here	here
G Suppl. 75 (12/2021)	5G small cell backhaul/midhaul over TDM-PON	In force	here	here	here
G Suppl. 76 (12/2021)	Optical transport network security	In force	here	here	here
G Suppl. 77 (06/2022)	Supplement 77 to ITU-T G-series of Recommendations - Influencing factors on quality of experience (QoE) for video customized alerting tone (CAT) and video customized ringing signal (CRS) services	In force	here	here	here
G Suppl. 78 (09/2022)	Use case and requirements of fibre-to-the-room for small business applications	In force	here	here	here
G Suppl. 79 (12/2023)	Latency control and deterministic capability over a PON system	In force	here	here	here
G Suppl. 80 (07/2024)	Use case and requirements of fibre-based in-premises networking for home application (FIP4H)	In force	here	here	here
G Suppl. 81 (07/2024)	Practical aspects of PON security	In force	here	here	here
G Suppl. 82 (07/2024)	Enhanced optical line termination with information technology functions	In force	here	here	here
G Suppl. 83 (07/2024)	Supplement on the use of options in the precision time protocol profile with full timing support from the network	In force	here	here	here
G Suppl. 84 (03/2025)	Operational aspects of optical access	In force	here	-	here
G Suppl. 85 (03/2025)	FgODU over point-to-multipoint networks	In force	here	-	here
G Suppl. 86 (03/2025)	Fibre to the power grid (FTTGrid) use cases and network requirements	In force	here	here	here
G Suppl. 87 (03/2025)	Standardization framework for optical fibres for space division multiplexing	In force	here	-	here

Title	Approved on	Download
Roadmap for QoS and QoE in the ITU-T Study Group 12 context (TR-RQ)	2023	here
Considerations on the use of GNSS as a primary time reference in telecommunications	2020	here
Use of G.hn in industrial applications	2020	here
Practical procedures for subjective testing	2011	here
ISDN field trial guidelines	1991	here

Committed to connecting the world

ITU-T Recommendations

ITU-T G.722 (09/2012)