Efeitos para processamento de som. Processamento de composição

Além disso, vários métodos matemáticos são aplicados aos fonogramas digitais, por exemplo, interpolação de amostras (Reparo) ou sua correção proporcional (Normalizar).

Transformadas espectrais afetam o timbre do som. Isso inclui vários filtros: passa-alto, passa-baixo ou passa-banda e equalizadores - paramétricos ou gráficos.
Um importante caso especial de transformações espectrais são as transformações de formantes - manipulações com formantes - bandas de frequência características encontradas em sons pronunciados por uma pessoa. Ao alterar os parâmetros do formante, você pode enfatizar ou sombrear sons individuais, alterar uma vogal para outra, mudar o registro de uma voz, etc.

Efeitos de atraso com base no atraso de tempo de uma cópia do sinal em relação à outra. Esses efeitos podem criar a ilusão de espaço ou sala, como reverberação, eco, etc., a ilusão de múltiplas fontes de som (coro) ou a ilusão de movimento (phasers, flangers).

Modulação de parâmetros de sinal... Em efeitos como o phaser, a fase do sinal é modulada com uma vibração de baixa frequência (com uma frequência bem abaixo da frequência mínima de áudio de 20 Hz). A modulação de amplitude produz um efeito de tremolo e a modulação de frequência produz vibrato.

Editores de som

Este tipo de programa inclui software que permite editar e gerar dados de áudio. O editor de som pode ser implementado total ou parcialmente como uma biblioteca, aplicativo, aplicativo da Web ou um módulo de extensão do kernel do sistema operacional.

Tipo de programa Wave Editor é um editor de som digital que geralmente é usado para gravar e editar música, aplicar efeitos e filtros, atribuir canais estéreo, etc.

Estação de trabalho de áudio digital (DAW) é um programa mais poderoso, que geralmente consiste em muitos componentes, combinados com uma única interface gráfica. A característica distintiva prática e mais óbvia de uma DAW é seu sequenciador MIDI completo. Muitos DAWs também fornecem ferramentas de edição de vídeo para a criação de vídeos musicais.

Editores de som projetados para trabalhar com música geralmente permitem que o usuário:

  • importar e exportar arquivos de áudio de vários formatos,
  • gravar som de uma ou mais entradas e armazená-lo na memória do computador em formato digital,
  • editar trilhas sonoras na linha do tempo usando transições (fade in, fade out, crossfading),
  • misture várias fontes / faixas de som com diferentes níveis de volume, panorâmica, etc., e direcione para um ou mais canais de saída,
  • aplique vários efeitos e filtros, incluindo compressão, expansão, vários tipos de modulação, reverberação, redução de ruído, equalização, etc.
  • reproduzir som, encaminhando-o para dispositivos de saída, como alto-falantes, processadores externos ou dispositivos de gravação,
  • converter o som de um formato de áudio para outros e alterar as características de conversão analógico-digital (profundidade de bits e frequência de amostragem)

Edição "destrutiva" e "não destrutiva"

Os editores de som permitem a edição "não destrutiva" em tempo real e a edição "destrutiva", ou seja. como um processo de conversão separado, não relacionado à reprodução ou exportação de um fonograma, e também para combinar esses dois tipos.

A edição destrutiva altera o arquivo de áudio original, enquanto a edição não destrutiva apenas altera os parâmetros de sua reprodução. Por exemplo, se parte de uma trilha for excluída durante a edição destrutiva, esses dados serão excluídos. Se a edição não destrutiva ou em tempo real for usada, os dados excluídos permanecem, mas não são reproduzidos.

Benefícios da edição destrutiva:

  • No editor gráfico, todas as alterações feitas podem ser observadas visualmente.
  • O número de efeitos que podem ser aplicados é praticamente ilimitado (ou apenas limitado pelo espaço em disco alocado para o Histórico).
  • A edição é geralmente precisa, reduzida a uma única amostra.
  • Os efeitos podem ser aplicados a uma região estritamente definida - com precisão para a amostra.
  • Misturar e exportar o áudio editado é rápido, pois não requer o cálculo dos efeitos aplicados.

Limitações da edição destrutiva:

  • Uma vez aplicado, o efeito não pode ser alterado. É verdade que é possível "desfazer" a última ação realizada. Normalmente, o editor mantém muitos níveis de "histórico de desfazer" para que várias ações possam ser desfeitas na ordem inversa daquela em que foram aplicadas.
  • A ordem de desfazer não pode ser alterada (a última edição é desfeita primeiro, etc.).

Benefícios da edição em tempo real (em tempo real):

  • Os efeitos geralmente podem ser ajustados durante a reprodução ou em qualquer outro momento.
  • As edições podem ser desfeitas ou corrigidas a qualquer momento e em qualquer ordem.
  • Vários efeitos podem ser aplicados em sucessão, enquanto sua sequência pode ser alterada, efeitos podem ser removidos da cadeia ou adicionados.
  • Muitos editores apoiam a automação do efeito, ou seja, mudança automática de seus parâmetros durante a reprodução.

Limitações da edição em tempo real:

  • A forma de onda exibida na Linha de tempo permanece a mesma; os efeitos aplicados não a afetam.
  • O número de efeitos que podem ser aplicados é limitado pela potência do computador ou dispositivo. Em alguns editores existe uma função de "congelamento" da trilha (destruição da pilha de efeitos).
  • Normalmente, um efeito não pode ser aplicado a apenas uma parte da trilha. Para aplicar um efeito em tempo real a uma parte de uma trilha, o efeito é ativado em um ponto e desativado em outro.
  • Em editores multitrack, se o áudio for copiado ou movido de uma trilha para outra, o som na nova trilha pode ser diferente de como soava na trilha original, uma vez que diferentes efeitos em tempo real podem ser aplicados a cada trilha.
  • A mistura e a exportação são lentas porque você precisa calcular adicionalmente os efeitos aplicados em tempo real.

Projetado para processamento de áudio, que pode ser dividido em quatro grupos principais: Dispositivos de processamento dinâmico, Processamento de Freqüência, Processamento de Modulação e Dispositivos de Processamento Espacial e de Tempo. Dispositivos para processamento de som dinâmico: Compressor, Limitador, Expansore Portão. Compressor - Um dispositivo que comprime a faixa dinâmica do sinal. Compressor atenua o volume do som nos casos em que o sinal excede um certo nível predefinido. Limitador- Um dispositivo que evita que o sinal ultrapasse o nível de volume definido pode ser realizado com um compressor. Expansor- Um dispositivo cujo funcionamento é oposto ao do compressor. Expansorexpande a faixa dinâmica do sinal. Portão- um dispositivo capaz de cortar o sinal abaixo do limite definido. É usado para eliminar o ruído nas pausas entre sinais úteis. Portão, é capaz de cortar a "cauda" do sinal, o que tornará o som mais claro. Dispositivos de processamento de sinal de frequência:Equalizador Gráfico,Equalizador Paramétrico. Equalizador Gráfico- um dispositivo com um conjunto de frequências especificadas pelo fabricante, em cada uma das quais você pode amplificar ou atenuar o sinal. Equalizador Paramétrico- o dispositivo mais comum para processamento de frequência de som, permitindo que você selecione uma banda de frequência, e nesta faixa de frequência, para atenuar ou amplificar o sinal. Dispositivos de processamento de sinal de modulação: X orus,Flanger. Horus- um dispositivo bastante comum para processamento de modulação, o princípio do qual é baseado em um atraso de tempo de sinal flutuante, Horus cria o efeito de fazer soar vários instrumentos quando apenas um está tocando. Flanger- um dispositivo que funciona como Horus, mas com uma pequena diferença, que é o uso de feedback e o aparecimento de frequências ressonantes adicionais. Dispositivos temporários de processamento de som:Demora,ressonância. Demora- um dispositivo com efeito de eco, com a capacidade de ajustar o atraso de tempo. Ressonância- um dispositivo de uso frequente, cuja essência é atenuar o sinal com a reflexão repetida desse sinal a partir de obstáculos, com a obtenção de um efeito de som surround. Efeitos de montanha, grande sala de concertos, efeito de som subaquático, etc.

Uma foto:

Comprar Dispositivos de processamento de som pode estar na empresa Luz e som profissionais .

: (Reino Unido),(Dinamarca),

BOWERS & WILKINS (Reino Unido), (Alemanha), (Dinamarca),

(Alemanha), (EUA), (Alemanha), (EUA),

MERIDIANÁUDIO (Reino Unido),MONITORAUIO (Reino Unido),

(Reino Unido).

Também no nosso site poderá consultar outras informações que lhe possam interessar, e os nossos especialistas, por sua vez, lhe prestarão todo o apoio técnico: ,,,,, ,,

02/03/2015 às 10:15

Portanto, nesta série de artigos, falaremos sobre o que é compressão e como usá-la. Infelizmente, muitas vezes as pessoas o usam por não entenderem seus fundamentos e o resultado está longe da melhor qualidade. Foi o que me levou a escrever uma série de artigos onde analisaremos em detalhes o funcionamento de um dispositivo denominado compressor, e mostrarei sua aplicação na prática.

Um dos principais parâmetros do som é sua dinâmica. Com a ajuda da dinâmica, você pode acentuar notas e frases musicais adicionando novas cores ao trabalho, mas, como mostra a prática, poucos músicos (aqui os profissionais da área não são levados em consideração) conseguem fazer isso. E os tambores que não estão sujeitos ao processamento dinâmico parecem secos e inexpressivos. E a resposta é simples - nossa audição é mais sensível a sons agudos e menos sensível aos graves. A título de exemplo, podemos comparar o som de um prato e um sub-tambor, normalizá-los para 0db e ouvir: as pessoas perceberão um prato com mais brilho, clareza e saturação. Claro, você pode elevar o nível do subtambor, mas ao mesmo tempo (dada a presença de outros instrumentos na mixagem) corremos o risco de obter um mingau cortante com os sons, onde o tambor sairá da escala e o prato tocará em algum lugar atrás. É para prevenir "conflitos dinâmicos" que o compressor é utilizado. Mixagens prontas também podem ser passadas por ele para nivelar o som geral, adicionar densidade a ele e criar um efeito de bombeamento.

Para resumir o acima:Compressor - o dispositivo usado para diminuir a faixa dinâmica - a lacuna entre os níveis de sinal de áudio mais altos e mais baixos.

O princípio de funcionamento do compressor não é tão complicado como parece - capta tudo o que ultrapassa o valor definido em db e reduz de acordo com as configurações. Vejamos um exemplo de compressor do T-Racks Plugin Bundle

Limite - este parâmetro é responsável pelo limite do compressor. São eles que definem o limite no qual o compressor começa a funcionar. É medido em db. Por exemplo, se definirmos o valor deste parâmetro para -11,1, significa que tudo abaixo desta faixa não será processado, mas tudo acima do compressor irá capturar e processar.

Quero avisá-lo imediatamente - você precisa trabalhar com este parâmetro com muito cuidado e olhar constantemente para o visor do painel de informações (canto superior direito). Ao processar o sinal de áudio, existe o risco de capturar sons mais silenciosos que não precisam de compressão.

Razão - razão. Freqüentemente, muitos não entendem esse parâmetro ou o entendem mal. Na verdade, tudo é muito simples - ele é responsável pela quantidade de atenuação do sinal. Também é medido em db. Digamos que temos um valor de 2 (em alguns compressores a notação 2: 1 pode ser usada), isso significa que o sinal excedeu o limite Limiteserá atenuado para 1 db acima do valor limite, 8 db será atenuado para 4x e assim por diante. Valor Razãona região 3 será considerada compressão moderada, 5 - média, 8 - forte e valores acima de 20 já serão considerados limitantes. Neste caso, nosso compressor começa a se parecer Limitador, mas este compressor não permite tais valores extremos.

AtaqueTempo - tempo de resposta do compressor, que é necessário para que o sinal se torne comprimido ao máximo depois de passar o limite definido pelo parâmetro Limite... Medido em milissegundos.

Em alguns compressores, o tempo de ataque é mostrado em dB / s.

Liberação - tempo de recuperação Este parâmetro é completamente oposto ao parâmetro AtaqueTempo. Especificamente, este é o tempo que leva para o sinal retornar ao seu estado original. O tempo de recuperação geralmente é significativamente maior do que o tempo de ataque.

No compressor deT - Racks isto é especialmente perceptível porque valor do tempoLiberação representado em segundos versus valor em milissegundosAtaque Tempo .

FaçoAcima - devido ao compressor ser um dispositivo que reduz a característica dinâmica do sinal, o som na saída ficará mais silencioso do que era antes do processamento. Este parâmetro é usado para compensar este processo. Em outras palavras, o usamos para aumentar o volume do sinal após o processamento.

Em alguns compressores também é pode ser denotado comoResultado Ganho , Resultado , Ganho etc.

Joelho - este parâmetro mostra a transição suave entre o sinal comprimido e não comprimido. Tem 2 tipos - DifícilJoelho e SuaveJoelho. Usando SuaveJoelhoessa transição ocorre de forma mais suave e natural, o compressor fica mais suave e invisível. Seu trabalho é muito bem ilustrado pelo gráfico a seguir.

Tipos de compressão (por princípio de uso):

1. Compressão sequencial - o tipo mais comum de processamento de som dinâmico. NO Inserir canal, adicione o compressor que precisamos e configure. É simples.

2. Compressão paralela -este tipo de compressão também é bastante difundido, mas há uma diferença significativa da compressão sequencial - com ela adicionamos um compressor para Enviar-canal e misture-o com o som limpo e não processado.

Alguns compressores têm um parâmetro Misturar, que permite que você ajuste a proporção do sinal limpo para o sinal processado sem ter que criar uma trilha separada Enviar.

3. Compressão multibanda - compressão, na qual bandas de frequência individuais são processadas de forma diferente. Vamos dar uma olhada no compressor multibanda da Waves

O princípio de funcionamento deste compressor não é tão complicado como pode parecer à primeira vista: é baseado em um dispositivo chamado Crossover, que divide as frequências do sinal de áudio em diferentes bandas. E então trabalhamos como um compressor convencional, mas cada faixa de frequência pode ser processada com suas próprias configurações, o que é muito útil ao processar instrumentos de mixagem individuais.

Isso é tudo. Na segunda parte irei falar sobre as características do uso de vários compressores.

Modulação - alterar um dos parâmetros de som com a ajuda de outra fonte externa de vibrações. o efeito vibrato é um excelente exemplo de processamento de modulação. A essência do efeito vibrato é alterar periodicamente um dos parâmetros de uma vibração sonora: amplitude, frequência ou fase. A mudança no parâmetro ocorre em uma frequência muito baixa - unidades de hertz. A seguir estão exemplos de alguns tipos de modulação.

Vibrato de amplitude inclui a amplitude real de vibrato e tremolo. A essência do vibrato de amplitude é a mudança periódica na amplitude do sinal sonoro. A frequência em que isso acontece deve ser muito baixa (de frações de hertz a 10-12 Hz). Se a frequência do vibrato estiver fora desses limites, o efeito estético desejado não será alcançado.

Vibrato de frequência - mudança periódica na frequência da vibração do som (altura do tom musical). Um belo som é obtido apenas quando a profundidade da frequência do vibrato (a mudança relativa na frequência do som) é pequena. A flutuação do tom com o vibrato de frequência não deve exceder várias dezenas de centésimos de semitom. Caso contrário, é criada a impressão de uma violação da afinação do instrumento.

Timbre vibrato projetado para alterar o espectro de vibrações sonoras. A essência física deste efeito reside no fato de que a oscilação original com um timbre rico é passada por um filtro de frequência passa-faixa, no qual a frequência de sintonia ou a largura de faixa mudam periodicamente, ou ambos os parâmetros mudam de acordo com leis diferentes. Além do vibrato timbre automático, o vibrato manual também é usado (mais frequentemente até o “pé”, com o controle de um pedal). Esta versão do efeito é conhecida como “ uau uau" ( wah - wah ).

8.4 Efeitos baseados no atraso do sinal

Atraso (atraso) também é usado para obter o efeito de uma ou várias repetições de qualquer som. A quantidade de atraso do sinal é determinada por vários fatores. Para sons curtos e agudos, o tempo de atraso no qual o sinal principal e sua cópia são distinguíveis é menor do que para sons estendidos. Para músicas de ritmo lento, o atraso pode ser maior do que para músicas rápidas.

Em atrasos virtuais, como em seus protótipos de hardware, sempre há controles para a quantidade de sinal atrasado, bem como um controlador para o coeficiente de feedback. (comentários), que determina o número de repetições.

Ressonância permite simular o ambiente acústico de várias salas. A essência da reverberação é que o sinal de som original é mixado com suas cópias atrasadas em relação a ele em diferentes intervalos de tempo. Isso torna a reverberação mais parecida com um atraso. A diferença é que, com a reverberação, o número de cópias de sinais com retardo pode ser significativamente maior do que com retardo. Em teoria, o número de cópias pode ser infinito. O efeito de reverberação expande e enriquece muito a resposta estéreo do sinal.

A base dos efeitos sonoros flanger e phaser atraso de sinal também está incluído. Flanger e phaser são uma combinação de atraso de áudio modulado em frequência ou fase. A diferença entre eles é puramente quantitativa. Um flanger difere de um phaser porque, para o primeiro efeito, o tempo de atraso da cópia (ou tempos de atraso da cópia) e a mudança nas frequências do sinal são muito maiores do que para o segundo.

Essas diferenças quantitativas nos efeitos também levam a diferenças qualitativas: em primeiro lugar, os sons por eles processados \u200b\u200badquirem propriedades acústicas e musicais diferentes e, em segundo lugar, os efeitos são realizados por meios técnicos diferentes.

Refrão aparece como o efeito da duplicação do mesmo som ou parte do instrumento. O efeito produzido artificialmente é um modelo para o som do coro. Por um lado, as vozes dos cantores e os sons dos instrumentos ao tocar a mesma nota devem soar iguais, e tanto os músicos quanto os maestros se esforçam para isso. Mas, devido às diferenças individuais nas fontes, o som ainda é diferente. No espaço, no trato de amplificação do som e no aparelho auditivo humano, essas vibrações levemente desiguais interagem, as chamadas batidas são formadas. O espectro do som é enriquecido e, o mais importante, "flui, brilha".

O algoritmo de operação de coro é o seguinte:

O sinal original é dividido em dois ou mais canais;

Em cada um dos canais, o espectro do sinal é alterado em frequência por uma certa quantidade, os deslocamentos de frequência são muito pequenos, são frações de Hz e em alguns casos mudam no tempo;

Em cada um dos canais, o sinal é ligeiramente atrasado no tempo, e a quantidade de atraso pode variar (portanto, coro é um dos efeitos baseados no atraso do sinal);

Cada um dos canais é posicionado em seu próprio ponto no panorama estéreo;

Os sinais obtidos desta forma são somados.

Como resultado, um sinal é obtido, o espectro do qual muda continuamente, e o período do ciclo completo dessa mudança é tão longo que a repetibilidade das propriedades espectrais do sinal não é sentida.

1

A teoria da modulação tem uma ampla gama de aplicações, com base no processamento de sinais no domínio do tempo, em particular, pode ser aplicada como base para resolver problemas de processamento de sinais de áudio de banda larga ao transmiti-los por um canal de rádio de banda estreita, incl. por canal telefônico. Na teoria da modulação, um sinal é descrito como um processo modulado complexo (simultaneamente em amplitude e frequência) na forma do produto do envelope (função moduladora em amplitude do sinal) e o cosseno da fase (função modulada em frequência do sinal). Uma característica dessa teoria é a seleção de parâmetros de informação do sinal, cujo número aumenta após cada estágio subsequente de sua expansão em funções modulantes (expansão em vários estágios). Isso abre a possibilidade de influenciar os parâmetros de informação selecionados de diferentes níveis e alcançar o tipo de processamento de sinal desejado. A aplicação da teoria da modulação com a implementação da decomposição em múltiplos estágios possibilitará a realização de novas pesquisas no estudo das modulações naturais dos sinais de áudio com o objetivo de aprimorar os meios técnicos de radiocomunicação utilizando os sinais de voz como principal informação transmitida. A revisão permitiu concluir sobre a relevância da perspectiva do uso de funções moduladoras para processamento de sinais de áudio. As perspectivas para o uso da operação de divisão-multiplicação da frequência instantânea do sinal sem isolar as funções de modulação são divulgadas. São dados os pré-requisitos para seu uso, métodos para estudar a possibilidade de usar a operação de divisão de frequência instantânea para redução de ruído na transmissão de sinais comprimidos em frequência em duas versões: redução de ruído de frequência de rastreamento e filtragem dinâmica.

análise-síntese de modulação

frequência instantânea

redução de ruído

1. Ablazov V.I., Gupal V.I., Zgursky A.I. Conversão, gravação e reprodução de sinais de voz. - Kiev: Lybid, 1991.-- 207 p.

2. Ageev D.V. Banda ativa do espectro de frequência da função de tempo // Proceedings of the GPI. - 1955. - T. 11. - N. ° 1.

3. Gippernreiter Yu.B. Pitch Perception: Resumo do autor. dis. Cand. Ciências psicológicas - M.: 1960 .-- 22 p.

4. Ishutkin Yu.M. Desenvolvimento da teoria da modulação-análise-síntese de sinais sonoros e sua aplicação prática na técnica de gravação de som de filmes: Resumo do autor. dissertação para o acadêmico Arte. d. t. n. - M.: NIKFI, 1985.-- 48 p.

5. Ishutkin Yu.M., Uvarov V.K. Fundamentos das transformações de modulação de sinais de áudio / Ed. Uvarova V.K. - SPb.: SPbGUKiT, 2004 .-- 102 p.

6. Ishutkin V.M. Prospects for processing sinais sonoros por suas funções modulantes / Em coleção: Problems of sound engineering // Proceedings of LIKI, Vol. XXXI. - L .: LIKI, 1977. - S. 102-115.

7. Korsunsky S.G. Influência do espectro de som percebido em sua altura // Probl.physiol.acust. - 1950. - T. 2. - S. 161–165.

8. Markel J.D., Gray A.H. Predição de fala linear: Per. do inglês / Ed. Yu.N. Prokhorov, V.S. 3 buracos. - M.: Communication, 1980.-- 308 p.

9. Markin D.N., Uvarov V.K. Resultados de estudos práticos das relações entre os espectros do sinal, seu envelope, cosseno de fase e frequência instantânea. Dep. mãos. No. 181kt-D07, ONTI NIKFI, 2007. - 32 p.

10. Markin D.N. Desenvolvimento de um método e meios técnicos para compactar os espectros de sinais de voz. Resumo do autor. dis. para solicitar uma conta. Arte. Ph.D. n. - SPb.: SPbGUKiT, 2008 .-- 40 p.

11. Muravyov V.E. Sobre o estado atual e os problemas da tecnologia vocoder // Modern speech technologies, coleção de trabalhos da IX sessão da Sociedade Acústica Russa, dedicada ao 90º aniversário de M.A. Sapozhkova. - M.: GEOS, 1999. - 166 p.

12. Orlov Yu.M. Supressor de ruído de filtro dinâmico // TKiT. - 1974. - No. 10. - P. 13-15.

13. Sapozhkov M.A. Sinal de fala em cibernética e comunicação. A transformação da fala aplicada aos problemas da tecnologia da comunicação e da cibernética. - M: Svyazizdat, 1963.-- 452 p.

14. Uvarov V.K., Plushev V.M., Chesnokov M.A. Aplicação de transformações de modulação de sinais de áudio / Ed. VC. Uvarova. - SPb.: SPbGUKiT, 2004 .-- 131 p.

15. Uvarov V.K. Compressão da faixa de freqüência dos sinais de áudio para melhorar a qualidade do som durante a exibição do filme: Avtoref.dis. Candidato de Tech. ciências. - L .: LIKI, 1985. - 22 p.

16. Zwicker E., Feldkeller R. Ear como receptor de informações: Per. com ele. - M .: Svyaz, 1971. - 255 p.

17. Gabor D. Teoria das comunicações. - The Journal of the institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, No. 26, novembro de 1946. - P. 429–457.

18. Ville J.A. Theorie et application de la notion de signal analytique. - Cables a Transmissions, 2A, No. 1, janeiro de 1948. - P. 61–74; traduzido do francês em I. Selin, "Teoria e aplicações da noção de sinal complexo". - Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, agosto de 1958.

A teoria da modulação tem uma ampla gama de aplicações baseadas no processamento de sinais no domínio do tempo, em particular, pode ser aplicada como base para resolver problemas de processamento de sinais de áudio de banda larga ao transmiti-los por um canal de rádio de banda estreita, incl. por canal telefônico.

A revisão dos métodos de processamento de sinais de áudio revelou a natureza promissora da análise-síntese de modulação desenvolvida por Yu.M. Ishutkin na década de 70 do século passado para processar e medir distorções. Posteriormente, a teoria da modulação foi desenvolvida nos trabalhos de seus alunos e seguidores.

Modulando funções de oscilações complexas

Em meados do século XX, dois cientistas D. Gabor e J. Vie criaram de forma independente a teoria de um sinal analítico, que permite descrever qualquer processo aleatório como uma função explícita do tempo. Foi essa teoria que se tornou a base matemática com base na qual a teoria da modulação dos sinais sonoros foi posteriormente formada.

Sob algumas restrições não rígidas, quaisquer oscilações de uma forma complexa podem ser representadas como um produto de duas funções explícitas de tempo

onde s (t) é o sinal de som original,

S (t) - envelope de sinal não negativo, função moduladora de amplitude;

cos φ (t) - cosseno da fase do sinal, função modulada em frequência;

φ (t) é a fase atual do sinal, a função moduladora de fase do sinal.

Frequência de sinal instantâneo, função de sinal de modulação de frequência.

As funções modulantes S (t), φ (t) e ω (t) dos sinais são funções reais do argumento real t. Em casos gerais, as funções de modulação não podem ser determinadas com base no próprio sinal original s (t): ele deve ser complementado com um segundo sinal, chamado de referência s1 (t), e as funções de modulação podem ser determinadas para um par desses sinais (,). A forma dessas funções é igualmente dependente de ambos os sinais.

J. Gabor, pela primeira vez em 1946, mostrou a necessidade de um sinal de referência para determinar as funções de modulação e aplicou para isso a transformada de Hilbert direta ao sinal original s (t). Na engenharia de rádio teórica, isso levou ao conceito de um sinal analítico. No entanto, a teoria analítica do sinal foi desenvolvida para oscilações de banda estreita.

Funções de modulação de sinal de banda larga

Posteriormente, conceitos matemáticos rigorosos de funções de modulação foram estendidos para sinais de áudio de banda larga. No entanto, a escolha do sinal de referência é assumida como arbitrária, e apenas os requisitos para a ortogonalidade dos sinais principal e de referência são apresentados. No entanto, no momento, é a transformada de Hilbert que é considerada uma forma tecnicamente conveniente de construir um par de sinais ortogonais.

Uma vez que, no caso geral, os sinais sonoros são não periódicos e podem ser considerados quase periódicos apenas em intervalos de tempo separados um tanto curtos, na teoria da modulação, a transformada de Hilbert direta com o kernel de Cauchy é usada para determinar o sinal de referência

, (2)

onde H é o operador de transformação de Hilbert, integral (2) é singular, ou seja, não existe no sentido usual no ponto t \u003d τ, deve ser entendido como a integral de Lebesgue, e seu valor no ponto t \u003d τ como o valor principal de acordo com Cauchy.

Duas funções relacionadas entre si pela transformação (2) são chamadas de conjugado de Hilbert. Sabe-se da teoria da transformada de Hilbert que essas funções satisfazem a condição de ortogonalidade, ou seja, seu produto escalar é igual a zero em todo o domínio de definição.

. (3)

A expressão (3) é uma integral definida entendida no sentido de Lebesgue. T - significa a faixa de valores da variável t, sobre a qual a integração é realizada.

Na representação geométrica, a função de modulação em amplitude S (t) é um vetor de sinal girando em torno da origem com uma frequência angular ω (t), enquanto o sinal pode se desenvolver rapidamente ou lentamente, mas apenas na direção direta, e não na direção oposta. Isso significa que ambas as funções de modulação podem assumir quaisquer valores positivos e negativos (e não limitadas por nada) e cada uma tem, no caso geral, componentes constantes e variáveis:

onde S0 é o componente constante (valor médio) do envelope do sinal;

SS (t) - envelope da componente variável do envelope do sinal;

cos ωS (t) é o cosseno de fase da componente variável do envelope do sinal;

ω0 é o valor médio da frequência instantânea do sinal (frequência portadora);

ωd (t) é o desvio da frequência instantânea do sinal;

ωm (t) é a freqüência do sinal modulante.

Conversão de modulação multiestágio

Do acima exposto, segue-se que o processo de decomposição do sinal em termos de suas funções de modulação pode ser continuado - para realizar a decomposição de modulação de múltiplos estágios.

A primeira etapa da expansão fornece um par de funções de modulação de primeira ordem (consulte a fórmula 4)

O segundo estágio da expansão fornece dois pares adicionais de funções moduladoras de segunda ordem. Nesse caso, o envelope de primeira ordem S1 (t) fornece o envelope e a frequência instantânea do envelope: S21 (t) e ω21 (t).

O segundo estágio de decomposição da freqüência instantânea de primeira ordem ω1 (t) dá a envoltória da freqüência instantânea e a freqüência da freqüência instantânea: S22 (t) e ω22 (t).

Após a terceira expansão, mais quatro pares de funções moduladoras de terceira ordem são obtidos, etc.

Os parâmetros das funções de modulação de várias ordens listadas após a fórmula (4) são importantes sinais de informação de um sinal de áudio, o impacto sobre os valores e arranjo de frequência que abre amplas oportunidades para o processamento de um sinal de áudio: compressão de espectro, mudança de tom, conversão de faixa dinâmica e redução de ruído, transposição de sinal, etc. etc.

As tarefas técnicas de processamento de sinais de áudio influenciando suas funções de modulação são as seguintes:

● para criar um demodulador (conversor) multiestágio, quando aplicado à entrada da tensão u (t) \u003d s (t), as saídas forneceriam tensões proporcionais às funções de modulação do primeiro, segundo, etc. pedidos;

● influenciar os valores e espectros dessas tensões;

● restaurar o sinal de som de acordo com as funções de modulação processadas, ou seja, realizar modulação de amplitude e frequência de oscilações de geradores.

Por exemplo, o uso de um efeito corretivo não linear nos parâmetros da função de modulação de amplitude permitirá a compressão e redução de ruído do sinal de áudio reconstruído. Ao afetar o sinal do canal com uma função de modulação de frequência usando um circuito não linear com uma diminuição no coeficiente de transmissão diferencial com um aumento nos valores instantâneos da tensão de saída, é possível obter uma compressão da faixa de frequência do sinal de áudio processado. Ao dividir a frequência ωm (t) e eliminar a parte de alta frequência de seu espectro, é possível comprimir significativamente o espectro do sinal de áudio enquanto mantém alta imunidade a ruído.

Perspectivas para a aplicação da multiplicação da divisão da frequência instantânea do sinal sem isolar as funções de modulação para reduzir o ruído

Formulação do problema

Ao transmitir sinais de áudio em canais de comunicação de banda estreita, a compressão de frequência leva a uma limitação perceptível da largura do espectro de frequência instantânea. Investigemos a possibilidade de substituir no espectro dos fonemas de tais sinais os componentes causados \u200b\u200bpor altas frequências de modulação de frequência, por outros componentes localizados em frequências próximas, mas causados \u200b\u200bpor um aumento no desvio da frequência instantânea do fonema ao restaurar sinais comprimidos em frequência. Essa substituição deve proporcionar uma melhoria na qualidade da transmissão do som devido a uma percepção subjetiva mais completa.

Os pré-requisitos para tal declaração do problema podem ser os seguintes:

1. Os sons vocálicos durante a maior parte de sua duração podem ser considerados um sinal periódico. Conforme o desvio de frequência aumenta, o número de harmônicos de afinação aumentará. Portanto, é possível reduzir o número de harmônicos de tom fundamentais durante a transmissão do sinal e restaurar seu número no lado receptor do canal, aumentando o desvio de frequência.

2. Os espectros de consoantes surdas são contínuos. Os espectros de suas frequências instantâneas também são contínuos, em uma faixa aproximadamente igual à metade da faixa de frequência do espectro do sinal. Portanto, com o aumento do desvio de frequência, o espectro da frequência instantânea permanecerá contínuo, mas o espectro do fonema se expandirá.

3. A influência da composição espectral de sinais complexos na percepção de sua altura é conhecida. Sons ricos em componentes espectrais de alta frequência são percebidos pelo ouvido como mais altos do que sons com a mesma frequência fundamental, mas com harmônicos fracos ou menos de ordem alta.

4. Como a substituição de componentes espectrais ocorrerá em altas frequências, pode-se supor que tal substituição será imperceptível ou quase imperceptível ao ouvido. Isso se baseia na redução da sensibilidade da audição às mudanças de tom na região de alta frequência.

Desenvolvimento de métodos de pesquisa

Redução de ruído de frequência de rastreamento

A possibilidade de usar a operação de divisão instantânea de frequência para fins de redução de ruído será quantitativamente comprovada após estudos preliminares dos limites permitidos para a redução dos espectros das funções de modulação dos sinais de áudio para diferentes canais de transmissão.

Ao usar a divisão de frequência instantânea com o propósito de transmitir sinais de áudio na forma de frequência comprimida, é óbvio que o sinal transmitido está concentrado na região de baixa frequência. Além disso, a largura de banda necessária para a transmissão do sinal sem distorção mudará constantemente, junto com a mudança no sinal de áudio. Portanto, uma das principais tarefas deste estudo pode ser chamada de determinação da possibilidade de criação de um filtro passa-baixa de rastreamento (LPF), cuja frequência de corte superior mudaria com o tempo, tomando valores de acordo com certos limites permitidos da banda de frequência da frequência instantânea e envelope, que serão conhecidos a seguir conduzindo pesquisas preliminares. Parece que a redução da largura de banda para sinais de banda estreita, que praticamente não mascaram o ruído do canal de transmissão, será muito significativa. Portanto, para tais sinais, o ganho na relação sinal-ruído será significativo.

A segunda tarefa deste estudo deve ser chamada de definição do sinal de controle para o LPF. Como os primeiros contendores para o papel de um sinal de controle, os sinais proporcionais a ωн (t) ou a derivada da frequência instantânea do sinal podem ser propostos de acordo com. Uma vez que a redução de ruído é alcançada pela distinção entre as faixas de frequência do sinal e do ruído, essa redução de ruído pode ser chamada de frequência.

Ao usar o envelope para a redução de ruído de amplitude de limiar ou para filtragem dinâmica, obtemos um supressor de ruído combinado para sinais de frequência comprimida.

Filtragem dinâmica

Como é sabido, nas versões existentes de filtros dinâmicos, toda a faixa de frequência dos sinais de áudio é dividida em bandas, em cada uma das quais a redução de ruído é realizada usando um supressor de ruído de limiar (geralmente são dispositivos inerciais). As desvantagens dos filtros dinâmicos geralmente incluem a complexidade do hardware, já que um filtro dinâmico é uma combinação de vários supressores de ruído de limite (geralmente quatro ou mais). Além disso, surgem dificuldades em garantir características de frequência linear.

Agora é possível explorar uma variante da filtragem dinâmica em uma banda de baixa frequência ao transmitir sinais comprimidos em frequência, controlando a largura de banda do sinal do envelope. Como você sabe, com a diminuição do nível do sinal sonoro, os harmônicos superiores do som primeiro se afogam no ruído do canal de transmissão do som e, por último - a oscilação do tom fundamental. Isso sugere que é possível, diminuindo a largura de banda do filtro em proporção à diminuição do envelope, fornecer um efeito de redução de ruído sem as desvantagens típicas dos filtros dinâmicos.

Conclusão

Na teoria da modulação, um sinal é descrito como um processo modulado de forma complexa (simultaneamente em amplitude e frequência) na forma do produto do envelope (função de modulação em amplitude do sinal) e o cosseno da fase (função de modulação em frequência do sinal). Uma característica dessa teoria é a seleção de parâmetros de informação do sinal, cujo número aumenta após cada estágio subsequente de sua expansão em funções modulantes (expansão em vários estágios). Isso abre a possibilidade de influenciar os parâmetros de informação selecionados de diferentes níveis e alcançar o tipo de processamento de sinal desejado.

A aplicação da teoria da modulação com a implementação da decomposição multi-estágios possibilitará a realização de novas pesquisas no estudo das modulações naturais dos sinais de áudio com o objetivo de aprimorar os meios técnicos de radiocomunicação utilizando os sinais de voz como principal informação transmitida.

A revisão permitiu concluir sobre a relevância da perspectiva da utilização de funções moduladoras para processamento de sinais de áudio. São apresentadas as perspectivas de utilização da operação de divisão-multiplicação da frequência instantânea do sinal sem isolar as funções de modulação. Apresentados os pré-requisitos para sua utilização, são desenvolvidos métodos para pesquisar a possibilidade de utilização da operação de divisão instantânea de frequência para redução de ruído na transmissão de sinais comprimidos em frequência em duas versões: redução de ruído de frequência de rastreamento e filtragem dinâmica.

Revisores:

Smirnov N.V., Doutor em Ciências Físicas e Matemáticas, Professor Associado, Professor do Departamento de Modelagem de Sistemas Econômicos de Matemática Aplicada de Processos de Gestão, St. Petersburg State University, St. Petersburg;

Starichenkov A.L., Doutor em Ciências Técnicas, Professor Associado do Instituto de Problemas de Transporte em homenagem N.S. Solomenko da Academia Russa de Ciências, São Petersburgo.

Referência bibliográfica

Uvarov V.K., Redko A.Yu. ANÁLISE-SÍNTESE DE MODULAÇÃO DE SINAIS SONOROS E AS PERSPECTIVAS DA SUA UTILIZAÇÃO NA REDUÇÃO DE RUÍDO // Pesquisa fundamental. - 2015. - No. 6-3. - S. 518-522;
URL: http://fundamental-research.ru/ru/article/view?id\u003d38652 (data de acesso: 26.04.2019). Chamamos a sua atenção para as revistas publicadas pela "Academy of Natural Sciences"