Inteligência Artificial no Audacity

fevereiro 16, 2024

Inteligência Artificial no Audacity

A edição de áudio é uma das formas de uso profissional dos computadores que auxilia na produção e mixagem há vários anos.

O Audacity é um dos melhores editores gratuitos da atualidade, disponível para Windows, MacOS e Linux.

Audacity ® | Free Audio editor, recorder, music making and more! (audacityteam.org)

Permite a adição de novos recursos usando plugins e é graças a isso, que um desenvolvedor adaptou a biblioteca OpenVINO da Intel para alguns plugins muito interessantes.

GitHub - intel/openvino-plugins-ai-audacity

Disponível no GitHub, inclusive os códigos fonte para compilação.

Os plugins não tem um instalador, basta baixar, descompactar e copiar para as pastas do programa em sua versão de 64 bits: C:\Program Files\Audacity

Em seguida, é necessário executar o Audacity e habilitar o módulo no menu:

Edit -> Preferences -> Modules

Na lista de módulos, procurar o mod-openvino e mudar na caixa de seleção para habilitado.

Em seguida, fechar o Audacity e abrir novamente.

Conforme um tópico de ajuda que o autor deixou disponível no GitHub, vários utilizadores reclamaram de erro de DLL.

Fez vários testes com os utilizadores que tinham problema e por fim, disponibilizou arquivos com os módulos separados.

Descobriu que a maioria dos casos, se não todos, é com o módulo whisper.

Mas não lançou um pacote sem ele, então a solução de contorno existente é baixar o arquivo com os módulos em separado e copiar apenas o que vai usar.

A lista de recursos disponibilizada é bem interessante.

Separação de Música🎵 - Separe uma faixa mono ou estéreo em hastes individuais - Bateria, Baixo, Vocais, e Outros Instrumentos.

Music Style Remix💿 -- Usa a Difusão Estável para alterar uma faixa mono ou estéreo usando um prompt de texto.

Supressão de ruído -- Remove o ruído de fundo de uma amostra de🧹 áudio.

Geração de música -- Usa a difusão estável para gerar trechos de música🎶 a partir de um prompt de texto.

Whisper Transcription🎤 -- Usa whisper.cpp para gerar uma faixa de rótulo contendo a transcrição ou tradução para uma determinada seleção de áudio falado ou vocais.

Nos testes rápidos que fiz, gostei bastante da separação de música e supressão de ruído.

Os de geração de música e remix não tem resultados que possam ser utilizados.

E o modulo de transcrição de áudio para texto não conseguiu entender bem as falas em português que tentei, muito provavelmente por minha dicção.

Pesquisar este blog

Link@Tech

Inteligência Artificial no Audacity

Comentários

Postar um comentário

Postagens mais visitadas

Servidor de arquivos conteinirizado no Proxmox VE

Nobreak Ragtech