Inteligência Artificial no Audacity
A edição de áudio é uma das formas de uso profissional dos computadores que auxilia na produção e mixagem há vários anos.
O Audacity é um dos melhores editores gratuitos da atualidade, disponível para Windows, MacOS e Linux.
Audacity ® | Free Audio editor, recorder, music making and more! (audacityteam.org)
Permite a adição de novos recursos usando plugins e é graças a isso, que um desenvolvedor adaptou a biblioteca OpenVINO da Intel para alguns plugins muito interessantes.
GitHub - intel/openvino-plugins-ai-audacity
Disponível no GitHub, inclusive os códigos fonte para compilação.
Os plugins não tem um instalador, basta baixar, descompactar e copiar para as pastas do programa em sua versão de 64 bits: C:\Program Files\Audacity
Em seguida, é necessário executar o Audacity e habilitar o módulo no menu:
Edit -> Preferences -> Modules
Na lista de módulos, procurar o mod-openvino e mudar na caixa de seleção para habilitado.
Em seguida, fechar o Audacity e abrir novamente.
Conforme um tópico de ajuda que o autor deixou disponível no GitHub, vários utilizadores reclamaram de erro de DLL.
Fez vários testes com os utilizadores que tinham problema e por fim, disponibilizou arquivos com os módulos separados.
Descobriu que a maioria dos casos, se não todos, é com o módulo whisper.
Mas não lançou um pacote sem ele, então a solução de contorno existente é baixar o arquivo com os módulos em separado e copiar apenas o que vai usar.
A lista de recursos disponibilizada é bem interessante.
Separação de Música🎵 - Separe uma faixa mono ou estéreo em hastes individuais - Bateria, Baixo, Vocais, e Outros Instrumentos.
Music Style Remix💿 -- Usa a Difusão Estável para alterar uma faixa mono ou estéreo usando um prompt de texto.
Supressão de ruído -- Remove o ruído de fundo de uma amostra de🧹 áudio.
Geração de música -- Usa a difusão estável para gerar trechos de música🎶 a partir de um prompt de texto.
Whisper Transcription🎤 -- Usa whisper.cpp para gerar uma faixa de rótulo contendo a transcrição ou tradução para uma determinada seleção de áudio falado ou vocais.
Nos testes rápidos que fiz, gostei bastante da separação de música e supressão de ruído.
Os de geração de música e remix não tem resultados que possam ser utilizados.
E o modulo de transcrição de áudio para texto não conseguiu entender bem as falas em português que tentei, muito provavelmente por minha dicção.
Comentários
Postar um comentário