Inteligência Artificial no Audacity

     A edição de áudio é uma das formas de uso profissional dos computadores que auxilia na produção e mixagem há vários anos.

    O Audacity é um dos melhores editores gratuitos da atualidade, disponível para Windows, MacOS e Linux.

Audacity ® | Free Audio editor, recorder, music making and more! (audacityteam.org)

    Permite a adição de novos recursos usando plugins e é graças a isso, que um desenvolvedor adaptou a biblioteca OpenVINO da Intel para alguns plugins muito interessantes.

GitHub - intel/openvino-plugins-ai-audacity

    Disponível no GitHub, inclusive os códigos fonte para compilação.

    Os plugins não tem um instalador, basta baixar, descompactar e copiar para as pastas do programa em sua versão de 64 bits: C:\Program Files\Audacity

    Em seguida, é necessário executar o Audacity e habilitar o módulo no menu:

    Edit -> Preferences -> Modules

    Na lista de módulos, procurar o mod-openvino e mudar na caixa de seleção para habilitado.

    Em seguida, fechar o Audacity e abrir novamente.

    Conforme um tópico de ajuda que o autor deixou disponível no GitHub, vários utilizadores reclamaram de erro de DLL.

    Fez vários testes com os utilizadores que tinham problema e por fim, disponibilizou arquivos com os módulos separados.

    Descobriu que a maioria dos casos, se não todos, é com o módulo whisper.

    Mas não lançou um pacote sem ele, então a solução de contorno existente é baixar o arquivo com os módulos em separado e copiar apenas o que vai usar.

    A lista de recursos disponibilizada é bem interessante.

Separação de Música🎵 - Separe uma faixa mono ou estéreo em hastes individuais - Bateria, Baixo, Vocais, e Outros Instrumentos.

Music Style Remix💿 -- Usa a Difusão Estável para alterar uma faixa mono ou estéreo usando um prompt de texto.

Supressão de ruído -- Remove o ruído de fundo de uma amostra de🧹 áudio.

Geração de música -- Usa a difusão estável para gerar trechos de música🎶 a partir de um prompt de texto.

Whisper Transcription🎤 -- Usa whisper.cpp para gerar uma faixa de rótulo contendo a transcrição ou tradução para uma determinada seleção de áudio falado ou vocais.

    Nos testes rápidos que fiz, gostei bastante da separação de música e supressão de ruído.

    Os de geração de música e remix não tem resultados que possam ser utilizados.

    E o modulo de transcrição de áudio para texto não conseguiu entender bem as falas em português que tentei, muito provavelmente por minha dicção.



Comentários

Postagens mais visitadas