Costumava ser o caso de que se você quisesse tirar vantagem de um assistente de voz, você teria que confiar em um serviço remoto, baseado em nuvem, com acesso a microfones sempre ouvindo posicionados em toda a sua casa. Isso é um grande pedido, especialmente considerando o fluxo constante de violações de segurança sobre as quais lemos nas notícias. Mas, graças aos avanços tecnológicos dos últimos anos, os assistentes de voz não exigem mais o apoio de grandes information facilities. Podemos até mesmo executar assistentes de voz muito capazes em nossas próprias casas — sem necessidade de conexão com a web.
Há bastante espaço para respirar neste caso! (📷: Tristam)
Não só a tecnologia está disponível, mas também se tornou muito simples e barato construir um assistente de voz native. Um dos sistemas mais simples que você vai encontrar em qualquer lugar foi recentemente construído e descrito por Tristam. Ele consiste em um alto-falante inteligente alimentado por placa de desenvolvimento ESP32-S3 com um agente de conversação native rodando no native, com integração com o House Assistant, que responde às solicitações do usuário.
O assistente de voz contém uma placa de desenvolvimento ESP32-S3-DevKitC-1-N8R2, um microfone, um amplificador e um alto-falante. Esses componentes são instalados em uma caixa impressa em 3D bem projetada para que fiquem bonitos em uma mesa ou criado-mudo em sua casa. As placas foram atualizadas com ESPHome para torná-las facilmente acessíveis a uma rede de automação do House Assistant, e elas funcionam microWakeWord. Esta é uma estrutura de treinamento de detecção de palavra de ativação baseada em TensorFlow que permite que pequenas plataformas de {hardware} reconheçam palavras de ativação como “Alexa” ou “Hey, Google”.
Uma vez que a palavra de ativação é detectada, o dispositivo captura a voz do falante e a transmite para um agente de conversação em execução em uma máquina native sob o controle do House Assistant. Este pode ser um agente de conversação nativo do House Assistant ou um baseado em LLM. E como ele é integrado ao House Assistant, ele pode controlar todos os seus outros dispositivos inteligentes, como luzes e tocadores de mídia.
Se a ideia de enviar suas conversas privadas para a nuvem o afastou do uso de assistentes de voz ou tecnologias de automação residencial, não deixe de conferir o Tristam’s redação do projeto. É uma maneira muito simples, segura e completamente personalizável de acessar esta área.