Distúrbio útil: como a dinâmica não linear pode aumentar a série

Engenheiros do Instituto de Tecnologia de Tóquio (Tokyo Tech) demonstraram uma abordagem computacional simples para apoiar o desempenho de classificação de redes neurais operando em séries temporais de sensores. A técnica proposta envolve alimentar o sinal registrado como um forçamento externo em um sistema dinâmico não linear elementar e fornecer suas respostas temporais a essa perturbação para a rede neural juntamente com os dados originais.

No mundo ao nosso redor, uma proliferação de sensores está ocorrendo, prometendo apoiar a eficiência e a sustentabilidade de praticamente todos os aspectos da atividade humana. Um desafio que os engenheiros envolvidos na entrega da internet das coisas para a sociedade precisam enfrentar é como lidar com o fluxo de dados resultante de tais sensores. Especialmente, há uma necessidade de reduzir os dados tanto quanto possível na borda, perto dos próprios sensores, porque o streaming de todos os dados para a nuvem teria uma pegada técnica, econômica e ambiental inaceitável. Como resposta a isso, muitas pesquisas estão sendo conduzidas em todo o mundo para classificadores de pequeno porte e altamente eficientes, adequados para detectar comportamentos e situações particulares de interesse enquanto são executados em recursos computacionais limitados. Um exemplo de cenário de aplicação é o monitoramento em tempo real do comportamento do gado, com o objetivo de detectar mudanças sutis que são indicativas de doença prodrômica.

“Uma abordagem emergente para apoiar o desenvolvimento de classificadores de séries temporais adequados para inteligência artificial de ponta é o aumento de dados. Basicamente, trata-se de encontrar maneiras criativas e inovadoras de gerar dados adicionais para ajudar a obter o melhor desempenho de redes neurais que necessariamente têm que ser muito pequenos para atender aos requisitos de potência e tamanho. Embora a teoria dos classificadores esteja bem estabelecida, pode-se dizer que o aumento de dados ainda está quase em sua infância para séries temporais. Em nosso laboratório, por exemplo, temos trabalhado em uma variedade de técnicas baseadas em considerações empíricas, bem como em princípios matemáticos”, explica a Sra. Chao Li, estudante de doutorado na Unidade de Nano Sensing, onde o estudo foi conduzido, e co-autora principal do estudo.

Normalmente, o aumento de dados é realizado imediatamente antes ou durante o treinamento do classificador e é executado em estações de trabalho poderosas ou computadores em nuvem. O resultado é que a quantidade de dados disponíveis para treinar um classificador é estendida ao longo da dimensão do tempo, como seria o caso se registros mais longos tivessem sido disponibilizados. Isso é importante porque os dados de alta qualidade do tipo necessário para o treinamento do classificador são preciosos e caros de preparar. No entanto, esta não é a única forma de aumento de dados possível. “Tivemos a ideia de estender os dados ao longo da outra dimensão, ou seja, o número de séries temporais, ou seja, o número de dimensões de entrada. Normalmente, as aplicações de borda podem operar em uma ou no máximo algumas séries temporais de sensores. Uma possibilidade é realizar operações computacionais para gerar mais deles, que tentam tornar o máximo possível da informação inicial disponível para o classificador de uma forma adequada para que ele possa aprendê-la com eficiência. a computação disruptiva é simular um sistema dinâmico, dotado de sua própria atividade intrínseca, e tentar perturbá-lo forçando-o externamente com um sinal registrado do ambiente”, explica o Dr. Ludovico Minati, principal autor do estudo.

Partindo de um conceito previamente desenvolvido e patenteado na unidade de Biointerfaces para melhorar o desempenho dos sistemas de interface cérebro, os pesquisadores consideraram cuidadosamente muitos aspectos práticos de como realizá-lo. Com o objetivo de classificar os comportamentos básicos do gado usando um acelerômetro montado em um colar, eles desenvolveram maneiras de filtrar e pré-processar os sinais cinemáticos e injetá-los para que o sistema dinâmico simulado os aceitasse e respondesse sem divergir. Em seguida, eles exploraram como extrair a série temporal mais relevante de sua atividade, a fim de fornecê-la a um extrator de características predeterminado e perceptron multicamada ou a uma rede neural convolucional. “Muitos sistemas de baixa dimensão, como os sistemas Rössler e Lorenz, que foram estudados por décadas por físicos e engenheiros de controle, na verdade têm um potencial computacional incrível que permanece amplamente inexplorado. Este estudo dá um passo incomum para implantá-lo em uma aplicação concreta cenário”, explica o Prof. Mattia Frasca da Universidade de Catania (Itália), que forneceu várias contribuições teóricas aos pesquisadores da Tokyo Tech sobre os comportamentos desses tipos de sistemas e suas implementações como circuitos analógicos.

Ao aumentar os dados por meio de séries temporais adicionais derivadas dos sistemas dinâmicos, ou seja, um sistema Rössler separado por eixo do acelerômetro, os pesquisadores conseguiram aumentar o desempenho da classificação em uma quantidade apreciável. “Embora este seja realmente apenas um estudo inicial para propor uma ideia provocativa e um trabalho futuro substancial seja necessário, também conseguimos realizar o sistema dinâmico usando um circuito de hardware analógico muito simples e ainda observar uma melhoria graças à exploração de suas respostas”, acrescenta Dr. Ludovico Minati. “Nossa abordagem lembra a computação de reservatório, na qual recentemente realizamos pesquisas usando circuitos de transistores elementares conhecidos como osciladores de Minati-Frasca. No entanto, é realmente diferente, porque a dinâmica é de baixa dimensão e um único oscilador é usado em vez de uma rede . Nesse sentido, pode ser ainda mais adequado para implementação de baixo consumo de energia”, acrescenta Jim Bartels, também aluno de doutorado da unidade.

Após a entrevista, a equipe explicou que esse tipo de pesquisa exploratória precisará ser estendido e desenvolvido em outros conjuntos de dados e configurações para verificar sua aplicabilidade geral a casos concretos, embora esses resultados iniciais sejam promissores. “Um ponto importante é que essa abordagem pode ser implementada com recursos bastante limitados, seja digitalmente ou de maneira analógica. Nosso trabalho anterior, de fato, mostrou sistemas caóticos CMOS operando com uma potência tão baixa quanto 1 μW, o que pode ser adequado para à medida que as otimizações de tecnologias de processo e projetos convencionais se aproximam de seus limites, a exploração confiante de ideias radicalmente novas como esta parece necessária para a inovação contínua”, conclui o Dr. Hiroyuki Ito, chefe da unidade. A metodologia, resultados e considerações relacionadas são relatados em um artigo recente publicado na revista Caos, Sólitons e Fractaise todas as gravações experimentais foram disponibilizadas gratuitamente para outros usarem em trabalhos futuros.

Com informações de Science Daily.