Contribuindo para a utilização de big data! Desenvolvendo novos métodos de aprendizado de dados para inteligência artificial: Propôs um método para aprendizado contínuo de dados e seus rótulos em problemas de classificação multirrótulo

Os avanços na tecnologia IoT nos possibilitaram a obtenção fácil e contínua de grandes quantidades de dados diversos. A tecnologia de inteligência artificial está ganhando atenção como uma ferramenta para colocar esse big data em uso.

O aprendizado de máquina convencional lida principalmente com problemas de classificação de rótulo único, nos quais os dados e os fenômenos ou objetos correspondentes (informações de rótulo) estão em um relacionamento um-para-um. No entanto, no mundo real, as informações de dados e rótulos raramente têm uma relação um-para-um. Nos últimos anos, portanto, a atenção se concentrou no problema de classificação multi-rótulo, que lida com dados que possuem uma relação um-para-muitos entre os dados e as informações do rótulo. Por exemplo, uma única foto de paisagem pode incluir vários rótulos para elementos como céu, montanhas e nuvens. Além disso, para aprender de forma eficiente com o big data obtido continuamente, também é necessária a capacidade de aprender ao longo do tempo sem destruir coisas que foram aprendidas anteriormente.

Um grupo de pesquisa liderado pelo professor associado Naoki Masuyama e pelo professor Yusuke Nojima, da Escola de Informática da Universidade Metropolitana de Osaka, desenvolveu um novo método que combina o desempenho de classificação de dados com vários rótulos, com a capacidade de aprender continuamente com os dados. Experimentos numéricos em conjuntos de dados multi-rótulo do mundo real mostraram que o método proposto supera os métodos convencionais.

A simplicidade deste novo algoritmo facilita a criação de uma versão evoluída que pode ser integrada a outros algoritmos. Como o método de agrupamento subjacente agrupa dados com base na semelhança entre as entradas de dados, espera-se que seja uma ferramenta útil para o pré-processamento contínuo de big data. Além disso, as informações do rótulo atribuídas a cada cluster são aprendidas continuamente, usando um método baseado na abordagem bayesiana. Aprendendo os dados e aprendendo as informações do rótulo correspondentes aos dados separadamente e continuamente, de modo que tanto o alto desempenho de classificação quanto a capacidade de aprendizado contínuo sejam alcançados.

“Acreditamos que nosso método é capaz de aprender continuamente a partir de dados multirótulos e possui os recursos necessários para a inteligência artificial em uma futura sociedade de big data”, concluiu o professor Masuyama.

Com informações de Science Daily.