Acelerador de rede neural baseado em FPGA supera as GPUs
Ele foi demonstrado como uma CNN de Inovação do GoogLeNet-v1, usando resolução inteira de oito bits. Alcançou 16,8 operações de terra por segundo (TOPS) e pode inferir mais de 5.300 imagens por segundo em um Xilinx Virtex UltraScale + XCVU9P-3 fpga. A abordagem modular e escalável faz com que seja adequado para aplicações de detecção de objetos e processamento de vídeo na borda e na nuvem, explicou Fawcett, bem como para inferências em data centers e câmeras inteligentes.
O DPU pode ser configurado para fornecer desempenho de computação ideal para topologias de rede neural em aplicativos de aprendizado de máquina, usando a arquitetura DSP paralela, memória distribuída e reconfigurabilidade de lógica e conectividade para diferentes algoritmos.
O DPU atinge um desempenho 50% superior ao de qualquer CNN concorrente e supera as GPUs para um determinado orçamento de energia ou custo, afirma a empresa. “O fpga é uma plataforma e arquitetura de sucesso mundial, que é muito flexível para o futuro e pode superar as GPUs em IA, com menor latência”, acrescentou Fawcett.
A empresa também anunciou que está patrocinando um DPhil (PhD0 na Universidade de Oxford para estudar técnicas de implementação de aceleração de aprendizagem profunda em fpgas. O trabalho será em colaboração com a própria pesquisa da Omnitek em mecanismos de computação e algoritmos de IA).
