O aprendizado profundo é a maneira de uma máquina inteligente aprender coisas.
É um método de aprendizagem para máquinas, inspirado na estrutura do cérebro humano e na forma como aprendemos.
É uma tecnologia crítica que torna os veículos autônomos uma realidade e também é a razão pela qual o assistente de voz do seu smartphone fica melhor em ajudá-lo com o tempo. Em outras palavras, o aprendizado profundo é nossa melhor chance de criar máquinas com inteligência semelhante à humana.
O que é aprendizagem profunda?
O aprendizado profundo (DL) é um subcampo do aprendizado de máquina que imita o funcionamento do cérebro humano no processamento de dados. O DL permite que as máquinas aprendam sem supervisão humana e concede a elas a capacidade de reconhecer fala, traduzir idiomas, detectar objetos e até mesmo tomar decisões baseadas em dados.
Em outras palavras, o aprendizado profundo é um tipo de aprendizado de máquina (ML) inspirado na estrutura do cérebro humano. Com efeito, o DL é uma imitação dos neurônios do cérebro humano e tenta imitar suas funções.
Embora o aprendizado profundo seja um ramo do aprendizado de máquina, os sistemas DL não são limitados por uma capacidade finita de aprender como os algoritmos ML tradicionais. Em vez disso, os sistemas DL podem aprender e melhorar seu desempenho com acesso a volumes maiores de dados.
O aprendizado profundo permite que os sistemas de inteligência artificial imitem a maneira pela qual os humanos adquirem certos tipos de conhecimento. Os algoritmos DL tentam tirar conclusões – semelhante à forma como os humanos o fazem – analisando continuamente os dados. Para conseguir isso, o DL usa redes neurais artificiais (ANNs) .
O DL imita o funcionamento do cérebro humano, principalmente as funções como processamento de dados e criação de padrões para a tomada de decisões. É interessante notar que cientistas e pesquisadores de IA começaram a construir ANNs para que as máquinas pudessem eventualmente exibir as características da inteligência humana, como habilidades de resolução de problemas, autoconsciência, percepção, criatividade e empatia, para citar alguns.
O aprendizado profundo não teria sido possível sem os computadores ficando mais baratos, rápidos e menores. O mesmo vale para dispositivos de armazenamento, pois grandes quantidades de dados precisam ser armazenadas e processadas para que o aprendizado profundo se torne uma realidade. É por isso que, embora o aprendizado profundo tenha sido teorizado na década de 1980, tornou-se viável apenas recentemente.
2.5
quintilhões de bytes de dados são gerados por humanos todos os dias.
O processamento de volumes tão enormes de dados não estruturados é praticamente impossível para os humanos. Mesmo que consigamos adquirir a mão de obra necessária, pode levar anos para analisar e extrair informações relevantes desses grandes conjuntos de dados. No entanto, com o aprendizado profundo, esse processo é incrivelmente simplificado.
Com a ajuda do aprendizado profundo, um sistema de IA pode aprender e melhorar sem qualquer supervisão humana. O DL também permite que as máquinas aprendam com dados não rotulados ou não estruturados, ou ambos. No entanto, observe que o processo de aprendizagem pode ser não supervisionado, semi-supervisionado ou supervisionado .
O aprendizado profundo também é uma parte crítica da ciência de dados. É benéfico para os cientistas de dados coletar, analisar e interpretar grandes volumes de dados e tornar processos como modelagem preditiva mais rápidos e eficientes.
Ramos da inteligência artificial, como visão computacional e processamento de linguagem natural, são praticáveis devido ao aprendizado profundo. Antes de entrarmos mais nisso, vamos ver como o aprendizado profundo funciona para nos ajudar.
Como funciona o aprendizado profundo?
Em termos mais simples, o processo de aprendizado do DL ocorre modificando as ações do sistema com base em um loop de feedback contínuo. O sistema de aprendizado é recompensado por cada ação correta e punido pelas ações erradas. O sistema tenta ajustar suas ações para maximizar a recompensa.
O aprendizado profundo usa modelos de aprendizado supervisionados , semi-supervisionados e não supervisionados para treinar.
Os neurônios que formam as redes neurais podem ser classificados em três categorias com base em sua hierarquia: camadas de entrada, ocultas e de saída.
- A camada de entrada , que é a primeira camada de neurônios, recebe os dados de entrada e os passa para a primeira camada oculta.
- As camadas ocultas realizam cálculos específicos, como reconhecimento de imagem, nos dados recebidos.
- Depois que os cálculos são concluídos, a camada de saída gera a saída necessária.
Como mencionado anteriormente, o aprendizado profundo é possibilitado por redes neurais artificiais. Eles são construídos inspirando-se nas redes neurais do cérebro humano. Um grande número de perceptrons – a contraparte artificial dos neurônios – são empilhados juntos para formar ANNs.
O termo “profundo” é usado para especificar o número de camadas ocultas que as redes neurais possuem. Enquanto as redes neurais tradicionais contêm de duas a três camadas ocultas, as redes profundas podem ter até 150 camadas.
Uma maneira fácil de entender como o aprendizado profundo funciona é observando as redes neurais convolucionais (CNNs). É um dos tipos mais populares de redes neurais profundas, exceto redes neurais recorrentes (RNNs), redes adversárias generativas (GANs) e redes neurais feedforward.
A CNN extrai recursos diretamente das imagens, eliminando a necessidade de extração manual de recursos. Nenhum dos recursos é pré-treinado; em vez disso, eles são aprendidos pela rede quando ela treina no conjunto de imagens fornecido. Essa característica de extração automatizada de recursos torna os modelos de aprendizado profundo altamente eficazes para classificação de objetos e outros aplicativos de visão computacional.
A razão pela qual as redes neurais profundas são altamente precisas na identificação de recursos e na classificação de imagens se deve às centenas de camadas que elas contêm. Cada camada aprenderia a identificar recursos específicos e, à medida que o número de camadas aumentasse, a complexidade dos recursos de imagem aprendidos aumentaria.
Aprendizado profundo x aprendizado de máquina
O aprendizado de máquina é uma aplicação de IA que permite que as máquinas aprendam e avancem automaticamente a partir da experiência, sem serem explicitamente programadas para isso.
O algoritmo de filtragem de spam presente em sua conta de e-mail é um excelente exemplo de algoritmo de aprendizado de máquina. Os algoritmos de ML também são usados em plataformas OTT, como a Netflix, para recomendar filmes e séries que você provavelmente assistirá e apreciará.
Os algoritmos de ML são capazes de analisar dados, identificar padrões e fazer previsões. Eles aprendem e se adaptam à medida que novos conjuntos de dados são apresentados a eles. De certa forma, o aprendizado de máquina torna os computadores mais humanos , pois concede a capacidade de aprender e progredir.
Como mencionado anteriormente, o aprendizado profundo é um subconjunto do aprendizado de máquina, que por sua vez é um subconjunto da inteligência artificial. Mais especificamente, o aprendizado profundo é, na verdade, aprendizado de máquina e pode ser considerado uma versão evoluída do último. Muitas vezes, muitos usam DL e ML de forma intercambiável, pois funcionam de maneira quase semelhante.
No entanto, suas capacidades são diferentes. Embora os algoritmos de ML possam aprender e melhorar gradualmente, eles ainda precisam de alguma forma de orientação. Por exemplo, se o algoritmo fizer uma previsão incorreta, a intervenção humana é essencial para fazer os ajustes. Pelo contrário, os algoritmos de aprendizado profundo podem determinar se suas previsões são precisas ou não com a ajuda de redes neurais artificiais.
o AlphaGo O programa desenvolvido pela DeepMind usa extensivamente o aprendizado profundo. É o primeiro programa de computador a vencer um jogador profissional de Go humano. O AlphaGo foi sucedido por várias versões avançadas, incluindo o MuZero, que pode dominar um jogo sem aprender as regras.
É interessante notar que os pesquisadores tentaram usar técnicas tradicionais de aprendizado de máquina para treinar robôs para dominar o jogo por muitos anos. Mas eles tiveram sucesso apenas quando combinaram aprendizado profundo com aprendizado por reforço e outros paradigmas.
Outra maneira de diferenciar entre aprendizado de máquina e aprendizado profundo é observando como eles aprendem. Suponha que você tenha que ensinar uma máquina a categorizar as imagens de cães e gatos. Se você estiver usando o modelo de aprendizado de máquina, terá que fornecer dados estruturados – neste caso, as imagens rotuladas de cães e gatos – para que o algoritmo aprenda os recursos específicos que diferenciam as imagens de ambos os animais. O algoritmo fica melhor com cada imagem rotulada exposta a ele.
Aprendizado de máquina | Aprendizado profundo | |
Supervisão humana | Obrigatório | Não requerido |
dados rotulados | Obrigatório | Não requerido |
Tempo de treino | Segundos ou algumas horas | Horas ou algumas semanas |
Número de pontos de dados necessários | Milhares | milhões |
Recursos computacionais | Menos recursos necessários | Recursos maciços necessários |
GPU | Não requerido | Obrigatório |
Se você estiver usando o modelo de aprendizado profundo, não precisará necessariamente fornecer dados estruturados ou imagens rotuladas nesse caso. As redes neurais artificiais podem ajudar os algoritmos a entender características distintas de cada animal.
Depois que as imagens forem processadas por diferentes camadas das redes neurais profundas, o sistema terá acesso a identificadores específicos, que ajudarão na classificação dos animais e de suas imagens. A saída diferente processada por cada camada da rede neural é combinada para categorizar as imagens de forma eficaz.
A presença de redes neurais também significa que os algoritmos de aprendizagem profunda requerem grandes conjuntos de dados. Isso ocorre porque os algoritmos DL podem aprender apenas quando expostos a um milhão ou mais de pontos de dados. Por outro lado, os algoritmos de ML podem aprender e melhorar com diretrizes predefinidas.
Outra diferença notável entre aprendizado de máquina e aprendizado profundo é o tipo de hardware necessário para ambos. Como a complexidade dos cálculos e a quantidade de dados processados são significativamente menores para o aprendizado de máquina, os programas de ML podem ser executados em computadores de baixo custo sem exigir muito poder computacional.
Por outro lado, os sistemas de aprendizado profundo exigem recursos computacionais maciços e componentes de hardware poderosos, como unidades de processamento gráfico (GPUs). O cientista da computação Andrew Ng determinou que as GPUs poderiam aumentar a velocidade dos sistemas de aprendizado profundo em mais de 100 vezes.
Com a ajuda de GPUs, o tempo necessário para treinar modelos de aprendizado profundo pode ser reduzido de dias para apenas algumas horas. A maioria das estruturas de aprendizado profundo, como PyTorch e TensorFlow, já são aceleradas por GPU.
Empresas como a Nvidia levaram mais a sério o aprendizado profundo acelerado por GPU e estão aprimorando seus produtos de acordo. Além disso, as GPUs são úteis para cálculos de matrizes ou vetores.
O tempo necessário para treinar algoritmos de aprendizado profundo e aprendizado de máquina também é significativamente diferente. Como você deve ter adivinhado, os algoritmos de aprendizado profundo levam muito tempo para serem treinados devido à enorme quantidade de dados e cálculos complexos envolvidos. Pode levar algumas horas ou até semanas para treinar um sistema DL, enquanto um sistema ML pode ser treinado em alguns segundos ou horas.
Novamente, escolher entre aprendizado profundo e aprendizado de máquina deve ser uma decisão altamente informada. A decisão deve ser tomada levando em consideração o volume e a natureza dos dados, a complexidade do problema que se está tentando resolver e os recursos computacionais disponíveis.
Aplicativos de aprendizado profundo
Embora o aprendizado profundo seja considerado um campo em desenvolvimento, pesquisadores e organizações já estão se beneficiando de suas aplicações. Aqui estão alguns exemplos de aprendizado profundo que estão moldando o mundo ao nosso redor e, muito provavelmente, você pode ter encontrado alguns deles em sua vida diária.
carros autônomos
Os veículos autônomos são os benfeitores mais famosos do aprendizado profundo. Milhões de conjuntos de dados que replicam vários cenários da vida real são inseridos no sistema, que é usado para ensinar o veículo a navegar na estrada com segurança.
Com a ajuda de modelos de aprendizado profundo, os fabricantes podem garantir que os carros sem motorista possam lidar com cenários sem precedentes sem causar danos aos motoristas ou pedestres.
Além de ajudar as máquinas a resolver cenários hipotéticos, o aprendizado profundo também as ajuda a analisar e processar os dados brutos coletados de câmeras, GPS e vários sensores. Isso permite que os veículos autônomos identifiquem e distingam entre faixas e divisores de estradas, barricadas, sinais, pedestres, carros lentos ou parados e muito mais.
Processamento de linguagem natural
O processamento de linguagem natural (NLP) é um campo da inteligência artificial que concede às máquinas a capacidade de entender, interpretar e derivar significado das linguagens humanas. Simplificando, a PNL possibilita que máquinas conversem com humanos e até mesmo entendam as nuances contextuais de um idioma.
Assistentes inteligentes como Siri e Google Assistant e aplicativos de tradução de idiomas como o Google Tradutor são exemplos do mundo real de PNL. A PNL pode ser dividida em geração de linguagem natural (NLG) e compreensão de linguagem natural (NLU).
Dica: confira alguns dos melhores softwares de processamento de linguagem natural do setor.
À primeira vista, o reconhecimento de fala pode parecer apenas uma questão de converter o som nas respectivas palavras. É bastante simples para os humanos, pois o córtex auditivo do nosso cérebro foi treinado durante anos para reconhecer e compreender uma língua falada ou mais.
Um exemplo simples para representar a complexidade da compreensão dos sons é “reconhecer a fala” e “destruir uma bela praia”. Ambos soam muito semelhantes, embora seus significados sejam totalmente diferentes. Embora as máquinas possam detectar palavras em uma frase, entender seu significado contextual ainda é uma tarefa hercúlea. É aí que entra o DL para a PNL.
Quase todos os assistentes inteligentes dependem de aprendizado profundo, e seus níveis de compreensão e precisão aumentam a cada tarefa. O Google Assistant, que depende quase inteiramente do DL, tem a maior precisão.
O aprendizado profundo também permite que as máquinas entendam as complexidades de um idioma, como nuances tonais, expressões e até sarcasmo. Compreender as complexidades de um idioma também é fundamental para a análise de sentimentos em dados textuais. Só então as empresas podem monitorar a reputação da marca e do produto, entender a opinião pública e analisar as experiências dos clientes.
Outra aplicação do aprendizado profundo é o resumo de documentos . Resumo de documento ou simplesmente resumo de texto é a tarefa de extrair informações cruciais de uma grande passagem de texto e criar uma sinopse concisa dela. Além de economizar tempo para os humanos, o resumo de documentos também pode ajudar programas de computador que precisam processar grandes quantidades de dados em um curto período de tempo.
O reconhecimento de alto-falante é outra aplicação útil do aprendizado profundo e está se tornando cada vez mais preciso. Os governos podem usar essa tecnologia para identificar terroristas fazendo chamadas telefônicas anônimas comparando suas amostras de voz com um banco de dados contendo vozes reconhecidas.
Reconhecimento de imagem
Antes do aprendizado profundo, o campo de reconhecimento de imagem dependia fortemente do ajuste manual. Isso significa que muitos processos tiveram que ser executados por humanos e levaram muito tempo. O aprendizado profundo elimina a necessidade de processamento de imagem manual ou tradicional e acelera significativamente todo o processo.
Nesta década, a maioria dos sistemas precisos de detecção de objetos que você encontra depende exclusivamente do aprendizado profundo. O Google Fotos é um excelente exemplo. Ele usa aprendizado profundo para classificar e agrupar imagens.
Mesmo que você não tenha feito nenhuma rotulagem manual, pode pesquisar em seu álbum do Google Fotos algo como “insetos em flores” e obter resultados, desde que tenha imagens relacionadas armazenadas. Você pode até pesquisar animais com base em suas espécies ou raças e ainda obter todas as fotos que contêm o animal em particular.
Embora os sistemas tradicionais de aprendizado não profundo tenham dificuldade em identificar os objetos de uma imagem, o aprendizado profundo avança várias etapas. Ele faz um trabalho impressionante ao reconhecer rostos humanos, animais, lugares e coisas com alta precisão e quase nenhum erro.
Manufatura
Com a introdução da Internet das Coisas (IoT), as fábricas estão ficando mais inteligentes do que nunca. A automação não é novidade para a indústria de manufatura, e o aprendizado profundo simplifica as coisas.
Com a ajuda de arquiteturas de aprendizado profundo como a CNN, as empresas podem substituir a maioria dos operadores humanos que, de outra forma, eram essenciais para detectar produtos defeituosos na linha de montagem.
Dessa forma, detectar problemas de qualidade torna-se mais preciso e econômico, e as chances de erro humano são eliminadas. Esses sistemas também são altamente escaláveis e podem ser treinados para detectar problemas de qualidade em qualquer ponto da linha de produção.
Outra aplicação de deep learning na manufatura é a manutenção preditiva. Ao coletar e analisar os dados de saúde das máquinas durante um período de tempo, os algoritmos de aprendizado profundo podem prever as chances de quebra de um ativo de fabricação.
Determinar quando consertar um equipamento é crítico do ponto de vista financeiro de uma empresa, pois uma máquina com defeito pode interromper toda a produção. Como a manutenção irregular também pode causar danos dispendiosos e irreparáveis às máquinas e acidentes catastróficos na fábrica no pior dos casos, as empresas podem economizar muito com a manutenção preditiva. Saber quando consertar também ajudará as empresas a planejar com antecedência e buscar alternativas para reduzir o tempo de inatividade da fábrica.
Otimização de entrada de fábricaé outra aplicação benéfica do aprendizado profundo. Com os consumidores cada vez mais preocupados com a pegada de carbono dos produtos e as reformas ecológicas feitas por seus criadores, as empresas não têm escolha a não ser otimizar o uso de recursos físicos.
Além disso, a otimização de recursos ajudará as empresas a lucrar mais com cada produto e, portanto, otimizar os insumos da fábrica. Ao rastrear o uso de recursos (consumo de eletricidade e água, principalmente) de diferentes maquinários e processos de produção, os sistemas de aprendizado profundo podem sugerir dinamicamente as melhores práticas de otimização.
Descoberta de drogas
A descoberta de medicamentos é incrivelmente demorada e cara. O aprendizado profundo pode tornar esse processo mais barato e rápido. O aprendizado profundo pode ajudar a prever a afinidade de ligação de drogas com proteínas específicas e até mesmo os efeitos tóxicos de compostos específicos.
AtomNet é uma rede neural convolucional profunda usada para o design racional de medicamentos. É uma tecnologia de ponta capaz de encontrar compostos de drogas novos e não óbvios e pode ser uma ferramenta notável para projetos acelerados de reaproveitamento de drogas. O AtomNet também foi usado para prever novas biomoléculas candidatas ao Ebola e à esclerose múltipla (EM).
Hospitalidade
A hospitalidade é uma indústria multibilionária sempre ansiosa para adotar novas tecnologias, e a tecnologia de aprendizado profundo não é exceção. Com o DL, as organizações podem encontrar novos meios para aprimorar a experiência e a satisfação do cliente e até mesmo identificar processos dispendiosos e substituíveis.
O aprendizado profundo pode ajudar as organizações a planejar com antecedência, prevendo as demandas sazonais. Um sistema de aprendizado profundo pode facilmente encontrar a correlação entre fatores que causam demandas sazonais e prever tendências futuras analisando dados anteriores.
Ao analisar os dados do cliente, os modelos DL também podem ajudar as empresas a criar estratégias de clientes para obter melhores taxas de retenção e satisfação. As empresas também podem usar várias técnicas de aprendizado de máquina para preços competitivos, considerando vários fatores, como sazonalidade, eventos em tempo real, promoções de terceiros, eventos locais e dados de reservas anteriores.
Finança
Como o processamento de big data complexo é uma especialidade do aprendizado profundo, ele tem um imenso potencial no setor financeiro. Ao analisar dados históricos, vários parâmetros de mercado e fatores externos que podem afetar o desempenho de uma empresa, os algoritmos de aprendizagem profunda podem prever os valores das ações com uma precisão impressionante.
Como os algoritmos DL podem analisar grandes volumes de dados de várias fontes simultaneamente, é incrivelmente mais rápido que os humanos e, portanto, é usado para criar estratégias de negociação lucrativas.
Redes neurais profundas também são usadas no processo de aprovação de empréstimos. Ao analisar dados históricos sobre aprovações e rejeições, os bancos podem avaliar corretamente os riscos de aprovar um empréstimo para uma entidade.
restauração de imagem
A restauração de imagens é outro feito impressionante que o aprendizado profundo pode realizar. A restauração de imagem geralmente se refere à recuperação de uma imagem clara não degradada de uma imagem degradada. A degradação pode ocorrer devido a uma série de fatores, sendo o ruído da imagem um deles.
Se o ruído da imagem for o culpado, o processo de restauração é chamado de remoção de ruído da imagem. Da mesma forma, as imagens podem ser de resolução mais baixa e, pelo processo de super-resolução, podem ser criadas imagens de resolução mais alta.
Com o aprendizado profundo, esses processos de restauração se tornam mais precisos e consomem menos tempo. Métodos de aprendizado como Deep Image Prior são utilizados para o processo de restauração. Em termos simples, o Deep Image Prior é uma rede neural convolucional usada para aprimorar uma imagem sem nenhum dado de treinamento anterior além da própria imagem.
Em 2017, os pesquisadores da equipe do Google Brain treinaram uma rede neural profunda para analisar imagens de rostos de resolução muito baixa e prever os rostos. Este método é chamado de Super Resolução Recursiva de Pixel e pode melhorar significativamente a resolução das imagens. A rede neural pode identificar as características distintivas de uma pessoa com facilidade.
O aprendizado profundo também é amplamente usado para colorir fotos em preto e branco. Você pode conferir ferramentas online como Algorithmia para ver como imagens específicas em preto e branco ficariam se fossem tiradas com uma câmera colorida.
Publicidade móvel
O aprendizado profundo permite que os anunciantes móveis publiquem anúncios que podem capturar a atenção de seu público-alvo e oferecer um maior retorno sobre o investimento (ROI). Técnicas de aprendizado profundo, como publicidade preditiva baseada em dados, também são usadas para aumentar a relevância dos anúncios.
Várias redes de anúncios móveis de lances em tempo real usam APIs de aprendizado profundo, que ajudam os anunciantes a maximizar a taxa de cliques (CTR). Os tempos de resposta mais rápidos dos sistemas de aprendizado profundo também permitem que os anunciantes veiculem os anúncios certos no momento e no espaço certos.
Detectar atrasos no desenvolvimento
O diagnóstico precoce e o tratamento de distúrbios do desenvolvimento, autismo ou distúrbios da fala podem impactar positivamente o futuro de uma criança. Um ser humano não notaria vários sinais em estágio inicial, mas um sistema de aprendizado profundo realmente pode.
Usando aprendizado profundo, pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT e do Instituto de Profissões de Saúde do Hospital Geral de Massachusetts criaram um sistema de computador que pode identificar distúrbios da fala antes mesmo de a criança entrar no jardim de infância.
Além disso, as crianças que estão no espectro do autismo lutam para reconhecer os estados emocionais das pessoas ao seu redor. Por exemplo, crianças com autismo terão dificuldade em diferenciar entre um rosto feliz e um rosto medroso.
Como solução para esse problema, alguns médicos usam robôs adequados para crianças com aprendizado profundo para envolver as crianças na imitação de emoções e na resposta a elas de maneira apropriada. À medida que o robô interage, ele analisa o interesse e o envolvimento da criança observando suas respostas.
O aprendizado profundo permite que o robô extraia as informações mais cruciais dos dados coletados sem precisar de assistência humana. Com a ajuda do DL, os pesquisadores descobriram inúmeros fatos fascinantes, como as diferenças culturais entre crianças de diferentes países.
Eles observaram que durante os episódios de alto engajamento, as crianças do Japão mostraram mais movimentos corporais. Por outro lado, grandes movimentos corporais foram associados a episódios de desengajamento para crianças da Sérvia.
Uma das maiores razões pelas quais esse tipo de tratamento é eficaz é que o robô está preparado para atrair a atenção das crianças. Além disso, os humanos tendem a mudar suas expressões com frequência e expressar a mesma emoção de maneiras diferentes. Mas o robô sempre faz da mesma maneira para que o processo de aprendizagem seja muito menos frustrante para a criança.
previsão de som
A produção de som é parte integrante do cinema. Embora certos sons como passos, batidas na porta ou pneus cantando possam ser emprestados de áudios de estoque, muitas vezes eles precisam ser recriados para aprimorar a experiência cinematográfica.
Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT criaram um algoritmo de aprendizado profundo que prevê som . Quando recebe um videoclipe silencioso de um objeto sendo atingido, o algoritmo pode produzir sons realistas. O som previsto é realista o suficiente para enganar os humanos.
Para treinar o algoritmo, os pesquisadores filmaram cerca de 1.000 vídeos de quase 46.000 sons que constituem diferentes objetos sendo atingidos, cutucados e raspados com uma baqueta. Eles usaram uma baqueta especificamente porque oferecia um método consistente para produzir um som.
Os sistemas de previsão de som não apenas tornarão as coisas melhores para a indústria cinematográfica, mas também poderão ajudar máquinas inteligentes a navegar pelo mundo e a entender as propriedades dos objetos.
tradução visual
Você já tentou traduzir idiomas estrangeiros com o aplicativo Google Tradutor? O aplicativo não apenas “traduz” as palavras, mas também sobrepõe a imagem com a tradução. O aplicativo faz isso com a ajuda de redes neurais profundas e é uma das muitas maneiras pelas quais o Google espreme o aprendizado profundo em um smartphone.
Depois que o aplicativo descobre onde as letras estão localizadas na imagem analisando seus pixels, uma rede neural convolucional treinada em letras e não-letras tenta reconhecer o que é cada letra. Depois que as letras são identificadas, o aplicativo procura em um dicionário para obter as traduções.
A tradução é então renderizada sobre as letras originais no mesmo estilo da imagem original. Essas traduções visuais são super rápidas se realizadas nos data centers do Google. Mas como a maioria dos usuários possui um smartphone de baixo custo e tem conexões de internet instáveis, o Google desenvolveu uma pequena rede neural com inúmeras limitações.
Sistemas de recomendação
Algoritmos de aprendizado profundo são usados em sistemas de recomendação para sugerir que os usuários de conteúdo têm maior probabilidade de assistir. A eficácia desses algoritmos é crítica para plataformas como a Netflix, pois somente se os usuários encontrarem conteúdo interessante com frequência, eles continuarão com a assinatura. A Amazon e várias outras plataformas de comércio eletrônico também dependem fortemente de algoritmos de aprendizado profundo para recomendar os produtos certos e aumentar as vendas.
Detecção de fraude
Perdas e danos relacionados a fraudes são uma triste realidade do setor financeiro. Os golpistas financeiros estão crescendo.
US$ 1,9 bilhão
foi perdido devido a roubo de identidade e fraude em 2019.
Muitas atividades fraudulentas podem ser detectadas com a ajuda de sistemas baseados em regras. Por exemplo, transações grandes ou que acontecem em locais inusitados são ótimos indicadores de fraude e podem ser facilmente detectados.
No entanto, pode haver vários comportamentos de usuário que os sistemas baseados em regras podem não identificar como suspeitos, mas os sistemas de detecção de fraude baseados em DL certamente o fariam. O poder de processamento para sistemas baseados em DL também é notável e eles também reduzem a necessidade de trabalho manual – ao contrário dos sistemas baseados em regras que exigem supervisão humana frequente e correções manuais.
Como criar e treinar modelos de aprendizado profundo
Há três maneiras comuns de treinar um modelo de aprendizado profundo para executar a classificação de objetos. Você pode treiná-lo do zero, transferir o aprendizado ou usar uma rede como um extrator de recursos. Vamos dar uma olhada rápida em cada um.
1. Treinando do zero
Para treinar redes neurais profundas do zero, você precisa adquirir grandes volumes de conjuntos de dados rotulados – por exemplo, as imagens rotuladas de cães e gatos. Depois disso, você precisa projetar uma arquitetura de rede que possa aprender as características distintas dos animais. Dependendo do volume de dados, taxa de aprendizado e poder de processamento, as redes podem levar dias ou semanas para serem treinadas.
2. Abordagem de aprendizado de transferência
A maneira mais comum de treinar redes neurais profundas é pela abordagem de aprendizagem por transferência. Nesse processo, um modelo pré-treinado é ajustado para executar uma nova tarefa. Você pode começar com uma rede existente e alimentar novos conjuntos de dados contendo classes anteriormente desconhecidas para ela.
Você pode ajustar a rede de acordo com suas necessidades, neste caso, identificando e distinguindo entre as imagens de cães e gatos. Como esse processo requer menos quantidade de dados, o tempo de computação cai significativamente.
3. Usando o extrator de recursos
Outra abordagem para treinar um modelo de aprendizado profundo é usar uma rede como um extrator de recursos. Como cada camada da rede é designada para aprender recursos específicos das imagens, você pode realmente extrair esses recursos da rede durante o processo de treinamento. Esses recursos podem ser inseridos em um modelo de aprendizado de máquina . Fazer isso pode reduzir a necessidade de enormes recursos computacionais.
Aprendizado profundo: quanto mais, melhor
Uma propriedade interessante do aprendizado profundo é que ele fica melhor se você fornecer mais dados e mais recursos computacionais. Embora os algoritmos de aprendizado profundo possam parecer muito exigentes, eles são altamente precisos e requerem menos ou nenhuma assistência humana na maioria dos casos.
O aprendizado profundo também será nossa chave para desbloquear a inteligência geral artificial, um sistema de IA capaz de pensar, aprender e agir como humanos.
Aprenda mais sobre inteligência artificial geral e veja por si mesmo se uma máquina tão inteligente seria amiga ou inimiga.
Deixe um comentário