header-logo

Comunicações de marketing orientadas por inteligência artificial

iCrowdNewswire Portuguese

Como construir o oleoduto perfeito da AI é como preparar o tiro perfeito do café expresso

Nov 14, 2017 6:48 AM ET

Construir o melhor pipeline da AI é surpreendentemente semelhante ao fabrico do tiro perfeito do café expresso. Em ambos os casos, há uma infinidade de parâmetros ajustáveis ​​que devem ser configurados antes do início do processo, que tem um enorme impacto no resultado final.

A partir da pressão da água e da moagem de um feijão espresso para a taxa de aprendizado e o número de camadas ocultas em uma rede neural, esses parâmetros de configuração podem fazer ou quebrar o seu pipeline AI ou a manhã perfeita. Existem muitos componentes análogos entre esses sistemas ajustáveis, mas, em ambos os casos, obter o melhor resultado tem historicamente sido mais arte do que ciência. Nesta publicação, discutiremos as semelhanças de ambos os processos, bem como uma maneira melhor de sintonizá-los e sistemas complexos semelhantes.

Treinar uma rede neural não é tão diferente de preparar o expresso perfeito ( ou assar o lote perfeito de cookies ). A água passa através de uma rede de feijões espresso à temperatura e pressão, absorvendo sabor e cafeína, pois transforma sutilmente os feijões e, eventualmente, produz um delicioso tiro de café expresso do outro lado. À medida que os dados passam por um pipeline de aprendizado profundo, ele transforma os pesos de seus neurônios, absorvendo informações e convergindo em um modelo que pode ser aplicado a tarefas tão variadas como o processamento de linguagem natural ou a classificação de seqüência .

A água que passa através dos grãos de café expresso é semelhante aos dados que circulam por uma rede neural à medida que são treinados. Ele passa pelo sistema para se tornar algo diferente e desejável no final, interagindo e alterando as propriedades do próprio sistema à medida que ele vai. Pode-se ajustar vários aspectos de como a água ou os dados interagem com o sistema, como a pressão e a temperatura, para afetar a absorção dos feijões de café expresso ou taxa de aprendizado e os parâmetros Stochastic Gradient Descent (SGD) em uma rede neural. Esses parâmetros ajustáveis ​​afetarão a forma como a rede de café ou os neurônios são influenciados pela água ou dados.

Além disso, os grãos de café expresso são semelhantes à arquitetura geral de um pipeline de aprendizado profundo. Uma variação do feijão espresso versus outro pode ter a mesma diferença no tiro que a decisão entre uma rede neuronal convolucional ou recorrente em uma tubulação de aprendizado profundo. A moagem dos feijões e a quantidade utilizada definem a rede sobre a qual a água passa, como os parâmetros de arquitetura em uma rede neural de camadas ocultas e número de neurônios por camada.

Assar o feijão de maneiras diferentes irá mudar como o sabor é absorvido por cada massa de feijão espresso, como a função de ativação em uma rede neural permite que os dados tenham diferentes efeitos nos neurônios individuais dentro da rede. Diferentes máquinas de café expresso têm um impacto no tiro, mesmo com parâmetros de configuração diferentes, exatamente como frameworks de aprendizado profundo como MXNet , TensorFlow e Caffe2 podem fornecer diferenças sutis no modelo treinado.

O tempo em ambos os sistemas é análogo, quanto mais você bombeia a água através da máquina, mais efeitos eles terão no tiro final (em tamanho e qualidade), de forma semelhante, quanto mais você forçando uma rede neural (o número de épocas em que você treina) terá um efeito sobre o que é aprendido, quanto ele converge e quais são os resultados.

A quantidade de grãos de café e a grostura da moagem alteram a forma como a água escolhe quantidades distintas de cafeína e sabor.
A arquitetura da rede neural, como o número de camadas ocultas e o número de neurônios por camada, altera o que é aprendido com os dados.

Uma vez que você estabeleceu uma configuração de parâmetros para tentar preparar seu café expresso ou treinou sua rede, o próximo passo é medir a saída para determinar se foi ou não um sucesso. O melhor tiro de um café expresso faz o equilíbrio perfeito entre o sabor e a cafeína, a amargura precisa estar correta. Da mesma forma, um pipeline de aprendizado profundo possui métricas específicas, às vezes concorrentes, em torno de precisão, robustez ou velocidade. Além disso, os resultados da elaboração de um café expresso podem ser pós-processados ​​em um latte, cappuccino ou americano, cada um com seus próprios parâmetros ajustáveis ​​da mesma forma que uma saída de rede neural pode ser alimentada em uma tubulação maior para aplicações como detecção de fraude ou negociação algorítmica. Encontrar a melhor configuração para esses sistemas da forma mais eficiente possível pode resultar em um desempenho impulsionado para esses modelos ou um melhor aumento da cafeína pela manhã. Todos os parâmetros interagem para influenciar a saída desejada de maneiras diferentes, muitas vezes não intuitivas.

A natureza da caixa preta desses métodos nos permite considerar o problema de fabricação de café expresso de forma idêntica ao ajuste de um pipeline da AI.

A arte de criar o melhor café expresso foi aprimorada pelos mestres desde o século XIX. Da mesma forma, as tubulações de aprendizado profundo são muitas vezes ajustadas na prática através de intuição especializada, especialmente quando a força bruta popular se aproxima, como a grade e a busca aleatória, tornam-se intratáveis ​​devido à grande quantidade de parâmetros de configuração ou à despesa de treinamento do modelo. Infelizmente, a configuração ideal dessas pipelines para diferentes aplicativos pode ser extremamente diferente em diferentes conjuntos de dados e em diferentes contextos. Assim, a abordagem de ajuste manual geralmente se resume a uma otimização de tentativas e erros, que consome muito tempo, e muitas vezes em altas dimensões, o que desperdiça recursos experientes e computacionais preciosos.

As técnicas de otimização bayesianas permitem encontrar as melhores configurações desses sistemas com o menor número possível de tentativas. Isso é feito através da pesquisa acadêmica em campos como Optimal Learning and Sequential Model-Based Optimization . Essas técnicas estimulam a exploração, aprendendo mais sobre como os parâmetros interagem e se combinam para influenciar o resultado desejado e a exploração, usando o que já sabemos para impulsionar para um melhor desempenho.

A natureza da caixa preta desses métodos nos permite considerar o problema de fabricação de café expresso de forma idêntica ao ajuste de um pipeline da AI. Os métodos de caixa preta apenas observam a entrada para um sistema (a configuração específica a ser avaliada) e a saída (o objetivo desejado ou o conjunto de objetivos a serem otimizados). Isso permite que as ferramentas de otimização da Bayesian se arrastem facilmente em cima de qualquer sistema subjacente sem requerer nenhuma informação sobre dados ou modelos proprietários. Na verdade, empresas como a MillerCoors aplicaram isso a outro tipo de cerveja .

Ao chegar às melhores configurações exponencialmente mais rápidas que as técnicas comuns, como a busca em grade, e não confiar em seres humanos para usar a intuição para fazer otimização dimensional elevada em sua cabeça, a otimização Bayesiana permite que você obtenha a melhor versão do seu modelo ou tiro perfeito para café espresso , mais rápido e mais barato do que nunca.

See Campaign: http://thenewstack.io/finding-perfect-ai-pipeline-like-brewing-perfect-shot-espresso/
Contact Information:
Scott Clark

Tags:
, Artificial Intelligence Newswire, Wire, United States, Portuguese

image


Keywords:  afds, afdsafds

Tags:  News