Todos os cursos > Tecnologia, Informática e Programação > Inteligência Artificial e Ciência de Dados ::

Construindo Redes Neurais com Keras e TensorFlow: Compilação e treinamento de modelos de deep learning

Capítulo 75

Tempo estimado de leitura: 5 minutos

+ Exercício

Ouça em áudio

0:00 / 0:00

20.8 Construindo Redes Neurais com Keras e TensorFlow: Compilação e Treinamento de Modelos de Deep Learning

O avanço da inteligência artificial nos últimos anos foi impulsionado significativamente pelo desenvolvimento de redes neurais profundas (deep learning). Python se consolidou como a linguagem de programação líder para a construção e treinamento desses modelos, graças a bibliotecas como Keras e TensorFlow. Neste capítulo, exploraremos o processo de compilação e treinamento de modelos de deep learning usando essas poderosas ferramentas.

Introdução ao Keras e TensorFlow

Keras é uma API de alto nível para construir e treinar redes neurais, que roda em cima de frameworks de baixo nível como TensorFlow, Theano ou CNTK. TensorFlow, por sua vez, é uma biblioteca de código aberto para computação numérica e aprendizado de máquina desenvolvida pelo Google Brain Team.

A combinação de Keras e TensorFlow oferece uma plataforma poderosa e flexível para a construção de modelos de deep learning, permitindo que os desenvolvedores criem redes neurais complexas com mais facilidade e rapidez.

Construindo uma Rede Neural com Keras

Para construir uma rede neural em Keras, começamos definindo a arquitetura do modelo. Isso envolve especificar o número de camadas, o número de neurônios em cada camada e as funções de ativação a serem usadas. O Keras oferece duas maneiras de definir um modelo: usando a API Sequential para redes com uma sequência linear de camadas, ou a API Functional para arquiteturas mais complexas e flexíveis.


from keras.models import Sequential
from keras.layers import Dense

# Inicializando o modelo Sequential
model = Sequential()

# Adicionando a camada de entrada e a primeira camada oculta
model.add(Dense(units=64, activation='relu', input_shape=(input_size,)))

# Adicionando a camada de saída
model.add(Dense(units=num_classes, activation='softmax'))

Compilação do Modelo

Após definir a arquitetura do modelo, o próximo passo é compilar o modelo. A compilação é o processo em que o modelo é configurado para o treinamento. Aqui, especificamos a função de perda (loss function), o otimizador e as métricas que desejamos acompanhar durante o treinamento.

Continue em nosso aplicativo e ...

Ouça o áudio com a tela desligada
Ganhe Certificado após a conclusão
+ de 5000 cursos para você explorar!

ou continue lendo abaixo...

Baixar o aplicativo


model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

A função de perda determina como o modelo medirá seu desempenho nos dados de treinamento. O otimizador é o algoritmo que atualizará os pesos da rede durante o treinamento. A métrica 'accuracy' é comumente usada para problemas de classificação.

Treinamento do Modelo

O treinamento de uma rede neural envolve a alimentação do modelo com os dados de entrada e deixá-lo ajustar seus pesos para minimizar a função de perda. No Keras, isso é feito através do método fit.


history = model.fit(x_train, y_train,
                    batch_size=32,
                    epochs=10,
                    validation_data=(x_val, y_val))

O método fit recebe os dados de treinamento (x_train, y_train), o tamanho do lote (batch_size), o número de épocas (epochs) e opcionalmente, dados de validação. Uma época é uma iteração sobre o conjunto de dados completo. O histórico de treinamento, retornado pelo método fit, contém informações sobre a função de perda e as métricas de desempenho ao longo das épocas.

Avaliação e Predição

Após o treinamento, avaliamos o desempenho do modelo nos dados de teste.


loss, accuracy = model.evaluate(x_test, y_test)
print(f'Test accuracy: {accuracy}')

Para fazer previsões com o modelo treinado, usamos o método predict.


predictions = model.predict(x_test)

Ajuste Fino e Regularização

Para melhorar o desempenho do modelo, podemos fazer ajustes finos em sua arquitetura ou parâmetros de treinamento. A regularização, como a Dropout e a regularização L1/L2, pode ser adicionada para prevenir o overfitting, que ocorre quando o modelo se ajusta demais aos dados de treinamento e não generaliza bem para novos dados.


from keras.layers import Dropout
from keras import regularizers

# Adicionando Dropout e regularização L2 à camada oculta
model.add(Dense(64, activation='relu', kernel_regularizer=regularizers.l2(0.01)))
model.add(Dropout(0.5))

Otimização de Hiperparâmetros

A escolha dos hiperparâmetros, como a taxa de aprendizado do otimizador e o tamanho do lote, pode ter um grande impacto no treinamento e desempenho do modelo. O uso de técnicas de otimização de hiperparâmetros, como pesquisa em grade (grid search) ou pesquisa aleatória (random search), pode ajudar a encontrar a melhor configuração.

Conclusão

Construir e treinar modelos de deep learning com Keras e TensorFlow é um processo iterativo que envolve a definição da arquitetura do modelo, compilação, treinamento, avaliação e otimização. Ao dominar essas etapas, os desenvolvedores podem criar redes neurais poderosas capazes de resolver uma ampla gama de problemas complexos de aprendizado de máquina.

Com a prática e a experiência, você pode ajustar e melhorar seus modelos para alcançar um desempenho ainda maior. O poder do Keras e TensorFlow reside em sua flexibilidade e facilidade de uso, tornando o deep learning acessível a um público mais amplo.

Agora responda o exercício sobre o conteúdo:

Qual das seguintes afirmações sobre a construção e treinamento de modelos de deep learning com Keras e TensorFlow é correta?

Você acertou! Parabéns, agora siga para a próxima página

Você errou! Tente novamente.

A função de perda 'categorical_crossentropy' e o otimizador 'adam' são amplamente usados em modelos de classificação com Keras, conforme mencionado na seção de compilação do modelo. Esses são comumente escolhidos devido à sua eficácia e facilidade de uso em diversas aplicações.