Server streicheln in der Cloud -- Skalieren einer Machine-Learning-Anwendung (glt19)

30:24
 
Share
 

Manage episode 232231351 series 1910928
By CCC media team. Discovered by Player FM and our community — copyright is owned by the publisher, not Player FM, and audio is streamed directly from their servers. Hit the Subscribe button to track updates in Player FM, or paste the feed URL into other podcast apps.
Als Vorteil von Cloud-Anwendungen wird gerne die grenzenlose Skalierbarkeit angeführt. Um eine größere (Machine-Learning)-Anwendung im Produktivbetrieb am Laufen zu halten, braucht es aber mehr als der typische Werbeslogan verspricht. Bongfish betreibt für seine Spiele eine große Machine-Learning-Anwendung in der Azure-Cloud. In diesem Vortrag zeigen wir, aus welchen Bestandteilen unser System besteht, um die Anwendung zu überwachen und welche Fallstricke uns das Leben schwer gemacht haben. Unter anderem: * Terraform, um die verschiedenen Environments aufzusetzen * ELK-Stack als zentraler Logging-Server und warum wir UDP als Protokoll verwenden * Hot- und Cold-Deployment mit Jenkins, Packer, Cloudinit und Azure Scale Sets * PostgreSQL-Datenbank und Monitoring mit pgwatch2 * Fallstricke: versteckte Limits, Fehlerhandling, Multi-Region about this event: https://pretalx.linuxtage.at/glt19/talk/NGF3QX

6916 episodes