Artwork

Content provided by François Paupier. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by François Paupier or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.
Player FM - Podcast App
Go offline with the Player FM app!

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

38:30
 
Share
 

Manage episode 313269702 series 3264488
Content provided by François Paupier. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by François Paupier or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997. Wikipedia

  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.

  • Un exemple d'usage de la Differential Privacy chez Google; Les Community Mobility Reports, pour une vision de l'impact du covid sur la mobilité des personnes https://www.google.com/covid19/mobility/

  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145

  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL

Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privac
  continue reading

Chapters

2. Chemin parcourir depuis le k-anonymat (00:02:00)

3. Confidentialité différentielle ~ L'intuition (00:06:50)

4. Pile ou face? ~ La Randomized Response (00:10:09)

Chapter image

5. Les 3 Raisons d'utiliser la Differential Privacy (00:14:17)

Chapter image

6. Zoom sur une application en prod à Google (00:19:15)

Chapter image

7. La Differential Privacy, vraiment incrackable? (00:22:56)

8. Côté CI, comment tester de l'aléatoire? (00:27:04)

9. Une librairie à recommander? (00:29:35)

10. Les challenges à l'adoption (00:33:21)

11. Le mot de la fin (00:37:33)

26 episodes

Artwork
iconShare
 
Manage episode 313269702 series 3264488
Content provided by François Paupier. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by François Paupier or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs?

Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Senior Software Engineer, Privacy pour Google nous parle de Differential Privacy (confidentialité différentielle).

Avec des centaines de millions d'utilisateurs actifs chaque jour, les géants du numérique bénéficient de données précises d'utilisation. Au-delà de l'amélioration de l'expérience utilisateur, ces données, une fois agrégées, peuvent contribuer à adresser des problèmes de santé publique.

Après un bref historique des techniques d'anonymisations (02'00"), on définit la confidentialité différentielle et ses propriétés (06'50") avant de revenir sur un cas d'usage au sein de Google (20'18") pour enfin discuter des implémentations existantes (27'58") et des challenges à l'adoption de cette technique (34'13").

Sur Apple Podcast, vous devriez avoir accès aux chapitres avec les liens et illustrations. L'illustration de la Randomized Response devrait être utile!

Toutes les illustrations sont disponibles sur le blog post qui accompagne l'épisode sur le Medium du Post Mortem Podcast https://medium.com/the-post-mortem-podcast

Ressources

  • Latanya Sweeney et la ré-identification des données médicales du gouverneur du Massachusetts, William Weld en 1997. Wikipedia

  • Le blog de Damien sur la Differential Privacy, c'est très visuel et de nombreux articles sont accessibles au grand public https://desfontain.es/privacy/differential-privacy-awesomeness.html (~10mins de lecture). Une version html de sa thèse Lowering the cost of anonymisation est également disponible sur son site. Les chapitres légers en maths sont indiqués par une fleur ✿.

  • Un exemple d'usage de la Differential Privacy chez Google; Les Community Mobility Reports, pour une vision de l'impact du covid sur la mobilité des personnes https://www.google.com/covid19/mobility/

  • Description du processus d'anonymisation pour les Google Community Reports "Google COVID-19 Community Mobility Reports: Anonymization Process Description", https://arxiv.org/abs/2004.04145

  • Le papier "Differentially Private SQL with Bounded User Contribution", https://arxiv.org/abs/1909.01917 publié par Damien et son équipe pour faciliter l'utilisation de la Differential Privacy par les analystes en étendant les capacités de SQL

Fun Facts

  • The Fundamental Law of Information Recovery, Cynthia DWork: "“Overly accurate” estimates of “too many” statistics is blatantly non-private" extrait du livre “The Algorithmic Foundations of Differential Privac
  continue reading

Chapters

2. Chemin parcourir depuis le k-anonymat (00:02:00)

3. Confidentialité différentielle ~ L'intuition (00:06:50)

4. Pile ou face? ~ La Randomized Response (00:10:09)

Chapter image

5. Les 3 Raisons d'utiliser la Differential Privacy (00:14:17)

Chapter image

6. Zoom sur une application en prod à Google (00:19:15)

Chapter image

7. La Differential Privacy, vraiment incrackable? (00:22:56)

8. Côté CI, comment tester de l'aléatoire? (00:27:04)

9. Une librairie à recommander? (00:29:35)

10. Les challenges à l'adoption (00:33:21)

11. Le mot de la fin (00:37:33)

26 episodes

All episodes

×
 
Loading …

Welcome to Player FM!

Player FM is scanning the web for high-quality podcasts for you to enjoy right now. It's the best podcast app and works on Android, iPhone, and the web. Signup to sync subscriptions across devices.

 

Quick Reference Guide