DTL017 – Fraude detectie – de use cases en algoritmes

Wist je dat Fraude gevallen de Nederlandse maatschappij ongeveer 10x meer geld kosten dan het fileprobleem? Wist je dat Fraude voorkomt in alle branches van retail tot verzekeringen, van telecom  bedrijven tot de overheid? De Dataloog spreekt met Richard Bakker van Future Facts over diverse use cases van fraude detectie.

We leren tijdens deze uitzending niet alleen hoe je fraude gevallen moet detecteren met algoritmes maar we hebben ook heel veel geleerd over hoe je zelf fraude kunt plegen. Mooie verhalen horen we over spookfacturen, frauduleuze claims bij verzekeringen, regel verval in supermarkten en het oplichten van overheden. Genoeg informatie om een zakcentje bij te verdienen.

Ook horen we welke algoritmes werken en niet werken. Waarom verzekeringen liever wel uitkeren dan vals alarm hebben en wat STP is.

Trouwens, hoe vind je in je data gelabelde fraude cases? Want nu zijn zowel de niet fraude als wel fraude cases niet gelabeld immers we weten het niet zeker. En kijk je naar echte features of naar het sentiment in de teksten ingevuld in de vrije velden?

Kortom een spannende uitzending over alles wat met fraude te maken heeft en de hoop dat Data Science dit grote maatschappelijke probleem kan oplossen.

 

OVER RICHARD BAKKER

Richard is Senior Consultant Business Analytics. Hij is toegepast wiskundige afkomstig van de universiteit Eindhoven. Zijn expertise ligt in het toepassen van datagedreven oplossingen binnen het vakgebied van Risk Management en Finance. Naast zijn consultancywerkzaamheden houdt Richard zich bezig met het ontwikkelen van nieuwe diensten, zoals fraudedetectie- en forecasting modellen.

 

Shownotes

Minder supermarkten want Picnic gaat het winnen

Aanklacht leden cSuite ING vanwege fraude zaak

https://nos.nl/artikel/2275675-medewerker-rijkswaterstaat-verdacht-van-grootschalige-fraude.html

Master data sheet

En dan nep facturen

Amsterdam 4e stad te wereld op tech in de wereld

 

 

UWV case vakantie fotos facebook fotos

https://www.facebook.com/UWVnl/photos/ga-je-langer-met-vakantie-dan-dat-je-vakantiedagen-hebt-dit-kalenderjaar-houd-er/1957338647846651/

https://www.facebook.com/UWVnl/photos/a.1711554465758405/1977378355842680/?type=3

 

Woordkeuze analyse?

Ensemble stacking  en High precision modellen -> Even uitleggen:

  • Je neemt diverse modellen die je op high precision traint of iets wel/niet een fraude case is. high precision wil zeggen dat ze op zeer nauwkeurig en alleen op bepaalde labels een TRUE geven.
  • Als één van de diverse algoritmes die je in je ensemble learning gebruikt een TRUE geeft beschouw je de voorspelling als TRUE

 

 

 

https://medium.com/@rrfd/boosting-bagging-and-stacking-ensemble-methods-with-sklearn-and-mlens-a455c0c982de

https://blog.statsbot.co/ensemble-learning-d1dcd548e936

 

www.analytics-magazine.org/networks-vs-fraud-connecting-the-dots

media markt kassière fraude https://m.omroepwest.nl/nieuws/3581353