Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega’s regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package!

In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit ‘legoblokjes’ die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer ‘fairness’ toe te voegen in een model.

Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken.

Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. 🙂

 

Bio’s

Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam.

 

Vincent is een Research Advocate bij Rasa waar hij bijdraagt aan de technologie die chatbots toegankelijk maakt (onder andere bij N26 en Albert Heijn). Hij is een groot voorstander van gezond verstand en een bekend tegenstander van hype in data science.

 

Shownotes

scikit-lego op github: https://github.com/koaning/scikit-lego

xcellerated (hier werkt Matthijs): https://www.xccelerated.io/

rasa (hier werkt Vincent: https://rasa.com/

pydata amsterdam meetup: https://www.meetup.com/PyData-NL/

pydata amsterdam newsletter: https://tinyletter.com/PyDataAmsterdam

pepy.tech: https://pepy.tech/project/scikit-lego