کتابخانه CleanLab (https://twitter.com/CleanlabAI) تنها با سه خط کد ساده ، می تواند دیتاست ماشین لرنینگ شما را تمیز کند.
برخی از قابلیت ها :
– flag outliers
– find label errors
– identify near duplicates
– perform active-learning
– find out of distribution samples
– And more …
کتابخانه پایتون CleanLab که توسط جامعه آکادمیک MIT ایجاد شده است از الگوریتم ، Confident Learning استفاده می کند.
عکس سمت راست شمایی از این الگوریتم را نشان می دهد که در اکانت توییتر Akshay 🚀 (https://twitter.com/akshay_pachaar) منتشر شده بود.
این کتابخانه با هر نوع دیتا متنی ، تصویر ، جدولی و وویس کار می کند.
همچنین وظایف ماشین لرنینگ زیر را به خوبی کاور می کند:
Classification tagging
Entity recognition
Prompting LLMs