Využili jsme služby Google AutoML Tables pro předpověď prodejnosti 🍞 chleba z Google Tabulky. Řešení jsme nasadili jako proof-of-concept do prodejny s potravinami.
Smyslem každé firmy je vytvářet a zvyšovat zisk. Toho můžete dosáhnout buď snížením nákladů nebo zvýšením výnosů. To je i příklad firmy Marama, která prodává čerstvé potraviny v pražských Dejvicích. Tento obchod potřebuje odhadnout co nejpřesnější množství objednaných potravin, aby jich nebylo příliš mnoho (tj. moc velký náklad) nebo příliš málo (tj. cena ušlých zisků). Domluvili jsme se na vytvoření prototypu řešení (Proof-of-concept), který bude predikovat prodejnost chleba na základě vstupních dat.
Z vybraných kandidátů jsme vybrali nakonec AutoML Tables, mezi hlavní výhody patří rychlost nasazení, dostupná platforma pro provoz, možnost exportu modelu pro offline použití a v neposlední řadě dobré výsledky výstupů. Mezi další zvažované technologie patřil model v Tensorflow běžící na platformě Cloud ML, využití ML funkcí v BigQuery a Tensorflow.js pro provoz ve webovém prohlížeči.
Co je AutoML?
AutoML (Automated machine learning) byl představen Googlem na květnové konferenci Google I/O v roce 2017. Sundar Pichai během keynote představil nový přístup při budování modelů strojového učení. Mezi hlavní problémy zařadil složitost strojového učení, z něhož těží jen lidé s Ph.D. v dané oblasti. Cílem je tak tuto doménu demokratizovat (tzv. demokratizace AI), aby byla přístupná pro kohokoliv. A jednou z cest je právě AutoML.
Tato technika využívá strojové učení pro učení modelů strojového učení. Ve zkratce to znamená, že při budování hlubokých neuronových sítích definuje datový vědec (data scientist) parametry a podle výstupu je ladí (velikost a hloubku neuronové sítě, typ sítě, případně vstupní parametry, tzv. hyperparametry). Pomocí techniky posilovaného učení (reinforcement learning) se zvolí několik modelů s různými parametry a z nichž se vybere ten s nejlepší hodnotou.
Dle statistiky hledání vidíme první nárůst v 05/2017.
Pojem AutoML zařadila konzultantská firma Gartner do své Hype Cycle. Tento pojem se v roce 2019 ocitl na samém vrcholu toho, co od technologie očekáváme.
Služba Google Cloud AutoML Tables
Aby to neskončilo jen u oznámené techniky na keynote, tak Google vytvořil z AutoML sérii několika služeb do Google Cloud platformy. Můžete tak pracovat s obrázky, video soubory, texty nebo strukturovanými daty.
My jsme od Google Cloud AutoML očekávali rychlé a kvalitní výsledky v přijatelné podobě workflow. Náš model predikuje počet prodaných chlebů ze Mšena. Dostali jsme data o prodejích (počty kusů) za poslední 3 roky. K datům jsme přidali další údaje o datech, teplotě atd. Celkem jsme naplnili model cca 20 doplňkovými údaji. Data byla očištěna a upravena v Google Tabulce. Pokročilejší operace nad daty byly vyřešeny v Google Apps Script.
Poté jsme nahráli data do služby Google Cloud Storage odkud jsme poslali na Google Cloud AutoML. Nejdříve je potřeba natrénovat model, který trval zhruba hodinu. Model sám vyhodnotil, které vstupní parametry bere jako důležitější a které lze odstranit, protože nemají na předpovědi vliv. Pomocí zmíněné technologie Google Apps Script jsem vytvořili rozšíření do Google Tabulky, které načítá data z Google Tabulky, udělá deploy model v AutoML, udělá odhady prodejů podle dní a výsledky uloží do Google Tabulky. Na prodejně Marama mají nasdílenou Google Tabulku a můžou s daty pracovat ihned, bez nutnosti využívat naprogramovanou aplikaci. Natrénovaný model měl při testování chybovost zhruba 2 chleby a nyní testujeme v reálném prostředí.
Pokud Vás tento přístup zaujal a chcete také pomoct vytvořit Proof-of-concept řešení nad Google Cloud, napište nám na ahoj@appsatori.eu a rádi se s Vámi potkáme!
Commentaires